Прочитала в Зоопарке, что Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. Решила глянуть, кто в топе по философии (спойлер: наших нет ). Оформила в табличку, ищите друзей и знакомых!
@curiousonya, тебе там кое-что может понравиться 🏃♀️🎶
P.S. не спрашивайте меня, как хайдеггер попал в чехи, мне кажется ему с жижеком должно быть нескучно
P.S.S. и как фуко попал в великобританцы тоже не спрашивайте🤷♀️ это наукометрия им виднее
@curiousonya, тебе там кое-что может понравиться 🏃♀️🎶
P.S. не спрашивайте меня, как хайдеггер попал в чехи, мне кажется ему с жижеком должно быть нескучно
P.S.S. и как фуко попал в великобританцы тоже не спрашивайте
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Зоопарк из слоновой кости
#обозревая_происходящее
Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. С радостью видим там многих хороших ученых-соотечественников (@ArtemROganov, @ananikovlab, @khokhlovAR и других).
А еще читаем у УрФУ:…
Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. С радостью видим там многих хороших ученых-соотечественников (@ArtemROganov, @ananikovlab, @khokhlovAR и других).
А еще читаем у УрФУ:…
🎉9❤5
RAntiquity
Прочитала в Зоопарке, что Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. Решила глянуть, кто в топе по философии (спойлер: наших нет ). Оформила в табличку, ищите друзей и знакомых! @curiousonya, тебе там кое-что…
Ну и классики пусть тоже будут в отдельной табличке. Их гораздо меньше, всего 75. И снова нет наших.
🏆6❤1
RAntiquity
Прочитала в Зоопарке, что Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. Решила глянуть, кто в топе по философии (спойлер: наших нет ). Оформила в табличку, ищите друзей и знакомых! @curiousonya, тебе там кое-что…
Простите, посмотрела на географическое распределение философов и вспомнила прекрасное.
(добавим на эту карту соединенные штатыфилософии .)
Индийское море славилось тайфуном, Вязьма -- пряниками, Пампасы -- лесами, Льяносы -- степями, Венеция -- каналами, Китай -- уважением к предкам.
Все славилось!
Хорошая славушка дома сидит, а худая по свету бежит -- и даже Пинские болота славились лихорадками.
(добавим на эту карту соединенные штаты
😁11❤6
На днях доделала сайт с упражнениями к Цезарю, о чем писала на дружественном канале. Сайт сделан полностью в Quarto c использованием пакета webexercises.
Из интересного: экспорт упражнений в pdf выглядит вполне прилично без дополнительного шаманства с LaTex. Единственное, что я сделала, — это убрала нумерацию страниц через yaml (чтобы потом склеить отдельные страницы в один файл):
Кривыми при экспорте мне показались только вопросы
По содержанию.
- Первые несколько упражнений я делала на основе правил: сначала лемматизировала текст моделью EvaLatin, потом заменяла по условию некоторые формы на функцию
- Потом еще несколько упражнений я писала хитроумные промты для GPT со множеством примеров, которые начинались словами “You are a professor of Latin who reads Caesar with your Classics students….” Это оказалось тоже очень трудоемко: приходилось объяснять, как правильно сокращаются формы глагола, что в некоторых глагольных формах два слова, что если ты просишь поставить в нужный падеж существительное, неплохо бы спрятать тот же падеж у прилагательного… И еще кучу, казалось бы, очевидных вещей.
- Это меня так утомило, что последние несколько упражнений я сделала сама, благо там из всего
В целом, опыт интересный. Не знаю, принесут ли кому-нибудь пользу эти упражнения, но я эти 18 параграфов Цезаря, пока делала, выучила почти наизусть.
Из интересного: экспорт упражнений в pdf выглядит вполне прилично без дополнительного шаманства с LaTex. Единственное, что я сделала, — это убрала нумерацию страниц через yaml (чтобы потом склеить отдельные страницы в один файл):
pdf:
toc: false
include-in-header:
text: |
\pagenumbering{gobble}
Кривыми при экспорте мне показались только вопросы
mcq(); наверное, форматирование списков тоже можно было докрутить через LaTex, но я не большой любитель лежать под капотом, поэтому просто в последний момент придумала штуку, как их заменить на fitb().По содержанию.
- Первые несколько упражнений я делала на основе правил: сначала лемматизировала текст моделью EvaLatin, потом заменяла по условию некоторые формы на функцию
fitb() с правильным ответом и склеивала результат обратно в связный текст. Это оказалось трудоемко и не очень интересно. - Потом еще несколько упражнений я писала хитроумные промты для GPT со множеством примеров, которые начинались словами “You are a professor of Latin who reads Caesar with your Classics students….” Это оказалось тоже очень трудоемко: приходилось объяснять, как правильно сокращаются формы глагола, что в некоторых глагольных формах два слова, что если ты просишь поставить в нужный падеж существительное, неплохо бы спрятать тот же падеж у прилагательного… И еще кучу, казалось бы, очевидных вещей.
- Это меня так утомило, что последние несколько упражнений я сделала сама, благо там из всего
webexercises нужна, по сути, одна функция. В целом, опыт интересный. Не знаю, принесут ли кому-нибудь пользу эти упражнения, но я эти 18 параграфов Цезаря, пока делала, выучила почти наизусть.
Telegram
Antibarbari HSE
📖 Старшая группа антиварваров завершила чтения первой книги «Записок о Галльской войне» Цезаря #caesar
🖋Делать комментарий к этому тексту мы не стали, потому что превзойти Соболевского все равно невозможно — зато подготовили небольшой сборник упражнений…
🖋Делать комментарий к этому тексту мы не стали, потому что превзойти Соболевского все равно невозможно — зато подготовили небольшой сборник упражнений…
🔥15🙏9❤7❤🔥1👎1
Коллеги обратили внимание на вышедший недавно сразу на двух языках сборник:
Я заглянула больше из любопытства: как они будут вычислять, что 3 = 1? Но оказалось, что теологии там как таковой нет, есть стандартный набор DH-методов: цифровые издания, анализ эмоциональной тональности (?!), тематическое моделирование, сетевой анализ…
Мое внимание сразу же привлекла глава под названием «Python or R? Getting Started with Programming for Humanists». Ну что могу сказать.
Фраза «was built for statistics» создает впечатление, что R так и остался узкоспециализированным инструментом, что уже давно не соответствует действительности.
Автор создает впечатление, что Plotly — это исключительно преимущество Python, что не соответствует действительности. С Plotly можно полноценно работать в R.
Это утверждение тоже серьезно устарело. Оно основано на ситуации пяти- семилетней давности. Пакет
Надеюсь, богословствуют они лучше. Хотя после Великой схизмы уверенности нет.
Nunn, Christopher A. und van Oorschot, Frederike (Hrsg.): Compendium Computational Theology, Bd. 1: Introducing Digital Humanities to Theology, Heidelberg: heiBOOKS, 2024. https://doi.org/10.11588/heibooks.1521
Nunn, Christopher A. und van Oorschot, Frederike (Hrsg.): Kompendium Computational Theology, Bd. 1: Forschungspraktiken in den Digital Humanities, Heidelberg: heiBOOKS, 2024. https://doi.org/10.11588/heibooks.1459
Я заглянула больше из любопытства: как они будут вычислять, что 3 = 1? Но оказалось, что теологии там как таковой нет, есть стандартный набор DH-методов: цифровые издания, анализ эмоциональной тональности (?!), тематическое моделирование, сетевой анализ…
Мое внимание сразу же привлекла глава под названием «Python or R? Getting Started with Programming for Humanists». Ну что могу сказать.
R, on the other hand, was built for statistics. It has several advantages over Python. First, R’s syntax and functionality are tailored for statistical modeling, allowing for complex analyses with concise code.
Фраза «was built for statistics» создает впечатление, что R так и остался узкоспециализированным инструментом, что уже давно не соответствует действительности.
Second, R provides an extensive collection of packages like ggplot2 (Wickham 2016) and Shiny that enable high-quality data visualization and interactive web applications. While Python boasts of good visualization libraries like Plotly and Seaborn (Waskom et al. 2017), the visualizations in R are easier to produce, tend to look nicer, and are easier to customize.
Автор создает впечатление, что Plotly — это исключительно преимущество Python, что не соответствует действительности. С Plotly можно полноценно работать в R.
Third, R’s integration with various data sources and its data manipulation capabilities through packages like dplyr make it a powerful tool for data wrangling. Fourth, although R’s machine learning capabilities may not be as extensive as Python’s, packages like caret and randomForest still provide robust tools for machine learning.
Это утверждение тоже серьезно устарело. Оно основано на ситуации пяти- семилетней давности. Пакет
caret сейчас в основном поддерживается в режиме «обслуживания». Его современная замена — это мета-фреймворк tidymodels, который предоставляет унифицированный, современный и строгий интерфейс для сотен моделей машинного обучения в R, полностью интегрированный в tidyverse.Надеюсь, богословствуют они лучше. Хотя после Великой схизмы уверенности нет.
❤15🔥9❤🔥4👍2😁2
Forwarded from Antibarbari HSE (Olga Alieva)
Как говорить по-древнегречески о котиках, маркитантках и карантине? Узнали сегодня из лекции Льва Шадрина о дневниках Карла Бенедикта Хазе.
Свидетель «времен очаковских» и наставник Наполеона III, византинист, по личному распоряжению графа Николая Румянцева издавший Льва Диакона, бонвиван и немножко фальсификатор, Хазе описывает на аттическом наречии Париж начала XIX в., в котором золотая молодежь буянит в кабаках, женщины переодеваются в атласные штаны, а котик Портной, разбив кувшин, получает четверть курочки.
Удивительный документ эпохи благодаря проекту LAGOOS и новейшим цифровым инструментам возвращает к жизни целую эпоху. Смотрите новое видео в рубрике #antibarbari_colloquia
Свидетель «времен очаковских» и наставник Наполеона III, византинист, по личному распоряжению графа Николая Румянцева издавший Льва Диакона, бонвиван и немножко фальсификатор, Хазе описывает на аттическом наречии Париж начала XIX в., в котором золотая молодежь буянит в кабаках, женщины переодеваются в атласные штаны, а котик Портной, разбив кувшин, получает четверть курочки.
Удивительный документ эпохи благодаря проекту LAGOOS и новейшим цифровым инструментам возвращает к жизни целую эпоху. Смотрите новое видео в рубрике #antibarbari_colloquia
❤10🔥2
Интересное: история понятий + средние века + text mining https://t.iss.one/DHRIsfu/879
Telegram
Гуманитарии в цифре
🙂 История понятий — особое научное направление, возникшее в 60-70-е гг. ХХ века. Ученые традиционно изучают контекст и смысловые сдвиги, но что происходит, когда к решению исследовательских задач подключаются методы анализа больших данных?
Обсудим на очередном…
Обсудим на очередном…
👍12
Потратила некоторое время, чтобы разобраться с настройками автоматической проверки кода на R в GitHub Classroom. Вот тут подробная инструкция: https://teletype.in/@locusclassicus/autograding-github-classroom-r
Особенности:
- поначалу можно сломать голову, но дальше проще;
- нет (пока не вижу) возможности оценивать не по бинарной шкале (passed / failed), а более нюансированно;
- на бесплатном плане придется сделать видимыми студенческие репозитории из-за ограничений Actions;
- под каждое задание надо создавать отдельную пару репозиториев (шаблон + тесты)
Пока ощущение такое, что для преподавателя намного проще скачивать полностью все репозитории и проверять с GradeR. Однако студентам было бы полезнее заранее видеть результат тестов, поэтому буду еще думать.
Если у кого-то есть опыт решения этой проблемы малой кровью, буду рада услышать. #gradeR
Особенности:
- поначалу можно сломать голову, но дальше проще;
- нет (пока не вижу) возможности оценивать не по бинарной шкале (passed / failed), а более нюансированно;
- на бесплатном плане придется сделать видимыми студенческие репозитории из-за ограничений Actions;
- под каждое задание надо создавать отдельную пару репозиториев (шаблон + тесты)
Пока ощущение такое, что для преподавателя намного проще скачивать полностью все репозитории и проверять с GradeR. Однако студентам было бы полезнее заранее видеть результат тестов, поэтому буду еще думать.
Если у кого-то есть опыт решения этой проблемы малой кровью, буду рада услышать. #gradeR
Teletype
Автоматическая проверка заданий на языке R в GitHub Classroom
1.1. Тесты не должны быть видны студентам, поэтому создаем в организации GitHub приватный репозиторий с заданиями, например...
🔥5❤🔥4👍2
У коллег из ИТМО завтра интересный движ про гуманность, гуманизм и гуманитарность, в связи с чем я вдруг призадумалась, как для себя соотношу все эти понятия.
Наверное, так (но это во мне говорит переводчик Йегера):
- гуманность – это качества, подобающие человеку, Bild или Form;
- гуманизм – институты (в широком смысле) воспитания и культуры, которые эти качества поддерживают (Bildung или Formation);
- гуманитарные науки — то, что поддерживает сам гуманизм, типа монашества в Церкви (все не могут так жить, но кто-то обязательно должен).
При этом разлепить второе и третье я могу только концептуально, не на практике.
Наверное, так (но это во мне говорит переводчик Йегера):
- гуманность – это качества, подобающие человеку, Bild или Form;
- гуманизм – институты (в широком смысле) воспитания и культуры, которые эти качества поддерживают (Bildung или Formation);
- гуманитарные науки — то, что поддерживает сам гуманизм, типа монашества в Церкви (все не могут так жить, но кто-то обязательно должен).
При этом разлепить второе и третье я могу только концептуально, не на практике.
Telegram
провода+болота
про гуманность, гуманизм и гуманитарность корпораций
22 октября в 18.30 мы будем говорить про гуманитарную миссию и социальную ответственность корпораций. компания подходящая — люди, принимающие решения в Сбере, Яндексе и Т-Банке. компания такая:
- Альберт…
22 октября в 18.30 мы будем говорить про гуманитарную миссию и социальную ответственность корпораций. компания подходящая — люди, принимающие решения в Сбере, Яндексе и Т-Банке. компания такая:
- Альберт…
❤15🔥5👏4
🔹 Из урока по табличным данным после некоторых колебаний все же полностью убрала датафреймы, как советовал еще в прошлом году Георгий Мороз. Сразу бескомпромиссный
tidyverse во всем! 🔹 Существенно переработала урок по итерациям и функциям, уделив особое внимание теме таинственного аргумента «три точки». Три точки — это сила!
🔹 Разбила на два урока единую тему структурированных данных; теперь JSON отдельно, XML отдельно. Каждый блок существенно расширила, в JSON добавила примеры запросов по API (но эту часть еще надо будет допиливать, там остались мелкие косяки).
🔹 После колебаний все же полностью перешла с пакета XML на xml2. Долго не понимала, зачем (потому что училась по этой книге), но наконец оценила его достоинства: все векторизовано, никаких
sapply() и прочих сложных обходов дерева узлов. Опрятно, что и говорить. Буду дальше пользоваться. 🔹 Добавилось новое домашнее задание по мотивам проекта Tolstoy Digital! Огромное спасибо Анастасии Бонч-Осмоловской и Борису Орехову за помощь.
🔹 Экспериментировала с разными методами OCR, очень полезно, о практических результатах расскажут чуть позже коллеги отдельным постом (мы дообучили модель Tesseract!) Основная сложность для студентов пока — дообучение сложно запускать на Windows, а в облаке Posit нет прав для использования команды sudo. Все равно сделали много!
🔹 За техническую поддержку благодарю еще раз Александру Горшенину, за материал для распознавания— Анастасию Богданову, за проверку эталонных данных — Анастасию Богданову и Анастасию Орлову, за подготовку эталонных данных — студентов ОП «Компаративистика», за помощь с проверкой дз — Дарью Галкину, Владу Гурьеву и снова Настю Орлову. Скоро, надеюсь, сможем рассказать больше.
🔹В планах — переработать и остальные уроки; учесть вышедшие за прошедшие месяцы обновления (следить за ними ОЧЕНЬ помогает канал «Наука и данные» @naukaidannye ) и кое-что переделать, а также добавить несколько новых тем.
Ухожу на короткие каникулы — но не отдыхать, а писать очередную заявку, статью и курс лекций.
Please open Telegram to view this post
VIEW IN TELEGRAM
locusclassicus.github.io
Компьютерный анализ текста
❤25❤🔥11🥰8👍4🔥4
RAntiquity
Коллеги обратили внимание на вышедший недавно сразу на двух языках сборник: Nunn, Christopher A. und van Oorschot, Frederike (Hrsg.): Compendium Computational Theology, Bd. 1: Introducing Digital Humanities to Theology, Heidelberg: heiBOOKS, 2024. https:…
Стоило пошутить по поводу возможности применения количественных методов в теологии, как на отзыв прилетела диссертация по теологии… с применением количественных методов. Очень, между прочим, интересная, чуть позже напишу подробнее. В итоге что? Сижу в ночи лемматизирую Оригена. Осторожнее надо шутить, осторожнее 😇
🔥13💋13💅3👻1
RAntiquity
Потратила некоторое время, чтобы разобраться с настройками автоматической проверки кода на R в GitHub Classroom. Вот тут подробная инструкция: https://teletype.in/@locusclassicus/autograding-github-classroom-r Особенности: - поначалу можно сломать голову…
Охота пуще неволи: один раз решишь, что надо настроить автопроверку, и потом все — как babulenka в “Игроке” Достоевского, начала играть, так уж не остановишь. Столько времени потрачено на эту затею, и так хочется “отыграться” (спойлер: все получилось ). И перед мысленным взором носятся образы разных героев, непременно рационализаторов и сторонников прогресса. Поэтому мои входящие за эту ночь выглядят так.
Правда, в отличие от “бабуленьки”, я кое-какую пользу из этого извлекла, все настроила, все постиглаи теперь чувствую себя как Фауст. #gradeR
Правда, в отличие от “бабуленьки”, я кое-какую пользу из этого извлекла, все настроила, все постигла
❤21😁3
Сегодня у меня день рождения, и я решила для разнообразия поделать что-то для души. Посчитать, например, сколько раз упоминается мистер Дарси и Элизабет в главах “Гордости и предубеждения” (спасибо Джулии Силги за пакет janeaustenr). И в очередной раз убедилась, что симметрия — признак мастерства 🐾
аналитика in touch with feminine side
аналитика in touch with feminine side
Please open Telegram to view this post
VIEW IN TELEGRAM
❤61😁2
Forwarded from Библиотека Парвуса 📕
Молчала, писала (в том числе код 🤯 на языке R), формулировала и, наконец, с анонсом — мы с «Искрой» преодолели первое «цифровое» испытание — автоматизацию распознавания текста газеты.
Под чутким руководством и с огромной поддержкой моего научного руководителя @locusclassicus подготовлена модель распознавания дореформенной русской орфографии (на материале «Искры»). Теперь эта модель опубликована в открытом репозитории — вместе с описанием, кодом и метриками.
Публикация материалов на GitHub позволит независимо проверить полученные результаты, использовать модель как отправную точку для дальнейших экспериментов и включить её в новые исследования, связанные с автоматическим распознаванием дореформенных текстов.
Проверка распознавания моделью текста на независимых данных показала высокий уровень точности: ошибка на уровне символов (CER, Character Error Rate) — около ~2%.
Исходники и документация:
→ https://github.com/AButon-8/iskra_ocr
Под чутким руководством и с огромной поддержкой моего научного руководителя @locusclassicus подготовлена модель распознавания дореформенной русской орфографии (на материале «Искры»). Теперь эта модель опубликована в открытом репозитории — вместе с описанием, кодом и метриками.
Публикация материалов на GitHub позволит независимо проверить полученные результаты, использовать модель как отправную точку для дальнейших экспериментов и включить её в новые исследования, связанные с автоматическим распознаванием дореформенных текстов.
Проверка распознавания моделью текста на независимых данных показала высокий уровень точности: ошибка на уровне символов (CER, Character Error Rate) — около ~2%.
Исходники и документация:
→ https://github.com/AButon-8/iskra_ocr
🔥23🙏12👨💻4❤3⚡1
Forwarded from Инфокультура
Объявлен приём заявок на Премию «Открытый доступ к данным в гуманитарных науках»
АНО «Инфокультура» приглашает студентов, аспирантов, преподавателей, исследователей и сотрудников вузов и научных организаций принять участие в конкурсе проектов, способствующих развитию открытой науки в гуманитарной сфере.
📌 Что можно подать:
– результаты научных исследований,
– цифровые проекты, связанные с гуманитарными дисциплинами,
– дипломные и курсовые проекты,
– иные работы, представляющие гуманитарные данные в открытом доступе.
📚 Номинации Премии:
• История
• Филология
• Культура
• Искусство
• Иные гуманитарные науки
Номинировать проект может как сам автор (или коллектив авторов), так и любой человек или организация, знакомые с проектом. Год публикации работы не имеет значения.
🏅 Лауреаты получат памятные награды, сертификаты и специальные призы от организаторов и партнёров Премии.
📝 Приём заявок уже открыт!
🔗 https://humawards.ru
#opendata #openaccess #humanitarian #contest
АНО «Инфокультура» приглашает студентов, аспирантов, преподавателей, исследователей и сотрудников вузов и научных организаций принять участие в конкурсе проектов, способствующих развитию открытой науки в гуманитарной сфере.
📌 Что можно подать:
– результаты научных исследований,
– цифровые проекты, связанные с гуманитарными дисциплинами,
– дипломные и курсовые проекты,
– иные работы, представляющие гуманитарные данные в открытом доступе.
📚 Номинации Премии:
• История
• Филология
• Культура
• Искусство
• Иные гуманитарные науки
Номинировать проект может как сам автор (или коллектив авторов), так и любой человек или организация, знакомые с проектом. Год публикации работы не имеет значения.
🏅 Лауреаты получат памятные награды, сертификаты и специальные призы от организаторов и партнёров Премии.
📝 Приём заявок уже открыт!
🔗 https://humawards.ru
#opendata #openaccess #humanitarian #contest
❤11