RAntiquity

Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая…

(продолжение)

💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось

💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.

💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {httr2}, чем через rorcid (который уже не развивается). Но и там страновая аффилиация указана далеко не всегда, многие журналы ее не требуют и не пишут.

💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.

💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.

💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.

💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.

С Праздником!

🥰14❤9

806 viewsOlga Alieva, 19:27

RAntiquity

Первые обобщения
#plato_mapping #scopus

❤16👍5🥰2

669 viewsOlga Alieva, 11:11

RAntiquity

Первые обобщения #plato_mapping #scopus

ясно одно: как ни меняй проекцию, платоновских исследований в Гренладии нет. непорядок

make Greenland great again

😁31🏆2

764 viewsOlga Alieva, edited 11:57

RAntiquity

Первые обобщения #plato_mapping #scopus

Коллеги в лс и в чате предложили поменять проекцию. Чтобы два раза не вставать — поменяла сразу палитру и шрифты.

То, что еще утром было quick and dirty, теперь прямо-таки красота (не спорьте).

#maps

❤22👍8🫡2

795 viewsOlga Alieva, edited 15:46

RAntiquity

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Давно хотела попробовать пакет {gganimate}, но не могла придумать, куда его применить. Наконец придумала 🎸

#plato_mapping

p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥15❤5

958 viewsOlga Alieva, edited 10:28

RAntiquity

Chatgpt специально для @rantiquity

🔥18❤7

1.02K viewsOlga Alieva, 10:37

RAntiquity

На портале «Горький» вышла рецензия на книгу Франко Моретти «Движение в ложном направлении», в которой известный теоретик цифровых гуманитарных наук (DH) самокритично осмысляет развитие этого направления и разочарование в нем.

Моретти, один из основателей DH, признает, что через 20 лет после первых успехов он стал скептически относиться к роли количественных методов в гуманитарных науках. Его книга — это попытка осмысления того, почему DH отклонились от своих изначальных целей: соединить литературную теорию с эмпирическими, цифровыми способами анализа.

Моретти указывает, что количественные методы в DH развились до невероятного уровня, но при этом потеряли связь с теоретическими и социальными корнями. Главная мысль автора — data-driven подход вытеснил идею, а герменевтика (традиционное филологическое понимание и интерпретация текста) оказалась трудно совместимой с количественными методами.

Он также критикует бюрократизацию междисциплинарности, указывает на разрыв между количественными методами и литературной теорией и сетует на отсутствие настоящих теоретико-методологических прорывов. Основной вывод: DH зашли в тупик. Появилось много результатов, но исчезли теоретические обобщения и научная смелость. Моретти призывает коллег не увлекаться «датафилией», а возвращаться к дискуссии, к теории, к смыслу.

Автор рецензии хвалит «маэстро» за смелую самокритику, но мое отношение к подобной смене курса сложнее. Моретти, как настоящий левак, очень напористо продвигал свою повестку, собрал все возможные сливки с последовавшего «цифрового поворота» и теперь, разумеется, хочет, чтобы вся эта история закончилась на нем и все вернулись к своим обычным делам. А обычных дел — не осталось. Возвращаться не к чему.

По этому поводу процитирую одного известного обскуранта, который тоже стал свидетелем мощного “продвижения повестки”.

Публика встала.

— Пора одевать шубы и возвращаться домой.

Оглянулись.

Но ни шуб, ни домов не оказалось.

За наводку спасибо Стасу Нарановичу @parakharatteintonomisma

👍11❤8🔥3🤔2

1.4K viewsOlga Alieva, 07:35

RAntiquity

Дорогие друзья, мне надо срочно освободить lebensraum, отдам книги по программированию, самовывоз Отрадное

1) питон-сет
2) питон-nlp-сет
3) text mining in R set

Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊

Фото сетов в комментариях

upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))

❤10💋5

923 viewsOlga Alieva, edited 11:29

RAntiquity

2025-05-28_Invitation_Alieva.pdf

164.8 KB

🗓 С любезного разрешения организаторов делюсь приглашением на семинар, огранизованный Техническим университетом Нюрнберга.

✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.

📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.

🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.

🔥24🥰8❤‍🔥7👍2❤1

1.04K viewsOlga Alieva, edited 12:54

RAntiquity

Наш человек в “Системном блоке” продолжает жечь глаголом https://t.iss.one/sysblok/1170

Системный Блокъ

Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе

Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…

🥰8

1.02K viewsOlga Alieva, 17:06

RAntiquity

Forwarded from античные лолы и кеки

вышел мой второй материал в Системном Блоке!! это примерно то же, что я рассказывала в конце марта уважаемым классикам на конференции в РГГУ, только теперь в форме лонгрида и со смешным названием

а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!

Системный Блокъ

🥰12✍6👍4😈2❤1

1.2K viewsOlga Alieva, 19:50

RAntiquity

5 утра воскресенья. Готовлюсь к занятию по логистической регрессии, считаю логарифм риска на пачке чая гринфилд эрл грей. Очень странное чувство ☕️😴

❤‍🔥30🤯8❤7

1.39K viewsOlga Alieva, edited 03:19

RAntiquity

И вообще в русском языке сосуществуют два термина: стилеметрия и стилометрия, – и стоит больших трудов понять, в чем заключается разница (в одной букве).

Наконец-то кто-то набрался смелости это сказать 😅

❤9🔥7😁2

1.15K viewsOlga Alieva, edited 19:27

RAntiquity

Есть какая-то богословская шутка в том, что один из самых популярных оптимизаторов в глубоком обучении называется Adam. Вообще-то это акроним, Adaptive Moment Estimation. Но, учитывая, что речь идет об оптимизации функции потерь, то есть уменьшении ошибки, сами понимаете. Первый человек был без греха, а нам остается только оптимизировать. Извините.

❤21😇10😁5🙏5

1.11K viewsOlga Alieva, 09:52

RAntiquity

Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…

Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️

Вот что мы успели 🖼️

🖼️

🖼️:

1️⃣

Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World data sets, на дом — данные Министерства культуры о библиотеках в России 🗺

2️⃣

Регрессионный анализ (текст, видео). Данные из пакета {archdata}: распределение поздней романо-британской керамики, произведенной в Оксфорде 🏺

3️⃣

Регрессионные модели с {tidymodels} (текст, видео). Предсказывали цену амазоновских книг по их названию, а потом провели минихакатон, предсказывая рейтинг отеля по тексту отзыва 📚🏖

4️⃣

Бинарная классификация (текст, видео). Поговорили о линейно-дискриминантном анализе и наивном Байесе, а также воспроизвели знаменитый кейс «Записок Федералиста» в экосистеме {tidymodels}. Давно хотела это сделать 🤓

5️⃣

Многоклассовая классификация (текст, видео). Поговорили о логистической регрессии с регуляризацией и опорных векторах. На занятии классифицировали русских писателей, а на дом отправился небольшой датасет британской прозы) 📉

6️⃣

Глубокое обучение (текст, видео). На новостном датасете из {textdata} изучили полносвязные нейросети и onehot-кодирование. Обучили свою первую модель Keras 🧠

🖼️

7️⃣

Приложения Shiny (текст, видео). Использовали обученные прошлый раз препроцессор и модель для строительства небольшого приложения Shiny. Потренировались разворачивать его с Connect Posit Cloud. 🛠

Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой

💃

Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях 📖

Спасибо моим студентам — за неустрашимость и творческий подход к делу.

Please open Telegram to view this post

VIEW IN TELEGRAM

VK Видео

Компьютерный анализ текста #24 Пространственные данные

Занятие 4 апреля 2025

❤24👏15🔥5

998 viewsOlga Alieva, edited 06:15

RAntiquity

Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️ Вот что мы успели 🖼️

🖼️

🖼️: 1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World…

А вот и приложение и код к нему: https://locusclassicus-news-app.share.connect.posit.cloud/

👍6🔥3

1.1K viewsOlga Alieva, 06:19

RAntiquity

Коллега из ПСТГУ пишет в своем блоге, что раздел по {tmap} пригодился для создания карты римских понтификов. Что ж, я очень рада: и тому, что все понтифики теперь на местах, и тому, что материалы курса оказываются полезны тем, для кого они предназначены 🥳

Please open Telegram to view this post

VIEW IN TELEGRAM

❤22👏4

863 viewsOlga Alieva, edited 10:52

RAntiquity

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

Все побежали — и я побежала. Точнее, погнала: сделала модный bar chart race 🏇на основании публикаций о Платоне в #scopus

🎬 Делюсь секретами создания этой анимации:

🔧 Основные пакеты:
- ggplot2 — строим статичный график
- gganimate — оживляем его
- scales — красивое форматирование чисел
- viridis — стильная цветовая палитра

💡 Ключевые решения:

✅ coord_flip(clip = "off") — переворачиваем график и позволяем тексту выходить за границы

✅ scale_y_continuous(trans = "log10") — логарифмическая шкала сжимает большие различия

✅ transition_states() — плавные переходы между годами с настройкой скорости

✅ geom_text() с динамическим позиционированием — подписи всегда на нужном месте

✅ scale_x_reverse() — ранжируем от 1-го места сверху

Результат: 20-секундное видео, показывающее число страновых аффилиаций по годам в исследованиях Платона 🇷🇺

Please open Telegram to view this post

VIEW IN TELEGRAM

❤23👍2

765 viewsOlga Alieva, edited 13:45

RAntiquity

🌍 Академический год почти завершен, но до конца июня предстоит еще несколько защит и экзаменов — и заключительный академический рывок, конференция «Reading Plato from the Global South» в Чунцине (Китай) 🇨🇳

🎓 Конференция пройдет под эгидой кафедры ЮНЕСКО ARCHAI (Университет Бразилиа) и Центра китайских и греческих цивилизаций.

🌟 25-27 июня в Юго-западном университете Чунцина соберутся представители платоноведения из 15 стран — от Токийского университета до Бостона, от Университета Буэнос-Айреса до Университета Крита.

🏛️ С коллегами из Ганы, Индии, Бразилии и других стран обсудим новые перспективы понимания античного наследия в том числе через призму незападных философских традиций.

🚀 Замысел этой встречи — создать уникальную глобальную сеть исследований и способствовать развитию платоноведения во всем мире, включая Россию 🇷🇺

👾 По этому поводу планирую представить количественный обзор глобальных трендов в платоноведении; предварительные слайды доступны по ссылке: “Mapping Platonic Scholarship in Scopus: A Bird’s-Eye View”

С новостями по теме вернусь, если долечу, уже скоро #plato_mapping #scopus #china2025

Cátedra Unesco Archai

First Global Network for Platonic Studies Meeting: Reading Plato from the Global South

Unesco Cátedra Archai. First Plato's Global Scholarship Network Meeting: Reading Plato from the Global South. 2025

❤10🔥9

2.21K viewsOlga Alieva, 16:13

RAntiquity

Людвиг Витгенштейн в «Голубой книге» замечает по поводу «Теэтета»: Сократ не рассматривает перечисление случаев знания даже как предварительный ответ. В этом Сократ, с его точки зрения, неправ: мы прекрасно можем оперировать понятиями, не зная их точных определений.

Я не могу дать технически строго определения понятия «компьютер» и тем не менее прекрасно обособляю во внешнем мире предметы, которые являются компьютерами; то же самое может быть применимо и к более абстрактным понятиям вроде «знания» или «игра». Для игр может и не быть единого определения: игры в карты, в мяч, в слова или в молчанку обладают в лучшем случае «семейным сходством», и ни одно определение не сможет вместить всех признаков, отличающих игру от других видов активности. Требование Сократа всегда исходить из определения кажется в этом свете не только излишним, но и зачастую невыполнимым.

Можно привести такой пример. Алгоритмы, которые сортируют письма, не нуждаются в определении «спама». Машинное обучение работает так, как говорит Витгенштейн: мы снабжаем метками «спам» или «не спам» некоторое число наблюдений (писем), и по этим наблюдениям машина учится отличать одно от другого, извлекая релевантные признаки. Список этих признаков не задан раз и навсегда, в какой-то спам-рассылке будет слово «наследство», в другой будет слово «сглаз» — это не строгий критерий. Где-то под капотом машина перемножает некие вероятности и возвращает новую вероятность — вероятность, что данное письмо является спамом.

Но есть нюанс. Откуда мы берем метки для исходного датасета? Машина может фильтровать спам, не нуждаясь в определении, но человек, который изначально расставляет метки, имеет какое-то представление о спаме — возможно, не очень ясное или недостаточно артикулированное.

Сократ требует от своих собеседников упаковать это представление в определение и проверяет его примерами. В случае конфликта собеседнику доступно две стратегии: отвергнуть пример или пересмотреть определение (Бернит против Мура на стороне Сократа).

Википедия, например, предлагает такое определение спама:

Спам — это массовая рассылка корреспонденции (чаще всего рекламы) лицам, не выражавшим желания её получить.

Если исходить из этого, большая часть моей рабочей корреспонденции — это спам, потому что я не выражала желания ее получить и вообще ей не рада. Теперь представьте, что вы дали Сократу такое определение, а он показывает вам очередное рабочее письмо с требованием СРОЧНО снова куда-то бежать и что-то заполнять.

Вы, вероятно, захотите уточнить своё определение — добавить «не относящейся к профессиональным обязанностям» или «не связанной с рабочим процессом». Но в этот момент становится очевидно: без стремления к определению мы теряем возможность обсуждать понятие осмысленно, спорить о пограничных случаях, отстаивать различные трактовки и критиковать их. Именно определение — пусть даже неточное и неполное — позволяет нам не просто «размечать» датасеты, а выстраивать рациональный диалог о том, что к понятию относится, а что — нет, и почему.

Витгенштейн прав в том, что мы действительно можем пользоваться словами без строгих определений; но Сократ прав в более глубоком смысле: пока мы не пытаемся осмыслить и критически обсудить значение понятия, мы не отличаемся от алгоритма машинного обучения — просто расставляем метки на примерах, не понимая, что же именно делает их примерами.

👍15❤8⚡2🔥1

695 viewsOlga Alieva, edited 07:53

RAntiquity

Forwarded from Альянс цифровых гуманитарных проектов

✨

open call

✨

проект <—> исследование

Альянс цифровых гуманитарных проектов запускает конкурс проект <—> исследование для тех, кто хочет сделать DH-проекты частью живой инфраструктуры науки, образования и культуры.

🟢

в чём суть конкурса?

Символ <—> в названии конкурса означает, что проекты и исследования связаны. Идея конкурса в том, чтобы делать эту связь между проектами и исследованиями более ощутимой и полезной.

Наша цель — усилить практическую пользу существующих цифровых гуманитарных проектов через исследования, мероприятия или образовательные инициативы.

🔮

кто может участвовать?

— Учёные, преподаватели вузов
— Студенты, аспиранты
— Независимые исследователи
— Сотрудники музеев, библиотек, архивов, галерей
— Культурные менеджеры, урбанисты
— Креативные продюсеры, медиа-менеджеры, журналисты

🟪

в чём задачи участников?

Для участия нужно разработать и описать реализуемую идею, использующую материалы одного или нескольких DH-проектов Альянса, в одной из номинаций:

1. Классическое исследование
2. Интернет-исследование
3. Выставочный/библиотечный/архивный проект
4. Медийный/просветительский проект/мероприятие
5. Образовательная инициатива
6. Critical DH Studies / Ресантимент-анализ

✏️

как поучаствовать?

1. Изучите номинации и проекты Альянса.
2. Разработайте свою идею.
3. Заполните анкету и шаблон заявки на сайте.
4. Ждите обратную связь до 1 августа.

> подробности — на сайте <

✨

что получат победители?

— Консультационную поддержку от ведущих экспертов Альянса.
— Тьюторскую поддержку (помощь в подготовке публикаций).
— Продюсерскую поддержку для реализации вашего плана.
— Рекомендательное письмо для поступления в магистратуры организаторов.

Заявки принимаются до 16 июля 2025 года.

Если у вас есть вопросы о конкурсе, Пишите нам на почту [email protected].

Please open Telegram to view this post

VIEW IN TELEGRAM

🙏3⚡1✍1❤1👍1🔥1💅1

710 viewsOlga Alieva, 17:00

About

Blog

Apps

Platform