RAntiquity
1.09K subscribers
295 photos
11 videos
5 files
545 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
RAntiquity
Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая…
(продолжение)

💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось

💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.

💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {httr2}, чем через rorcid (который уже не развивается). Но и там страновая аффилиация указана далеко не всегда, многие журналы ее не требуют и не пишут.

💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.

💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.

💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.

💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.

С Праздником!
🥰149
RAntiquity
Первые обобщения #plato_mapping #scopus
ясно одно: как ни меняй проекцию, платоновских исследований в Гренладии нет. непорядок

make Greenland great again
😁31🏆2
RAntiquity
Первые обобщения #plato_mapping #scopus
Коллеги в лс и в чате предложили поменять проекцию. Чтобы два раза не вставать — поменяла сразу палитру и шрифты.

То, что еще утром было  quick and dirty, теперь прямо-таки красота (не спорьте).

#maps
22👍8🫡2
This media is not supported in your browser
VIEW IN TELEGRAM
Давно хотела попробовать пакет {gganimate}, но не могла придумать, куда его применить. Наконец придумала 🎸

#plato_mapping

p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥155
Chatgpt специально для @rantiquity
🔥187
На портале «Горький» вышла рецензия на книгу Франко Моретти «Движение в ложном направлении», в которой известный теоретик цифровых гуманитарных наук (DH) самокритично осмысляет развитие этого направления и разочарование в нем.

Моретти, один из основателей DH, признает, что через 20 лет после первых успехов он стал скептически относиться к роли количественных методов в гуманитарных науках. Его книга — это попытка осмысления того, почему DH отклонились от своих изначальных целей: соединить литературную теорию с эмпирическими, цифровыми способами анализа.

Моретти указывает, что количественные методы в DH развились до невероятного уровня, но при этом потеряли связь с теоретическими и социальными корнями. Главная мысль автора — data-driven подход вытеснил идею, а герменевтика (традиционное филологическое понимание и интерпретация текста) оказалась трудно совместимой с количественными методами.

Он также критикует бюрократизацию междисциплинарности, указывает на разрыв между количественными методами и литературной теорией и сетует на отсутствие настоящих теоретико-методологических прорывов. Основной вывод: DH зашли в тупик. Появилось много результатов, но исчезли теоретические обобщения и научная смелость. Моретти призывает коллег не увлекаться «датафилией», а возвращаться к дискуссии, к теории, к смыслу.

Автор рецензии хвалит «маэстро» за смелую самокритику, но мое отношение к подобной смене курса сложнее. Моретти, как настоящий левак, очень напористо продвигал свою повестку, собрал все возможные сливки с последовавшего «цифрового поворота» и теперь, разумеется, хочет, чтобы вся эта история закончилась на нем и все вернулись к своим обычным делам. А обычных дел — не осталось. Возвращаться не к чему.

По этому поводу процитирую одного известного обскуранта, который тоже стал свидетелем мощного “продвижения повестки”.

Публика встала.

— Пора одевать шубы и возвращаться домой.

Оглянулись.

Но ни шуб, ни домов не оказалось.


За наводку спасибо Стасу Нарановичу @parakharatteintonomisma
👍118🔥3🤔2
Дорогие друзья, мне надо срочно освободить lebensraum, отдам книги по программированию, самовывоз Отрадное

1) питон-сет
2) питон-nlp-сет
3) text mining in R set

Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊

Фото сетов в комментариях

upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))
10💋5
2025-05-28_Invitation_Alieva.pdf
164.8 KB
🗓 С любезного разрешения организаторов делюсь приглашением на семинар, огранизованный Техническим университетом Нюрнберга.

✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.

📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.

🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.
🔥24🥰8❤‍🔥7👍21
вышел мой второй материал в Системном Блоке!! это примерно то же, что я рассказывала в конце марта уважаемым классикам на конференции в РГГУ, только теперь в форме лонгрида и со смешным названием

а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!
🥰126👍4😈21
5 утра воскресенья. Готовлюсь к занятию по логистической регрессии, считаю логарифм риска на пачке чая гринфилд эрл грей. Очень странное чувство ☕️😴
❤‍🔥30🤯87
И вообще в русском языке сосуществуют два термина: стилеметрия и стилометрия, –  и стоит больших трудов понять, в чем заключается разница (в одной букве).

Наконец-то кто-то набрался смелости это сказать 😅
9🔥7😁2
Есть какая-то богословская шутка в том, что один из самых популярных оптимизаторов в глубоком обучении называется Adam. Вообще-то это акроним, Adaptive Moment Estimation. Но, учитывая, что речь идет об оптимизации функции потерь, то есть уменьшении ошибки, сами понимаете. Первый человек был без греха, а нам остается только оптимизировать. Извините.
21😇10😁5🙏5
RAntiquity
Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️

Вот что мы успели 🖼️🖼️🖼️:

1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World data sets, на дом — данные Министерства культуры о библиотеках в России 🗺

2️⃣ Регрессионный анализ (текст, видео). Данные из пакета {archdata}: распределение поздней романо-британской керамики, произведенной в Оксфорде 🏺

3️⃣ Регрессионные модели с {tidymodels} (текст, видео). Предсказывали цену амазоновских книг по их названию, а потом провели минихакатон, предсказывая рейтинг отеля по тексту отзыва 📚🏖

4️⃣ Бинарная классификация (текст, видео). Поговорили о линейно-дискриминантном анализе и наивном Байесе, а также воспроизвели знаменитый кейс «Записок Федералиста» в экосистеме {tidymodels}. Давно хотела это сделать 🤓

5️⃣ Многоклассовая классификация (текст, видео). Поговорили о логистической регрессии с регуляризацией и опорных векторах. На занятии классифицировали русских писателей, а на дом отправился небольшой датасет британской прозы) 📉

6️⃣ Глубокое обучение (текст, видео). На новостном датасете из {textdata} изучили полносвязные нейросети и onehot-кодирование. Обучили свою первую модель Keras 🧠🖼️

7️⃣ Приложения Shiny (текст, видео). Использовали обученные прошлый раз препроцессор и модель для строительства небольшого приложения Shiny. Потренировались разворачивать его с Connect Posit Cloud. 🛠

Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой 💃

Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях 📖

Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Please open Telegram to view this post
VIEW IN TELEGRAM
24👏15🔥5
Коллега из ПСТГУ пишет в своем блоге, что раздел по {tmap} пригодился для создания карты римских понтификов. Что ж, я очень рада: и тому, что все понтифики теперь на местах, и тому, что материалы курса оказываются полезны тем, для кого они предназначены 🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
22👏4
This media is not supported in your browser
VIEW IN TELEGRAM
Все побежали — и я побежала. Точнее, погнала: сделала модный bar chart race 🏇на основании публикаций о Платоне в #scopus

🎬 Делюсь секретами создания этой анимации:

🔧 Основные пакеты:
- ggplot2 — строим статичный график
- gganimate — оживляем его
- scales — красивое форматирование чисел
- viridis — стильная цветовая палитра

💡 Ключевые решения:

coord_flip(clip = "off") — переворачиваем график и позволяем тексту выходить за границы

scale_y_continuous(trans = "log10") — логарифмическая шкала сжимает большие различия

transition_states() — плавные переходы между годами с настройкой скорости

geom_text() с динамическим позиционированием — подписи всегда на нужном месте

scale_x_reverse() — ранжируем от 1-го места сверху


Результат: 20-секундное видео, показывающее число страновых аффилиаций по годам в исследованиях Платона 🇷🇺
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍2
🌍 Академический год почти завершен, но до конца июня предстоит еще несколько защит и экзаменов — и заключительный академический рывок, конференция «Reading Plato from the Global South» в Чунцине (Китай) 🇨🇳


🎓 Конференция пройдет под эгидой кафедры ЮНЕСКО ARCHAI (Университет Бразилиа) и Центра китайских и греческих цивилизаций.

🌟 25-27 июня в Юго-западном университете Чунцина соберутся представители платоноведения из 15 стран — от Токийского университета до Бостона, от Университета Буэнос-Айреса до Университета Крита.

🏛️ С коллегами из Ганы, Индии, Бразилии и других стран обсудим новые перспективы понимания античного наследия в том числе через призму незападных философских традиций.

🚀 Замысел этой встречи — создать уникальную глобальную сеть исследований и способствовать развитию платоноведения во всем мире, включая Россию 🇷🇺

👾 По этому поводу планирую представить количественный обзор глобальных трендов в платоноведении; предварительные слайды доступны по ссылке: “Mapping Platonic Scholarship in Scopus: A Bird’s-Eye View

С новостями по теме вернусь, если долечу, уже скоро #plato_mapping #scopus #china2025
10🔥9
Людвиг Витгенштейн в «Голубой книге» замечает по поводу «Теэтета»: Сократ не рассматривает перечисление случаев знания даже как предварительный ответ. В этом Сократ, с его точки зрения, неправ: мы прекрасно можем оперировать понятиями, не зная их точных определений.

Я не могу дать технически строго определения понятия «компьютер» и тем не менее прекрасно обособляю во внешнем мире предметы, которые являются компьютерами; то же самое может быть применимо и к более абстрактным понятиям вроде «знания» или «игра». Для игр может и не быть единого определения: игры в карты, в мяч, в слова или в молчанку обладают в лучшем случае «семейным сходством», и ни одно определение не сможет вместить всех признаков, отличающих игру от других видов активности. Требование Сократа всегда исходить из определения кажется в этом свете не только излишним, но и зачастую невыполнимым.

Можно привести такой пример. Алгоритмы, которые сортируют письма, не нуждаются в определении «спама». Машинное обучение работает так, как говорит Витгенштейн: мы снабжаем метками «спам» или «не спам» некоторое число наблюдений (писем), и по этим наблюдениям машина учится отличать одно от другого, извлекая релевантные признаки. Список этих признаков не задан раз и навсегда, в какой-то спам-рассылке будет слово «наследство», в другой будет слово «сглаз» — это не строгий критерий. Где-то под капотом машина перемножает некие вероятности и возвращает новую вероятность — вероятность, что данное письмо является спамом.

Но есть нюанс. Откуда мы берем метки для исходного датасета? Машина может фильтровать спам, не нуждаясь в определении, но человек, который изначально расставляет метки, имеет какое-то представление о спаме — возможно, не очень ясное или недостаточно артикулированное.

Сократ требует от своих собеседников упаковать это представление в определение и проверяет его примерами. В случае конфликта собеседнику доступно две стратегии: отвергнуть пример или пересмотреть определение (Бернит против Мура на стороне Сократа).

Википедия, например, предлагает такое определение спама:
Спам — это массовая рассылка корреспонденции (чаще всего рекламы) лицам, не выражавшим желания её получить.


Если исходить из этого, большая часть моей рабочей корреспонденции — это спам, потому что я не выражала желания ее получить и вообще ей не рада. Теперь представьте, что вы дали Сократу такое определение, а он показывает вам очередное рабочее письмо с требованием СРОЧНО снова куда-то бежать и что-то заполнять.

Вы, вероятно, захотите уточнить своё определение — добавить «не относящейся к профессиональным обязанностям» или «не связанной с рабочим процессом». Но в этот момент становится очевидно: без стремления к определению мы теряем возможность обсуждать понятие осмысленно, спорить о пограничных случаях, отстаивать различные трактовки и критиковать их. Именно определение — пусть даже неточное и неполное — позволяет нам не просто «размечать» датасеты, а выстраивать рациональный диалог о том, что к понятию относится, а что — нет, и почему.

Витгенштейн прав в том, что мы действительно можем пользоваться словами без строгих определений; но Сократ прав в более глубоком смысле: пока мы не пытаемся осмыслить и критически обсудить значение понятия, мы не отличаемся от алгоритма машинного обучения — просто расставляем метки на примерах, не понимая, что же именно делает их примерами.
👍1582🔥1
open call
проект <—> исследование

Альянс цифровых гуманитарных проектов запускает конкурс проект <—> исследование для тех, кто хочет сделать DH-проекты частью живой инфраструктуры науки, образования и культуры.

🟢 в чём суть конкурса?

Символ <—> в названии конкурса означает, что проекты и исследования связаны. Идея конкурса в том, чтобы делать эту связь между проектами и исследованиями более ощутимой и полезной.

Наша цель — усилить практическую пользу существующих цифровых гуманитарных проектов через исследования, мероприятия или образовательные инициативы.

🔮 кто может участвовать?

— Учёные, преподаватели вузов
— Студенты, аспиранты
— Независимые исследователи
— Сотрудники музеев, библиотек, архивов, галерей
— Культурные менеджеры, урбанисты
— Креативные продюсеры, медиа-менеджеры, журналисты

🟪 в чём задачи участников?

Для участия нужно разработать и описать реализуемую идею, использующую материалы одного или нескольких DH-проектов Альянса, в одной из номинаций:

1. Классическое исследование
2. Интернет-исследование
3. Выставочный/библиотечный/архивный проект
4. Медийный/просветительский проект/мероприятие
5. Образовательная инициатива
6. Critical DH Studies / Ресантимент-анализ

✏️ как поучаствовать?

1. Изучите номинации и проекты Альянса.
2. Разработайте свою идею.
3. Заполните анкету и шаблон заявки на сайте.
4. Ждите обратную связь до 1 августа.

> подробности — на сайте <

что получат победители?

— Консультационную поддержку от ведущих экспертов Альянса.
— Тьюторскую поддержку (помощь в подготовке публикаций).
— Продюсерскую поддержку для реализации вашего плана.
— Рекомендательное письмо для поступления в магистратуры организаторов.

Заявки принимаются до 16 июля 2025 года.

Если у вас есть вопросы о конкурсе, Пишите нам на почту [email protected].
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏3111👍1🔥1💅1