RAntiquity
1.09K subscribers
295 photos
11 videos
5 files
545 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
RAntiquity
Первые обобщения #plato_mapping #scopus
Коллеги в лс и в чате предложили поменять проекцию. Чтобы два раза не вставать — поменяла сразу палитру и шрифты.

То, что еще утром было  quick and dirty, теперь прямо-таки красота (не спорьте).

#maps
22👍8🫡2
This media is not supported in your browser
VIEW IN TELEGRAM
Давно хотела попробовать пакет {gganimate}, но не могла придумать, куда его применить. Наконец придумала 🎸

#plato_mapping

p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥155
Chatgpt специально для @rantiquity
🔥187
На портале «Горький» вышла рецензия на книгу Франко Моретти «Движение в ложном направлении», в которой известный теоретик цифровых гуманитарных наук (DH) самокритично осмысляет развитие этого направления и разочарование в нем.

Моретти, один из основателей DH, признает, что через 20 лет после первых успехов он стал скептически относиться к роли количественных методов в гуманитарных науках. Его книга — это попытка осмысления того, почему DH отклонились от своих изначальных целей: соединить литературную теорию с эмпирическими, цифровыми способами анализа.

Моретти указывает, что количественные методы в DH развились до невероятного уровня, но при этом потеряли связь с теоретическими и социальными корнями. Главная мысль автора — data-driven подход вытеснил идею, а герменевтика (традиционное филологическое понимание и интерпретация текста) оказалась трудно совместимой с количественными методами.

Он также критикует бюрократизацию междисциплинарности, указывает на разрыв между количественными методами и литературной теорией и сетует на отсутствие настоящих теоретико-методологических прорывов. Основной вывод: DH зашли в тупик. Появилось много результатов, но исчезли теоретические обобщения и научная смелость. Моретти призывает коллег не увлекаться «датафилией», а возвращаться к дискуссии, к теории, к смыслу.

Автор рецензии хвалит «маэстро» за смелую самокритику, но мое отношение к подобной смене курса сложнее. Моретти, как настоящий левак, очень напористо продвигал свою повестку, собрал все возможные сливки с последовавшего «цифрового поворота» и теперь, разумеется, хочет, чтобы вся эта история закончилась на нем и все вернулись к своим обычным делам. А обычных дел — не осталось. Возвращаться не к чему.

По этому поводу процитирую одного известного обскуранта, который тоже стал свидетелем мощного “продвижения повестки”.

Публика встала.

— Пора одевать шубы и возвращаться домой.

Оглянулись.

Но ни шуб, ни домов не оказалось.


За наводку спасибо Стасу Нарановичу @parakharatteintonomisma
👍118🔥3🤔2
Дорогие друзья, мне надо срочно освободить lebensraum, отдам книги по программированию, самовывоз Отрадное

1) питон-сет
2) питон-nlp-сет
3) text mining in R set

Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊

Фото сетов в комментариях

upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))
10💋5
2025-05-28_Invitation_Alieva.pdf
164.8 KB
🗓 С любезного разрешения организаторов делюсь приглашением на семинар, огранизованный Техническим университетом Нюрнберга.

✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.

📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.

🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.
🔥24🥰8❤‍🔥7👍21
вышел мой второй материал в Системном Блоке!! это примерно то же, что я рассказывала в конце марта уважаемым классикам на конференции в РГГУ, только теперь в форме лонгрида и со смешным названием

а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!
🥰126👍4😈21
5 утра воскресенья. Готовлюсь к занятию по логистической регрессии, считаю логарифм риска на пачке чая гринфилд эрл грей. Очень странное чувство ☕️😴
❤‍🔥30🤯87
И вообще в русском языке сосуществуют два термина: стилеметрия и стилометрия, –  и стоит больших трудов понять, в чем заключается разница (в одной букве).

Наконец-то кто-то набрался смелости это сказать 😅
9🔥7😁2
Есть какая-то богословская шутка в том, что один из самых популярных оптимизаторов в глубоком обучении называется Adam. Вообще-то это акроним, Adaptive Moment Estimation. Но, учитывая, что речь идет об оптимизации функции потерь, то есть уменьшении ошибки, сами понимаете. Первый человек был без греха, а нам остается только оптимизировать. Извините.
21😇10😁5🙏5
RAntiquity
Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️

Вот что мы успели 🖼️🖼️🖼️:

1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World data sets, на дом — данные Министерства культуры о библиотеках в России 🗺

2️⃣ Регрессионный анализ (текст, видео). Данные из пакета {archdata}: распределение поздней романо-британской керамики, произведенной в Оксфорде 🏺

3️⃣ Регрессионные модели с {tidymodels} (текст, видео). Предсказывали цену амазоновских книг по их названию, а потом провели минихакатон, предсказывая рейтинг отеля по тексту отзыва 📚🏖

4️⃣ Бинарная классификация (текст, видео). Поговорили о линейно-дискриминантном анализе и наивном Байесе, а также воспроизвели знаменитый кейс «Записок Федералиста» в экосистеме {tidymodels}. Давно хотела это сделать 🤓

5️⃣ Многоклассовая классификация (текст, видео). Поговорили о логистической регрессии с регуляризацией и опорных векторах. На занятии классифицировали русских писателей, а на дом отправился небольшой датасет британской прозы) 📉

6️⃣ Глубокое обучение (текст, видео). На новостном датасете из {textdata} изучили полносвязные нейросети и onehot-кодирование. Обучили свою первую модель Keras 🧠🖼️

7️⃣ Приложения Shiny (текст, видео). Использовали обученные прошлый раз препроцессор и модель для строительства небольшого приложения Shiny. Потренировались разворачивать его с Connect Posit Cloud. 🛠

Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой 💃

Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях 📖

Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Please open Telegram to view this post
VIEW IN TELEGRAM
24👏15🔥5
Коллега из ПСТГУ пишет в своем блоге, что раздел по {tmap} пригодился для создания карты римских понтификов. Что ж, я очень рада: и тому, что все понтифики теперь на местах, и тому, что материалы курса оказываются полезны тем, для кого они предназначены 🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
22👏4
This media is not supported in your browser
VIEW IN TELEGRAM
Все побежали — и я побежала. Точнее, погнала: сделала модный bar chart race 🏇на основании публикаций о Платоне в #scopus

🎬 Делюсь секретами создания этой анимации:

🔧 Основные пакеты:
- ggplot2 — строим статичный график
- gganimate — оживляем его
- scales — красивое форматирование чисел
- viridis — стильная цветовая палитра

💡 Ключевые решения:

coord_flip(clip = "off") — переворачиваем график и позволяем тексту выходить за границы

scale_y_continuous(trans = "log10") — логарифмическая шкала сжимает большие различия

transition_states() — плавные переходы между годами с настройкой скорости

geom_text() с динамическим позиционированием — подписи всегда на нужном месте

scale_x_reverse() — ранжируем от 1-го места сверху


Результат: 20-секундное видео, показывающее число страновых аффилиаций по годам в исследованиях Платона 🇷🇺
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍2
🌍 Академический год почти завершен, но до конца июня предстоит еще несколько защит и экзаменов — и заключительный академический рывок, конференция «Reading Plato from the Global South» в Чунцине (Китай) 🇨🇳


🎓 Конференция пройдет под эгидой кафедры ЮНЕСКО ARCHAI (Университет Бразилиа) и Центра китайских и греческих цивилизаций.

🌟 25-27 июня в Юго-западном университете Чунцина соберутся представители платоноведения из 15 стран — от Токийского университета до Бостона, от Университета Буэнос-Айреса до Университета Крита.

🏛️ С коллегами из Ганы, Индии, Бразилии и других стран обсудим новые перспективы понимания античного наследия в том числе через призму незападных философских традиций.

🚀 Замысел этой встречи — создать уникальную глобальную сеть исследований и способствовать развитию платоноведения во всем мире, включая Россию 🇷🇺

👾 По этому поводу планирую представить количественный обзор глобальных трендов в платоноведении; предварительные слайды доступны по ссылке: “Mapping Platonic Scholarship in Scopus: A Bird’s-Eye View

С новостями по теме вернусь, если долечу, уже скоро #plato_mapping #scopus #china2025
10🔥9
Людвиг Витгенштейн в «Голубой книге» замечает по поводу «Теэтета»: Сократ не рассматривает перечисление случаев знания даже как предварительный ответ. В этом Сократ, с его точки зрения, неправ: мы прекрасно можем оперировать понятиями, не зная их точных определений.

Я не могу дать технически строго определения понятия «компьютер» и тем не менее прекрасно обособляю во внешнем мире предметы, которые являются компьютерами; то же самое может быть применимо и к более абстрактным понятиям вроде «знания» или «игра». Для игр может и не быть единого определения: игры в карты, в мяч, в слова или в молчанку обладают в лучшем случае «семейным сходством», и ни одно определение не сможет вместить всех признаков, отличающих игру от других видов активности. Требование Сократа всегда исходить из определения кажется в этом свете не только излишним, но и зачастую невыполнимым.

Можно привести такой пример. Алгоритмы, которые сортируют письма, не нуждаются в определении «спама». Машинное обучение работает так, как говорит Витгенштейн: мы снабжаем метками «спам» или «не спам» некоторое число наблюдений (писем), и по этим наблюдениям машина учится отличать одно от другого, извлекая релевантные признаки. Список этих признаков не задан раз и навсегда, в какой-то спам-рассылке будет слово «наследство», в другой будет слово «сглаз» — это не строгий критерий. Где-то под капотом машина перемножает некие вероятности и возвращает новую вероятность — вероятность, что данное письмо является спамом.

Но есть нюанс. Откуда мы берем метки для исходного датасета? Машина может фильтровать спам, не нуждаясь в определении, но человек, который изначально расставляет метки, имеет какое-то представление о спаме — возможно, не очень ясное или недостаточно артикулированное.

Сократ требует от своих собеседников упаковать это представление в определение и проверяет его примерами. В случае конфликта собеседнику доступно две стратегии: отвергнуть пример или пересмотреть определение (Бернит против Мура на стороне Сократа).

Википедия, например, предлагает такое определение спама:
Спам — это массовая рассылка корреспонденции (чаще всего рекламы) лицам, не выражавшим желания её получить.


Если исходить из этого, большая часть моей рабочей корреспонденции — это спам, потому что я не выражала желания ее получить и вообще ей не рада. Теперь представьте, что вы дали Сократу такое определение, а он показывает вам очередное рабочее письмо с требованием СРОЧНО снова куда-то бежать и что-то заполнять.

Вы, вероятно, захотите уточнить своё определение — добавить «не относящейся к профессиональным обязанностям» или «не связанной с рабочим процессом». Но в этот момент становится очевидно: без стремления к определению мы теряем возможность обсуждать понятие осмысленно, спорить о пограничных случаях, отстаивать различные трактовки и критиковать их. Именно определение — пусть даже неточное и неполное — позволяет нам не просто «размечать» датасеты, а выстраивать рациональный диалог о том, что к понятию относится, а что — нет, и почему.

Витгенштейн прав в том, что мы действительно можем пользоваться словами без строгих определений; но Сократ прав в более глубоком смысле: пока мы не пытаемся осмыслить и критически обсудить значение понятия, мы не отличаемся от алгоритма машинного обучения — просто расставляем метки на примерах, не понимая, что же именно делает их примерами.
👍1582🔥1
open call
проект <—> исследование

Альянс цифровых гуманитарных проектов запускает конкурс проект <—> исследование для тех, кто хочет сделать DH-проекты частью живой инфраструктуры науки, образования и культуры.

🟢 в чём суть конкурса?

Символ <—> в названии конкурса означает, что проекты и исследования связаны. Идея конкурса в том, чтобы делать эту связь между проектами и исследованиями более ощутимой и полезной.

Наша цель — усилить практическую пользу существующих цифровых гуманитарных проектов через исследования, мероприятия или образовательные инициативы.

🔮 кто может участвовать?

— Учёные, преподаватели вузов
— Студенты, аспиранты
— Независимые исследователи
— Сотрудники музеев, библиотек, архивов, галерей
— Культурные менеджеры, урбанисты
— Креативные продюсеры, медиа-менеджеры, журналисты

🟪 в чём задачи участников?

Для участия нужно разработать и описать реализуемую идею, использующую материалы одного или нескольких DH-проектов Альянса, в одной из номинаций:

1. Классическое исследование
2. Интернет-исследование
3. Выставочный/библиотечный/архивный проект
4. Медийный/просветительский проект/мероприятие
5. Образовательная инициатива
6. Critical DH Studies / Ресантимент-анализ

✏️ как поучаствовать?

1. Изучите номинации и проекты Альянса.
2. Разработайте свою идею.
3. Заполните анкету и шаблон заявки на сайте.
4. Ждите обратную связь до 1 августа.

> подробности — на сайте <

что получат победители?

— Консультационную поддержку от ведущих экспертов Альянса.
— Тьюторскую поддержку (помощь в подготовке публикаций).
— Продюсерскую поддержку для реализации вашего плана.
— Рекомендательное письмо для поступления в магистратуры организаторов.

Заявки принимаются до 16 июля 2025 года.

Если у вас есть вопросы о конкурсе, Пишите нам на почту [email protected].
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏3111👍1🔥1💅1
#исследования : как найти дружелюбный язык программирования, плоть идей и самой делать свои инструменты
> мини-интервью с Ольгой Алиевой <

- Оля, расскажи, пожалуйста, почему R? Как получилось, что тебе интересно стало заниматься количественным анализом?
- Изначально мне стало интересно решить одну конкретную задачу, связанную с платоновской стилометрией. Платоноведы часто ссылаются на результаты каких-то количественных исследований, на этом возводятся некие теоретические конструкции — мне захотелось разобраться, как это все устроено, «потрогать руками» — и, главное, проверить несколько собственных гипотез. Прежде чем взяться за дело, я почитала, кто какими инструментами пользуется сегодня для стилометрического анализа, посмотрела примеры проектов из смежных областей — и решила, что мне нужен R. Дальше я начала учиться и втянулась. R — очень дружелюбный язык, с сильным комьюнити, в котором много гуманитариев. Быстро выяснилось, что на R можно делать почти все, так почему бы не попробовать?

- Как это влияет на твою академическую индентичность: философа? филолога? историка мысли? количественной исследовательницы?
- Мне всегда нравилась математическая сторона жизни, и количественные исследования гармонично подружились с моим внутренним платоником. Мне пришлось осваивать основы статистики, вспоминать матанализ, это все удивительным образом позволило заметить и оценить в античной философии те сюжеты, которых я до сих пор, пожалуй, немного побаивалась. Так что филолог и философ во мне не пострадали, скорее наоборот. Вообще жизнь стала более многомерной.

- А что-то из наших проектов в конкурсе выглядит, на твой взгляд, вдохновляющим для большого (или малого) интеллектуального проекта? 
- Я так или иначе сотрудничала с коллегами из разных проектов в этом конкурсе, и больше всего меня вдохновляет, что такие мощные инфраструктурные вещи вообще есть. Наука — это сообщества, а сообщества строятся вокруг содержательной повестки. Конкурс показывает, насколько эта повестка богата и разнообразна. Обретающие плоть идеи — это, со времен творения мира, самое завораживающее зрелище. Mind over matter.

- Я навсегда запомнила твой доклад о том, что не все научные школы одинаково хорошо для квантификации, и некоторые теории придётся сжечь, если мы перейдём в цифровое (или как его там) будущее. Можешь ли привести пример и для наших конкурсантов, чтобы они могли беспокоиться вместе с нами?
- Ха-ха, у меня не было задачи заставить кого-то беспокоиться. Скорее я хотела привлечь внимание к тому, что есть множество областей гуманитарного знания, в которых форсированный «количественный поворот» едва ли принесет какую-то ощутимую пользу. В классической метафизике нечего считать; историко-философская реконструкция как жанр тоже, как ты сказала, очень плохо «квантифицируется» — за пределами узкого круга подходов, которые подвержены колебаниям интеллектуальной моды, вроде автоматического анализа дискурса. Мода приходит и уходит, мы не должны оценивать научные подходы и школы по тому, насколько они преуспели в гонке за искусственным интеллектом.

- Посоветуй, пожалуйста, как начать интересоваться инструментами хотя бы вполовину так увлечённо, как ты? Что почитать, попробовать, покодить?
- Я бы советовала исходить не из инструментов, и из исследовательского вопроса или проектной задачи, можно небольшой или «игрушечной», и уже под нее искать решения и осваивать их. А еще очень важно найти единомышленников, например при помощи Альянса и этого конкурса. Увлечение — вещь очень нестабильная, оно угасает вместе с первыми неудачами, и очень важно, чтобы в этот момент рядом были знающие и доброжелательные коллеги.
🔥20🥰74