RAntiquity
1.09K subscribers
295 photos
11 videos
5 files
544 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
В кружке у меня батч брю на эфиопии из кофейни Rum Baba в Амстердаме. Мне обещали насыщенный вкус, даже spicy — но не скажу, что это было прям вау. Скорее, он был слегка передержанный (хотя я брала его до полудня), но хороший, классический.

Компанию фильтру составила статья о том, как можно применять текстовый анализ для исследований академических журналов. По моему скромному опыту, историки античной философии тяготеют к древовидному методу исследования. Машина [программа, код] дает возможность сломать эту линейность и иначе посмотреть на то, как мыслят авторы статей.

Меня это наталкивает на мысль о том, что текстовый анализ — это приведение мысли-древа к мысли-ризоме. Это возможно, например, благодаря алгоритму LDA:

LDA — это популярный алгоритм для построения тематических моделей, в рамках которого каждый документ рассматривается как смесь тем, а каждая тема — как смесь слов. Это позволяет документам «перекрывать» друг друга по содержанию, а не разделяться на отдельные группы — что свойственно для естественного языка.

Кажется, именно об этом пишут Делёз и Гваттари:

Все эти множества суть плоские, ибо они заполняют, оккупируют все свои измерения […] Множества определяются внешним — абстрактной линией, линией ускользания или детерриторизации, следуя которой, они меняют природу соединяясь с другими множествами.


Анализ текста дает нам карту, которая состоит не из статичных точек, но из направлений. Эта карта не фиксирует и закрепляет, но приглашает к взаимодействию и модификации. Наконец, это не сверхкодирование (как может показаться на первый взгляд), а напротив — декодирование и разборка, которая ни в коем случае не претендует на открытие истины. Она лишь показывает другие возможные конфигурации и соединения.
6🔥3💯2🤮1
Написала для IQ.HSE обзор, посвященный применению LDA в разных гуманитарных отраслях, от политической истории до литературоведения. Хозяйке на заметку.
https://iq.hse.ru/news/885865882.html
🔥191👍1
Интересная статья от Бориса Орехова об отчуждаемости знания в эпоху больших языковых моделей вышла в журнале “Историческая информатика”.

Мы живем в текстоцентричном мире, и поэтому нас так пугают нейросети. Ученый сегодня смотрит на LLM то ли с надеждой (поможет?), то ли с опасением (заменит?). Проблема это никакая не техническая, а вполне себе философская:

Нейросети прежде всего ставят перед гуманитарной наукой вопрос о том, что есть в ней помимо текста, есть ли у знаков в научном тексте референт. Возможно, что уже в ближайшем будущем наличие референта ученым-гуманитариям придется показывать и доказывать для внешнего наблюдателя.


Ответ подсказывает Платон, причем даже не в "Федре", как вы могли подумать, а в "Евтидеме”:

— Но, во имя богов, — сказал я, — если мы изучим искусство составления речей, то именно приобретение этого искусства сделает нас счастливыми? — Я этого не думаю, — отвечал Клиний, схватив мою мысль.


В духе Платона Свифт, который в статье тоже упоминается (у него, кстати, описана подобная шайтан-машина), доводит до абсурда мысль о том, что знание хранится в текстах. Но если не в текстах, то где?
6🤔2👍1
Я уже писала (и еще один текст в печати), что Дельта Берроуза с древнегреческим справляется не очень хорошо. Даже более примитивная версия Дельты (расстояние Манхэттена без стандартизации) дает большую точность классификации, а лучше всего, по моим наблюдениям, показывает себя косинусное сходство.

Но, оказывается, есть возможность обойтись и без косинусов: достаточно просто взять корень квадратный из матрицы с частотностями, а потом посчитать тот же Манхэттен. Это называется Eder’s Simple. Наблюдение об эффективности для греков принадлежит не мне.
Но я проверила на своем корпусе, все так. Хотя косинус все равно лучше 📐

В связи с этой математической чертовщиной (квадратный корень? really?) мне вспоминается серия “Смешариков” про лунного ворона. Статистика — точная наука, но главное не перепутать, в какой руке держать бубен 🪶
Please open Telegram to view this post
VIEW IN TELEGRAM
😁103🗿2👍1
На дружественном канале Antibarbari недавно стартовала рубрика, посвященная Appendix Platonica — семи небольшим текстам из платоновского корпуса, которые Диоген Лаэрций называет “бастардами”, νοθευόμενοι.

Это никудышние небольшие сократические диалоги, в основном построенные на заимствованиях из оригинальных сочинений Платона, но порой весьма остроумные. О многих из них высказывалась точка зрения, что это могут быть “школьные” тексты.

Что ж, если это так, то следует признать, что у них там был свой Порядок оформления курсовых и выпускных квалификационных работ, и этот порядок фиксировал нужный для зачета объем. Иначе как объяснить эти цифры:

«Аксиох» 2351 слов
«О справедливости» 1211 слов
«Демодок 1» 908 слов
«Демодок 2-4» 1326 слов
«О добродетели» 1299 слов
«Эриксий» 5388 слов
«Алкиона» 916 слов
«Сизиф» 1587 слов

“Эриксий” выпускается с отличием и рекомендацией на НИРС, “Аксиох” перевыполнил требования по объему, но промахнулся с жанром, “Алкиона” пусть приходит осенью, авторам “Демодока” пожелание делать чуть менее вызывающую копипасту.
🔥9😁2🥰1
Не так много в нашей песочнице поводов применить двусторонний t-test, и вот один из них, говорящий нам, что нет статистически значимой разницы между длиной книги в “Государстве” и в “Законах”. А что это значит? А бог весть.

⚠️ Будьте бдительны, пытаясь повторить этот эксперимент. Не забудьте проверить распределения на нормальность. #задачка
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👻21🙏1
Forwarded from DH CLOUD
DH Awards 2023

DH Awards 2023 - профессиональная общественная премия в Digital Humanities, действует с 2012 года. Премия не привязана к географии, языку, организации или области гуманитарных наук. Никаких финансовых призов, только честь победы и значок для вашего сайта.

Номинировать можно себя или коллег. Важно только, чтобы ресурс/статья/проект был запущен/завершен/обновлен/создан в 2023 году. Дедлайн 28 января.

Номинации этого года:
- DH для развлечения
- DH для визуализации
- DH-провал года
- короткий DH-формат: блог, статья, видео
- DH-инструмент или набор инструментов
- DH-набор данных
- DH-образование

Поделитесь ссылкой на сайт премии https://dhawards.org/dhawards2023/nominations/ или этим постом с коллегами.

Вопросы можно задавать @dinaraamirovna
🔥5
Сегодня пришли результаты студенческой оценки преподавания (СОП), из которых следует, что с первым своим курсом по программированию на R я вроде бы справилась. Спасибо, дорогие студенты, за ваши отзывы. Я их все прочитала, а некоторые даже по два раза 🧡
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥317
🧩 Задачка для тех, кому не спится

⭐️ Византийский компилятор Стобей составляет антологию, куда включает отрывки из подлинных и подложных диалогов Платона (условно подлинными будем считать все, что Трасилл включил в тетралогии; условно подложными — все, что вошло в Appendix Platonica).

⭐️ Подложные он процитировал 40 раз, а подлинные — ок. 400. Опустим цифры, которые никому не интересны.

Можно ли сказать, что есть зависимость между участием в тетралогиях и числом цитат у Стобея?

💭 Построим линейную модель, в которой зависимой переменной будет число цитат, а независимыми — группа (t = tetralogy, a = appendix) и число слов в диалоге.

☑️ На уровне значимости < 0.001 устанавливаем связь между числом слов и числом цитат.

На уровне значимости 0.05 отвергаем связь между участием в тетралогиях и числом цитат.

🌷 Многозначительный вывод: не важно, кто ты, важно, сколько ты нагнал знаков. #задачка

Идем спать в осознании того, что полночи потрачены на полную фигню и забивание цифирек в эксель.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
В пятницу 2 февраля в 12.20-12.40 по Москве буду здесь с докладом “Возможна ли цифровая история философии?”. Спойлер: кажется, нет.

Нужна регистрация. Тайминг не предполагает дискуссии, а поспорить хотелось бы — можно, например, в комментариях под этим постом по итогам доклада. Мне бы даже хотелось услышать, что я не права.

upd. Скажем так, я даже сознательно заостряю, потому что мне кажется, что темпы внедрения этого всего в наши программы и планы опережают темпы осмысления. последствия для отрасли могут быть серьезны, но никто сейчас всерьез не думает — какими именно
10🔥2
RAntiquity
В пятницу 2 февраля в 12.20-12.40 по Москве буду здесь с докладом “Возможна ли цифровая история философии?”. Спойлер: кажется, нет. Нужна регистрация. Тайминг не предполагает дискуссии, а поспорить хотелось бы — можно, например, в комментариях под этим постом…
Обещанная запись доклада. В последовавшей дискуссии Полина Колозариди охарактеризовала мое выступление как “хорошо фундированный алармизм”, и мне бы хотелось верить, что некоторый фундамент там действительно есть. Не претендую на визионерство, но историкам философии будет непросто вписаться в “цифровой поворот”, а те, кто впишутся, возможно, выйдут с полосы препятствий уже не историками философии.
❤‍🔥17👍32
Forwarded from DH CLOUD
🗣 Сооснователь DH CLOUD Борис Орехов запускает подкаст «Лига Айвы», который целиком будет посвящен университетам, организации их пространства, горизонтальным связям ученых.

Университет дорог нам как явление, как важная часть нашей жизни. Без чего в университете не обойтись? Что особенного в людях университета? Что помогает им говорить друг с другом?


Цифровых гуманитарных исследований там не будет. Зато в качестве гостей будут цифровые гуманитарные исследователи. Так, 15 февраля выйдет интервью с Д. А. Скоринкиным, а 14 марта — с А. Ю. Володиным.

Сегодня вышел первый эпизод подкаста — беседа с лингвистом Н. А. Слюсарь о СПбГУ, Мэрилендском университете и университете Утрехта. Можно послушать разговор на ▶️ YouTube и на всех подкастерских платформах.

За выходом новых эпизодов можно следить в 🚀 телеграм-канале проекта.
У подкаста есть 🌐 сайт с расписанием выхода эпизодов и полными транскриптами разговора.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥91
💡 Задачка на распределение Пуассона

✈️ Каждый четверг я выкладываю в дружественном канале Antibarbari несколько страниц латинского текста, и каждую неделю ученейшие подписчики находят там ошибки. В среднем они находят 1 ошибку на 10 страниц текста с картинками.

Вопрос: какова вероятность того, что на следующей неделе ученейшие подписчики не найдут ни одной ошибки, если в «отложке» у меня снова запланировано 10 страниц? #задачка

Считайте ошибки независимыми.

⚙️ Решение на языке R: dpois(0, 1)

Ответ: примерно 37%
Please open Telegram to view this post
VIEW IN TELEGRAM
😁61👍1
RAntiquity
Винценты Лютославский (1897), выделил 500 признаков позднего стиля Платона (синтаксические, морфологические, лексические, ритмические, драматические и др.), присвоив каждому одну из 4-х "степеней значимости" , и сгруппировал диалоги по "стилистической близости"…
Мне уже приходилось рассказывать о том, что количественные исследования в платоноведении начались во второй половине 19 в., когда никаких компьютеров не было даже в планах, но вот чего вы скорее всего не знали — несколько таких работ написаны на латыни. Такова De Platonis dialogis Quaestiones Chronologicae (1896) Фон Арнима — всего 28 страниц текста, толковому латинисту чтения на одну чашку кофе. С появлением многомерного анализа исследование уже потеряло всякий интерес с точки зрения выводов, но зато — смотрите! — как можно писать об этом на латыни: in maiore harum formularum frequentia conspirat, как прекрасно-то. Когда-нибудь я тоже обязательно попробую пройти в самое сердце Гримпенской трясины.
9❤‍🔥5
Forwarded from THALATTA ΘΑΛΑΣΣΑ
интересный факт ко дню святого валентина: начиная с 15 века, во Франции изданий Овидия выходило больше, чем изданий Вергилия. зато когда выбирали, чье собрание сочинений печатать первым, Вергилия предпочитали Овидию.
💘9
В дружественном канале пишут, что курс “R для антиковедов”, снятый доцентом Алиевой в качестве духовного упражнения, оказался кому-то полезен и помог при поступлении. Вообще все, что я делаю, я делаю для себя, поэтому мне всегда удивительно слышать, что и не для себя, оказывается, тоже. Там надо бы все полностью переделать и доснять продолжение, желательно кому-то не с такими кривыми руками. Но жизни мышья беготня … ты меня. Как есть.
23❤‍🔥2🍓2👍1
DH-ученый в интерьере: Даниил Скоринкин в новом подкасте Бориса Орехова рассказывает про университетский хронотоп. Хороший разговор и хорошо, что университет стал темой целого подкаста 🎓
❤‍🔥4
Вот вам снова филологическая задачка, основанная на реальных событиях.

🤍 На прошлой неделе доцент Алиева читала латинские стихи: в среду 14 февраля — Овидия, а в субботу 17 февраля Проперция (об этом сообщалось в федеральной прессе дружественном канале Antibarbari).

🤍Во время чтения выяснилось, что элизия / афэреза встречается на каждые пять стихов у Проперция с такой частотой:

p <- c(2, 2, 1, 2, 1, 1, 1, 0, 3)

А у Овидия, тоже на каждые пять стихов, с такой:

o <- c(0, 1, 0, 3, 1, 0, 1, 0, 0)

🤍 У доцента Алиевой возникло смутное ощущение, что Проперций чаще жертвует гласными, чем Овидий. Но ощущение — это не наш метод! Она решила узнать: есть ли статистически значимая разница между средним числом элидированных стихов у Овидия и у Проперция?

🤍 Ответ на волнующий ее вопрос доцент Алиева искала так:

1. Посчитала среднее число элизий на 5 стихов:

p_means <- p / 5
o_means <- o / 5

2. Вспомнила, что, согласно ЦПТ, средние выборочных средних распределены нормально, поэтому можно применить t-test:

t.test(p_means, o_means)


🤍 В ответ машина сообщила:

t = 1.75, df = 15.754, p-value = 0.09957
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.03312005 0.34423116
sample estimates:
mean of x mean of y
0.2888889 0.1333333

🤍 Что это значит? Ноль попадает в доверительный интервал, так что мы не можем отвергнуть нулевую гипотезу о равенстве средних. Как быть? Посидеть подольше, а не лениться, как девочка Маничка из рассказа Тэффи “Экзамен”. #задачка
Please open Telegram to view this post
VIEW IN TELEGRAM
13
Коллеги из Питера пригласили что-нибудь цифровое рассказать, и я не могла отказаться) Вспомнила софиста Гиппия, который гастролировал по всей Греции с лекциями по мнемотехнике и мастер-классами по плетению бисером. А чем я хуже?  PS: там три часа!

***

29 февраля Школа искусств и культурного наследия Европейского Университета в Санкт-Петербурге приглашает на открытую лекцию Ольги Алиевой «Тематическая модель: как спланировать и провести свое первое исследование».

Тематическое моделирование — один из популярных методов анализа текстовых данных, который позволяет находить в коллекции документов некоторое количество «скрытых» там топиков. В лекции кандидат филологических наук, доцент НИУ ВШЭ Ольга Алиева расскажет о том, как тематические модели применяются в гуманитарных дисциплинах от политической истории до литературоведения, и поделится собственным опытом построения тематической модели.

Мероприятие состоится онлайн, для участия зарегистрируйтесь на Timepad.
15🔥5❤‍🔥2👍1