RAntiquity
1.09K subscribers
296 photos
11 videos
5 files
546 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
Открыт прием заявок на летнюю школу “Душа и процессор”, до 25 мая студенты ОП “Философия” и ОП “Культурология” могут подать заявки. Вся информация по ссылке, а от себя добавлю, что мы с Георгием Морозом планируем для участников мастер-класс по работе в R (2 июня). Тематический.
🔥8
🌸 Публикуем шестую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (НИУ ВШЭ).

С лекцией о стилометрии выступила доцент Школы философии и культурологии НИУ ВШЭ Ольга Алиева @rantiquity. Она рассказала о том, как разивались методы стилометрического исследования — от ручных подсчетов в XIX в. до нейросетей в наши дни.

⭐️ Ссылка на презентацию к лекции.

Встречу провел доцент Школы лингвистики НИУ ВШЭ, руководитель магистерской программы «Цифровые методы в гуманитарных науках» Борис Орехов.

Следующая лекция курса состоится 25 мая, следите за анонсами.

#criticaldh #курсы #магистратура
Please open Telegram to view this post
VIEW IN TELEGRAM
11
⭐️ Публикуем седьмую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (НИУ ВШЭ).

С лекцией о больших языковых моделях выступил аспирант Школы лингвистики НИУ ВШЭ Егор Сальников. В лекции были рассмотрены история развития языковых моделей (от трансформеров до современных LLM), их особенности и подходы к применению, а также некоторые из существующих методов детекции сгенерированных текстов, в том числе с помощью стилометрической дельты.

🌺Встречу провела доцент Школы лингвистики НИУ ВШЭ Анастасия Бонч-Осмоловская.

Следующая лекция курса состоится 25 мая, следите за анонсами.

#criticaldh #курсы #магистратура
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Цифровой Чехов: зачем и как именно создается семантическое издание произведений Антона Павловича

Уже в эту среду, 22 мая, приглашаем вас на заседание онлайн-семинара «Цифровая среда» с профессором кафедры лингвистики и профессиональной коммуникации ЮФУ Еленой Севериной.

Chekhov Digital – семантическое издание Полного собрания сочинений и писем А. П. Чехова, которое разрабатывается совместно Южным федеральным университетом и Центром гуманитарных исследований НИУ ВШЭ.

На семинаре Елена Михайловна расскажет о
→ процессе трансформации литературных произведений в структурированные машиночитаемые данные
→ методах и инструментах, которые реализуются в проекте Chekhov Digital
→ перспективах использования семантических данных для исследовательских и образовательных целей и планах по расширению проекта.

В роли дискутанта выступит доцент Школы лингвистики НИУ ВШЭ Анастасия Бонч-Осмоловская.

Ведущий семинара – доцент кафедры исторической информатики МГУ, руководитель стратегического проекта ИЦГИ (DHRI) Андрей Володин.

🟢 Начало: 15:00 (мск) / 19:00 (крск)

❗️Напоминаем о том, что на мероприятие нужно предварительно зарегистрироваться.

🟢 Посмотреть записи предыдущих выпусков «Цифровой среды».

#цифроваясреда #литература #семантика #смотреть #слушать
Please open Telegram to view this post
VIEW IN TELEGRAM
5
🌸 В 2011 году в журнале Science выходит программная статья группы ученых под названием «Квантитативный анализ культуры с помощью миллионов оцифрованных книг» (Quantitative analysis of culture using millions of digitized books) (Michel и др., 2011). В аннотации к статье авторы вводят новый термин – культуромика, который по их мысли должен дать название новому научному направлению – исследованию культуры с помощью текстовых больших данных.

Что такое культуромика, можем ли мы через 10 лет после выхода статьи говорить о том, что такое направление действительно сформировалось? Каков реальный вклад авторов статьи в исследование культуры? И можно ли измерять культурные изменения с помощью сравнения частотности слов?

Об этом поговорим на лекции А.А. Бонч-Осмоловской, доцента Школы лингвистики ВШЭ, со-основательницы сообщества DH СLOUD. Лекция состоится онлайн 25 мая в 14.40–16.00 по московскому времени; ссылка для подключения.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
Между тем, на сайте ФГН выложили программу ежегодной студенческой конференции, из которой следует, что завтра в 11.00-13.00 я модерирую секцию под названием “Философия и цифровизация”. Если вам есть что сказать или подумать по этому поводу, приходите на Басманную в аудиторию 512.

Про трансляцию и запись ничего, к сожалению, не знаю.
6🔥3
«Историческая информатика – 2024»: летняя школа для цифровых историков

Отличный вариант провести июнь с пользой для тех, кто даже летом не мыслит свою жизнь без исторических исследований в диджитале.

27-30 июня исторический факультет МГУ имени М.В. Ломоносова и Ассоциация «История и компьютер» принимают заявки на участие в IV международной летней школе молодых ученых по исторической информатике. Школа будет проходить в дистанционном формате.

Основные мероприятия Школы:
27 июня – лекционный день. Ведущие российский ученые прочтут лекции по актуальным проблемам исторической информатики.
28-29 июня – дни мастер-классов.
30 июня – конференционный день. С докладами выступают участники Школы.

Кого приглашают?

Молодых ученых, студентов и аспирантов любых форм обучения.

Как зарегистрироваться в школу?

Зарегистрироваться можно здесь до 26 июня.
Заявки с докладом принимаются до 17 июня.

И еще немного важной информации:

Участникам летней школы выдадут сертификаты от исторического факультета МГУ и Ассоциации «История и компьютер» (для этого необходимо прослушать не менее четырех лекций, посетить мастер-класс и принять участие в конференции).

Лучшие доклады конференции эксперты Школы рекомендуют для публикации в Бюллетене Ассоциации «История и компьютер».

#Цифроваяистория #летняяшкола #история
🔥61
🔔 Публикуем восьмую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (НИУ ВШЭ).

С лекцией о культуромике выступила А.А. Бонч-Осмоловская, доцент Школы лингвистики ВШЭ, со-основательница сообщества DH СLOUD.

В 2011 году в журнале Science вышла программная статья группы ученых под названием «Квантитативный анализ культуры с помощью миллионов оцифрованных книг». В аннотации к статье авторы ввели новый термин «культуромика», который, по их замыслу, должен был дать название новому научному направлению — исследованию культуры с помощью текстовых больших данных. Можем ли мы через 10 лет после выхода статьи говорить о том, что такое направление действительно сформировалось? Можно ли измерять культурные изменения с помощью сравнения частотности слов?


🌷 Встречу провел доцент Школы лингвистики НИУ ВШЭ, руководитель магистерской программы «Цифровые методы в гуманитарных науках» Борис Орехов.

Следующая лекция курса состоится 1 июня, следите за анонсами.

#criticaldh #курсы #магистратура
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍3👏2
Доклад 27.05.2024 в ОЦАД на тему “Цифровые методы для работы с античными и средневековыми текстами”. Трансляции не было, запись на диктофон, презентация записана с экрана. Надеюсь, будет кому-то полезно. Ссылка на презентацию.

upd. Мне понравился момент, когда мы от вопросов о том, что такое TEI XML, перешли к непринужденной беседе о выборе диалекта в сочинениях Григория Богослова.
12
➡️ Живой язык непрерывно меняется. По каким законам происходят эти изменения, что влияет на их скорость, можно ли их предсказать – на все эти вопросы современная лингвистика умеет давать лишь фрагментарные ответы. Это и неудивительно: для того, чтобы составить более полную картину, нужно собрать и проанализировать очень много данных. Вручную это делать очень сложно: нужно просматривать огромные массивы текстов, написанных в разные периоды времени, поэтому сейчас особенно активно разрабатываются компьютерные методы семантического анализа текста.

📝 1 июня 2024 г. с лекцией “Эмбеддинги и историческая семантика” выступит доцент Школы лингвистики НИУ ВШЭ, научный сотрудник Международной лаборатории языковой конвергенции, академический руководитель образовательной программы “Лингвистическая теория и описание языка” Дарья Рыжова.

💡Лекция пройдет (с перерывом) на платформе Zoom в 13.00-14.20 и 14.40-16.00 по московскому времени.

🔗Ссылка для подключения здесь.

#criticaldh #курсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43💘3
🌸 Публикуем девятую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (НИУ ВШЭ).

О том, как лингвисты изучают изменения значений слов и как в этом могут помочь компьютерные методы, рассказала доцент Школы лингвистики НИУ ВШЭ, научный сотрудник Международной лаборатории языковой конвергенции, академический руководитель образовательной программы "Лингвистическая теория и описание языка" Дарья Рыжова.

На этом наш курс не заканчивается: в следующую субботу нас ждет последняя лекция, оставайтесь на связи. #criticaldh #курсы
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍3🔥2
Для тех, кто вчера пропустил наш с agricolamz блистательный мастер-класс по работе в R (от нуля до первой нейросети) в Вороново, делимся материалами: https://agricolamz.github.io/2024.06.02_text_analysis/

Мастер-класс проводился для философов и культурологов, так что датасет мы собрали подходящий: корпус переводов Платона.
7🔥6👍1
Как позиционируются гуманитарные науки исторически и в чем их специфика? Помогает ли она понять особенности контекста, в котором существуют цифровые методы? Правда ли, что соединение методов разных наук дает эффект междисциплинарности?

✔️Свои ответы на эти вопросы предложит в лекции доцент Школы лингвистики НИУ ВШЭ, руководитель образовательной программы «Цифровые методы в гуманитарных науках» Борис Орехов.

📌 Встреча состоится 8 июня 2024 г. в 13:00-14:20 по московскому времени (ссылка). #criticaldh
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73
Премастерс-программа DH-центра ✏️

Абитуриентам — привет, и остальным интересующимся — тоже!

Открываем предварительную регистрацию на премастерс-программу лета-2024.

В магистратуре принято читать. В экзаменационных билетах и в программах курсов — есть списки для чтения. Но что читать? Как читать? Зачем читать и писать самостоятельно? Ведь есть много технологичных инструментов для взаимодействия с литературой. Более того, в магистратуре по цифровым методам в гуманитарных исследованиях, мы такие инструменты и интерфейсы создаём.

Чтобы вместе подготовиться к экзаменам и читать не только из необходимости, но и из желания писать дальше — мы организуем премастерс-программу.

Вместе мы будем работать с чтением как практикой, предполагающей продолжение в виде письма. Ведь когда читаешь теоретический текст, хочется понять, что было дальше, и самим — придумать это «дальше». Этот процесс чем-то похож на написание фанфиков. Поэтому мы предлагаем работать с текстами, изучая разные способы чтения и письма, принятые в эпоху невыносимо лёгкой воспроизводимости всего, что угодно.

Встречи пройдут в июне и июле. Подробную программу напишем в ближайшее время.

⭐️ А пока — регистрируйтесь по ссылке. До скорых встреч и чтений!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍1💘1
Для перевода названия населенного пункта "Вороново" на латынь можно использовать следующий вариант:

Corvinum

Объяснение:

- "Вороново" происходит от слова "ворона", поэтому латинский перевод будет базироваться на этом.
- Слово "корвус" (corvus) в латыни означает "ворона".
- Путем добавления окончания "-inum" образуется прилагательное "корвинум" (Corvinum), что означает "принадлежащий воронам" или "связанный с воронами".

Таким образом, латинский вариант названия населенного пункта "Вороново" будет Corvinum.
6🔥2👎1
Forwarded from DH CLOUD
Широко известен эффект, который дают операции с векторами слов (о них можно почитать в главе про анализ текста в монографии Цифровые гуманитарные исследования и послушать в лекции Д. А. Рыжовой на курсе Критическое введение в Digital Humanities в НИУ ВШЭ): если вычесть из вектора слова «король» вектор слова «мужчина» и прибавить вектор слова «женщина», то получится вектор, близкий к вектору слова «королева».

Ученые из DH CLOUD выяснили, что этот эффект был предсказан 🔮 в классической русской литературе, а именно — в пьесе Гоголя "Женитьба": "Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожалуй, прибавить к этому ещё дородности Ивана Павловича".
😁8
💎 Как говорил Гераклит, начало и конец -- одно и то же, и наш курс, закруглившись, пришел к вводной лекции. Мы сделали полный круг: поговорили о различных инструментах и подходах в DH, а теперь пришло время посмотреть на отрасль в целом.

Свои рассуждения о DH в общенаучном контексте предложил руководитель магистерской программы “Цифровые методы в гуманитарных науках”, доцент Школы лингвистики НИУ ВШЭ Борис Орехов.

Одним из неожиданных выводов лекции стала мысль о том, что междисциплинарность невозможна, а самые интересные цифровые исследования посвящены традиционным вопросам гуманитарных дисциплин. Когда же DH пытаются быть "просто" набором цифровых инструментов, это выглядит глупо наивно.

Вот такой парадоксальный вывод курса получился. Видео всех лекций вы можете найти на сайте: https://criticaldh.ru/

На следующей неделе планируем еще одно мероприятие, оставайтесь на связи. #criticaldh
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73❤‍🔥1
Stylo: какие слова отличают один текст от другого?

Stylo — программа для исследования стилистики текста. «‎Системный Блокъ»‎ подготовил для вас уже третий гайд по этому инструменту (вот ссылки на первые два, базовый и продвинутый). На этот раз разбираемся с функцией oppose(), которая помогает найти отличия между лексическими составами двух корпусов текстов. Например, выяснить, чем Толстой отличается от Достоевского, а Тургенев — от Гончарова.

Для каждого из корпусов oppose() показывает, какие слова характерны для входящих в него текстов и в то же время редко встречаются во втором наборе. Также функция может учитывать дополнительный, контрольный, корпус — его добавляют, если нужно проверить точность результатов или определить, какой из двух исследуемых корпусов больше похож на контрольный (используется при определении автора текста).

oppose() анализирует текст по фрагментам (длины можно выбрать самостоятельно), и благодаря этому учитывает распределение слов в тексте: даже если какое-то слово встречается часто, но лишь в одном фрагменте длинного текста, оно не будет отмечено как характерное для всего корпуса.

В полной версии гайда мы сравнили романы Тургенева «Накануне» и «Дворянское гнездо» с «Обрывом» и «Обыкновенной историей» Гончарова, добавив контрольный корпус из «Обломова» и «Рудина». В результате получилось, что у Тургенева персонажи больше говорят (для выбранных романов характерны слова типа промолвить, воскликнуть, возразить), а у Гончарова — смотрят (романы отличают слова поглядеть, смотреть, посмотреть, взгляд).

Если изменить параметры визуализации, то можно получить график, где будет показано, насколько далеко отстоят друг от друга тексты из разных корпусов — то есть, насколько сильно они отличаются и, наоборот, какие похожи друг на друга. Предлагаем читателям угадать, какие выводы удалось сделать на основе получившегося у нас графика.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71