RAntiquity
1.09K subscribers
296 photos
11 videos
5 files
546 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
👆 Сегодня рекомендуем вам посмотреть запись семинара в рамках проекта ВШЭ Data Culture «Зачем гуманитарию ИТ-технологии?»

С докладом «Digital Classics вчера и сегодня» выступила Ольга Алиева, доцент Школы философии и культурологии, руководитель проекта «Цифровая античность», Antibarbari и RAntiquity. В нём она сравнила Грегори Крейна с Альдом Мануцием и рассказала про «Конкорданс к Ливию» Дэвида Паккарда Мл. Запись семинара можно найти на Youtube-канале ФКН ВШЭ, а презентация доступна по ссылке.

🧑‍💻 Для многих наших студентов сейчас актуальна тема IT и использования цифровых инструментов, поэтому делимся с вами интересными и полезными ресурсами о том, как можно и нужно применять цифровые методы в философии:

🔘 Проект Project Vox, преследующий цель с помощью IT расширить и бросить вызов традиционному философскому канону путем повторного открытия и воссоединения философов, которые были маргинализированы и исключены из истории.

🔘 Проект Philosophy Data Project применяет современные методы анализа данных к великим текстам в истории философии. На сайте представлен ряд способов, с помощью которых ученые, студенты и обычные люди могут изучать эти тексты, используя самые современные доступные инструменты.

🔘 Проект «Цифровая античность», объединяюий исследователей, преподавателей и студентов, которые не только осваивают существующие цифровые инструменты, полезные в научной и образовательной деятельности, но и стремятся к развитию новых подходов и методов в этой области

🔘 Статья Томаса Кёнтгеса "Measuring Philosophy in the First Thousand Years of Greek Literature", в которой автор применил тематическое моделирование LDA для обучения машины автоматической идентификации философских отрывков в корпусе, представляющем большинство дошедших до нас произведений первой тысячи лет греческой литературы.

#нашиисследователи #полезныересурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
Forwarded from Kandinsky
Результат генерации по запросу "Существо с телом литературного критика, головой статистика и растрёпанной шевелюрой Стивена Пинкера"
👾3
Программа.pdf
4 MB
Между тем, организаторы конференции Terra Hominis поделились программой…  #выступления
🔥1
…из которой следует, что мы с вами скоро снова увидимся.
❤‍🔥4
Для тех, кто еще не наигрался в алгоритмы, совершенно залипательная вещь. Определяет пол и темперамент по текстам. Что там за начинка, не знаю, но съедает и русский, и английский в любом объеме. В русских заметках я, кстати, импульсивная женщина. Зато в английских статьях трудолюбивый мужчина.

Впрочем, я скармливала совсем крохи — но там есть инструкция, как скачать весь блог. Можно загружать зипом. Скажем, познакомились вы с кем-то и хотите составить психометрический профиль. Или думаете, брать ли человека на работу. Пожалуйста. Ante amicitiam iudicandum.

https://applymagicsauce.com/demo

#приложения
🔥86👍2
Пока идет пора сдачи курсовых, кодировать сильно не успеваю, но расскажу поучительную историю о распределениях.

Года два назад, только начиная учить статистику, я решила, что пора уже применять в жизни полученные знания. А мне как раз надо было отчитываться по гранту. И прежде чем подать статью в журнал, я пошла на сайт https://apasurvey.philx.org/, забрала оттуда сведения о сроках рассмотрения статьи и выбрала такой журнал, чтобы с 95% попасть в интервал до 8 мес. Не помню, какое распределение брала, скорее всего, Стьюдента. Все посчитала, подала статью, жду.

Жду и жду. На исходе 10-го месяца пишу в редакцию: кхе-кхе, вы про меня не забыли? А они отвечают: забыли! Ваша статья принята к печати. Извините, дескать, ковид, мы все умерли.

С тех пор я хотя и верю в p-значения, но на всякий случай всегда беру с собой зонтик. #статистика #распределения
9
Forwarded from Antibarbari HSE (Olga Alieva)
👾В день труда предлагаем потрудиться: освоить библиотеку leaflet для создания интерактивных карт и векторизировать условия с case_when().

Нет ничего лучше, друзья, векторизированных условий. Когда вы их освоите, код станет легким и элегантным. Меньше стучания по кнопкам, больше торжества мысли по ссылке.
🔥2👍1
🆕 Сегодня рекомендуем вам посмотреть запись пленарного доклада «Цифровые инструменты и методы: в чем их польза и как им обучить гуманитария?»

📕 Выступление прошло в рамках Междисциплинарной конференции молодых исследователей «Terra hominis», состоявшейся на базе Факультета гуманитарных наук НИУ ВШЭ 27-28 апреля. Об этом мероприятии мы уже писали в наших постах.

📌С докладом выступили Борис Валерьевич Орехов руководитель образовательной программы Цифровые методы в гуманитарных науках и Ольга Валерьевна Алиева, доцент Школы философии и культурологии, руководитель проектов «Цифровая античность», Antibarbari и RAntiquity.

В выступлении докладчики поделились актуальностью для студентов темой IT и использованию цифровых инструментов, дали ссылки на интересные и полезные ресурсы о том, как можно и нужно применять цифровые методы в философии и других гуманитарных науках.

📎 С записью можно ознакомиться по ссылке

#нашиисследователи #полезныересурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Исследуем альтернативу традиционным циклам. Code Snack №7: Видео. #purrr Подробнее здесь
1
Forwarded from Antibarbari HSE (Olga Alieva)
В этот цифровой понедельник публикуем последнее видео из модуля 5 курса “R для антиковедов”. Это модуль весь был посвящен письмам Цицерона Аттику. Мы научились анализировать эмоциональную тональность, лемматизировать греческий и латинский тексты и делать интерактивные карты.

Осталась самая малость — опубликовать нашу карту на сайте https://antibarbari.ru/. Показываю самую что ни на есть изнанку этого модного ресурса для бескомпромиссных интеллектуалов.

А заодно ловите ссылочки на интересные датасеты, на которых можно потренироваться делать свои карты:
1) Ancient Greek and Roman Sites in Turkey
2) An Urban Geography of the Roman World
3) An R package that collects data for the ancient world including territorial extents from the Ancient World Mapping Centre, routes and places from Orbis, roads and shipwrecks from the Digital Atlas of Roman and Medieval Civilizations, and mints from Nomisma.
4) Римские рудники, кораблекрушения, винные прессы и еще всякая всячина от The OXREP Databases.

Высший пилотаж: почти 6 млн римских монет на карте: https://chre.ashmus.ox.ac.uk/

Мы будем рады видеть, что у вас получается, здесь и на канале RAntiquity. Если что, для публикации карты не обязателен сайт 😉
🔥2
Это я так учу, что математическое ожидание суммы случайных величин можно представить как сумму их математических ожиданий. https://youtu.be/uhsnlwRASYo
👍1😁1
В компьютерных методах обработки текста есть такое понятие, как “мешок слов”. Это когда (никогда не начинайте определение с “это когда”!) мы рассматриваем текст как набор слов, не учитывая их порядок и взаимные связи. Сегодня неожиданно встретила это выражение у Платона. Сократ говорит Феодору: “Экий же ты любитель потолковать, если и меня по доброте своей почитаешь каким-то мешком (με οἴει λόγων τινὰ εἶναι θύλακον), из которого я без труда могу извлечь любое рассуждение и заявить, что все это не так”.

Так что вот вам “мешок слов” (или аргументов в данном случае): θύλακος λόγων / ὀνομάτων. Правильно же говорят, что в Древней Греции все есть.
👍63😁1😱1
Forwarded from Antibarbari HSE (Olga Alieva)
📆 17 мая в 18:10 (мск) в Греко-латинском клубе Antibarbari состоится встреча со Светланой Яцык, к.и.н., научным сотрудником Лаборатории медиевистических исследований НИУ «ВШЭ», участницей проекта Distinguo.

Тема встречи: Распознавание рукописного текста (HTR): история, перспективы, текущие проекты

За последние несколько лет развитие технологий распознавания рукописного текста (HTR) сделало автоматизированную транскрипцию древних документов доступной для широкого круга ученых. Существующее программное обеспечение позволяет безболезненно развертывать конвейеры HTR, а данные для обучения моделей (ground truth) становятся все более доступными, что дает ученым возможность быстро получать транскрипции в объемах, которые ранее потребовали бы годы интенсивной работы.

На этом заседании клуба мы обсудим существующие методы автоматической транскрипции, познакомимся с готовыми инструментами (Tesseract, Transkribus, kraken / eScriptorium) и проектами, которые их применяют.

В частности, на примере платформы eScriptorium мы разберем, как
- готовить данные для тренировки;
- обучать модели и делать их тонкую настройку (fine-tuning);
- оценивать качество транскрипции;
- использовать «грязную» неотредактированную транскрипцию для решения дальнейших исследовательских задач. #antibarbari_colloquia

Встреча пройдет на платформе Zoom. Ссылка для подключения.
1
Вот еще какие интересные штуки коллеги делают. #сети
Forwarded from Vox mediaevistae
​​В рамках моего увлечения анализом сетей и постсоветской медиевистикой возникла идея посмотреть на то, на какие группы распадаются отечественные исследователи, отталкиваясь не от того, кто кого цитирует, а от того, кого особенно часто можно встретить в сносках в рамках одной статьи.
У Артема Клюева нашелся студент, который согласился подготовить данные. Мы решили начать с «Казуса» (руководствуясь его меньшим в сравнении со «Средними веками» объемом и гипотезой о большей гомогенности его авторов). Пока что удалось обсчитать первые 4 выпуска, и уже выходит любопытно: на картинке — авторы, которые в этих четырех номерах цитировались вместе от 25 до 75 раз.
🔥2
Простите, но это очень смешно получилось #LSA
2🎄2🔥1
Forwarded from Antibarbari HSE (Olga Alieva)
👾 В этот цифровой понедельник мы начинаем новый модуль курса “R для антиковедов.” Модуль будет посвящен методу латентно-семантического анализа. Этот метод основан на векторном представлении слов и документов.

В англоязычной литературе такие представления называют эмбеддингами. По-английски embedding означает «вложение». Представляя объект в виде вектора, мы как бы «вкладываем» его в векторное пространство, что позволяет найти «ближайших» к нему соседей.

LSA лежит в основе многих рекомендательных механизмов. Почему бы не сделать такую же штуку, но не для товаров или фильмов, а, скажем, для древних текстов? Прочитали «Категории» Аристотеля? Вам может понравиться «Исагога» Порфирия! Рекомендуем также заглянуть в Боэция.

Кодировать начнем на следующей неделе, а пока публикую вводное видео и рекомендую прочитать статью “Как понять, о чем текст, не читая его”, на портале “Системный блок”.
👍5