RAntiquity
1.09K subscribers
297 photos
11 videos
5 files
547 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
Channel photo updated
Forwarded from Ivan Begtin (Ivan Begtin)
Как работать с данными гуманитариям, например, историкам? Где взять данные, как их подготавливать, какие банки данных и сервисы доступны онлайн? Подборка опубликованных наборов данных по древней истории։
- World-Historical Dataverse [1] от University of Pittsburgh World History Center, коллекция наборов данных посвящённых истории распространения языков, крупным историческим событиям и древней географии

- Project MERCURY datasets [2] коллекция набора данных проекта Меркурий, посвящённого компьютерному моделированию Древнего Рима

- Re3Data Ancient Cultures [3] каталоги и базы данных по древним культурам собранные в проекте Re3Data

- Europeana Datasets. Overview for Ancient World [4] наборы данных по древнему миру в проекте Европеана

- Nomisma datasets [5] проект-агрегатор открытых данных по нумизматике, включая коллекции древних монет

- Open-archaeo: A list of open source archaeological software and resources [6] каталог открытых наборов данных связанных с археологией

- Digital Humanities Platform of Shanghai Library [7] каталог связанных данных по древней истории при библиотеке Шанхая

Ссылки։
[1] https://dataverse.harvard.edu/dataverse/worldhistorical
[2] https://projectmercury.eu/datasets
[3] https://www.re3data.org/search?subjects[]=101%20Ancient%20Cultures
[4] https://pro.europeana.eu/timecoverage/ancient-world
[5] https://nomisma.org/datasets
[6] https://open-archaeo.info/tags/datasets/
[7] https://data.library.sh.cn/index

#opendata #digitalhumanities #ancienthistory #datasets #openscience
Как размечаются стихи в TEI #xml
Forwarded from Antibarbari HSE (Olga Alieva)
👾 С вами цифровой понедельник — и новый модуль, полностью посвященный письмам Аттику Цицерона.

В этом модуле мы научимся:
✔️ лемматизировать латинский текст, то есть приводить слова к словарной форме
✔️оценивать эмоциональную тональность писем с использованием лексикона Latin Affectus
✔️строить таймлайн, чтобы понять, как менялось настроение Цицерона во времени
✔️извлекать из писем греческий текст и лемматизировать его тоже
✔️проверим графически, есть ли связь между эмоциональной окрашенностью письма и количеством греческих слов
✔️узнаем, откуда Цицерон написал Аттику больше всего писем
✔️ построим интерактивную карту Leaflet и опубликуем ее на сайте Wordpress

Прежде чем смотреть видео, вы можете скачать xml с письмами и весь код из репозитория проекта на Github.
👍1
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Сегодня в цифровом понедельнике боремся с сокращениями в письмах Аттику.

Все эти календы и иды, консулы и трибуны, спрятанные за одной буквой луции, сокращенные приветы и “будь здоров” — от всего безжалостно избавляемся, потому что проще так, чем долго объяснять токенайзеру, что точка — это не конец предложения.

👀 Видео по ссылке

🔗 Код по ссылке

🤔 Кстати, по ходу работы выяснилось, что в письмах Цицерона можно найти сокращения для всех месяцев, кроме Quintilis. Почему-то Quintilis (будущий июль) никогда не сокращается.

#regex #цицерон
Добро пожаловать на канал, дорогие читатели!

Многое из того, что будет здесь публиковаться, носит черновой или, как говорится, разведывательный характер. Таков и этот челлендж по составлению индекса: начиная его, я пока не очень хорошо понимаю, куда приду.

Может быть, ничего не получится. Но это тоже результат.

https://vk.com/video-211800158_456239288

Для обсуждения у канала есть чат.
👍1
🖥 В рамках семинара, посвященного IT-технологиям в гуманитарных науках, выступит доцент Школы философии и культурологии, Ольга Валерьевна Алиева

⌨️ О.В. Алиева, кандидат филологических наук и руководитель проекта «Цифровая античность» представит доклад «Digital Classics вчера и сегодня». Ее выступление будет посвящено цифровым библиотекам, формированию электронных каталогов, компьютерному анализу и автоматическому сопоставлению текстов, а также вопросу о том, как программирование и анализ данных можно применять в философии.

🗒 Ольга Валерьевна уже давно занимается Digital Humanities в рамках вышкинского греко-латинского клуба «Antibarbari HSE», где регулярно выходит рубрика «Цифровой понедельник». Также, недавно она решила создать отдельный канал «RAntiquity», посвященный исключительно цифровой части проектов Antibarbari.

🏢 Мероприятие пройдет 21 марта в 18:10 в очном формате. Также, принять участие можно онлайн через платформу Zoom.

📍 Адрес: Покровский бульвар, 11, аудитория R204.

🖇 Регистрация доступна по ссылке.

Приглашаем всех, кому интересно использование IT-технологий в гуманитарных науках!

#нашипреподаватели #полезныересурсы #антиковедение #digitalhumanities
4
🌭 Бывает excercise snacking: воркауты по пять минут между борщом и работой. А у меня будет сode snacking: по пять минут между парами латыни и греческого.

Все эксперименты с индексом и другие код-снэки отправляются в отдельный плейлист.

https://vk.com/video/playlist/-211800158_19
5
Вот так начнешь перекусывать и фиг остановишься. Слабоумие и отвага. Зато наши индексы неплохо продвинулись! #regex #stringr

https://vk.com/video-211800158_456239291
1
RAntiquity
Находим соавторов, находим имена с пробелом в середине #regex #stringr https://vk.com/video-211800158_456239292
Ну и на этом серия про индексы завершается — потому что (простите, без видео) сегодня за полдня я их доделала. Великая сила векторизации. Год назад я бы до судороги в запястье копипастила имена из одного файла в другой, проклиная участь редактора и свою судьбу.

Итог: 500 новых и около 100 старых уникальных имен. Плифона и Фичино, так и быть, отправила к новым. По дороге замечено около десяти опечаток и расхождений в написании имен, исправлено.

Полдня для такой задачи — это долго и нет? Я не знаю. В итоге все равно получился “полуавтомат”. Проверка глазами по тексту спорных случаев. (Что это за Климент, Римский или Александрийский?) Проверка глазами библиографии (потерялись “средние” редакторы — там, где их больше двух — но в итоге в тексте они все равно et al., так что зря вылавливала).

Судьба книжки туманна, но зато мы с regex теперь лучшие друзья. Очень помогла справиться с задачей глава про stringr из Hadley Wickham R for Data Science
Очень толково и для людей.

#regex #stringr #книги
🔥4
Forwarded from Antibarbari HSE (Olga Alieva)
Как сообщают отраслевые медиа, ChatGPT успел высказаться о “Теэтете”, Гомере и Горации, определил ямбический триметр, а также назвал главного специалиста по Платону в России. По этому поводу второстепенные специалисты по Платону соизволили дать небольшой добродушный комментарий. Но самое уморительное там, конечно, не про Платона, а про "Любовь и голуби".

Итак, однажды ChatGPT спросили...
3