RAntiquity
1.09K subscribers
296 photos
11 videos
5 files
546 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
RAntiquity
Находим соавторов, находим имена с пробелом в середине #regex #stringr https://vk.com/video-211800158_456239292
Ну и на этом серия про индексы завершается — потому что (простите, без видео) сегодня за полдня я их доделала. Великая сила векторизации. Год назад я бы до судороги в запястье копипастила имена из одного файла в другой, проклиная участь редактора и свою судьбу.

Итог: 500 новых и около 100 старых уникальных имен. Плифона и Фичино, так и быть, отправила к новым. По дороге замечено около десяти опечаток и расхождений в написании имен, исправлено.

Полдня для такой задачи — это долго и нет? Я не знаю. В итоге все равно получился “полуавтомат”. Проверка глазами по тексту спорных случаев. (Что это за Климент, Римский или Александрийский?) Проверка глазами библиографии (потерялись “средние” редакторы — там, где их больше двух — но в итоге в тексте они все равно et al., так что зря вылавливала).

Судьба книжки туманна, но зато мы с regex теперь лучшие друзья. Очень помогла справиться с задачей глава про stringr из Hadley Wickham R for Data Science
Очень толково и для людей.

#regex #stringr #книги
🔥4
Forwarded from Antibarbari HSE (Olga Alieva)
Как сообщают отраслевые медиа, ChatGPT успел высказаться о “Теэтете”, Гомере и Горации, определил ямбический триметр, а также назвал главного специалиста по Платону в России. По этому поводу второстепенные специалисты по Платону соизволили дать небольшой добродушный комментарий. Но самое уморительное там, конечно, не про Платона, а про "Любовь и голуби".

Итак, однажды ChatGPT спросили...
3
Forwarded from DH CLOUD
Digital Humanities Summer Institute (DHSI)
A Place for Open Digital Scholarship
DHSI 2023: 5-9 June on-campus | 12-16 June online

Самая большая в мире летняя школа по DH - Digital Humanities Summer Institute (DHSI) 2023 - в этом году пройдет гибридно. Регистрация до 1 мая (early birds до 1 апреля), есть разные варианты участия.

https://dhsi.org/registration-fees/
“Треухов до поздней ночи взволнованно стирал белье и объяснял жене преимущества трамвайного транспорта перед гужевым”. #жыза
По поводу гужевого транспорта имею сказать. Новый челлендж: решительно переоформить библиографию, которая занимает 50+ страниц. Желательно при этом не умереть (таковы издержки миграции из одного издательства в другое). Наброски кода готовы — когда будет минута тишины, запишу.
Вообще жизнь не радует нас датасетами. Это не то, что сейчас хотелось бы делать.
😢1
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Сегодня в рубрике “Цифровой понедельник” лемматизируем письма Аттику. Лемматизация — это приведение всех слов к их начальной (словарной) форме. Иногда это полезно сделать перед подсчетом частотности или созданием облака слов. В R это достигается несколькими строчками кода.

👀 Видео

🔗 Код
Лучшее, что есть о регулярных выражениях в R. #regex Чтобы не потерять https://cran.r-project.org/web/packages/stringr/vignettes/regular-expressions.html
Только что выступила на семинаре IT во благо с тезисом о том, что надо учить латынь и греческий. Наверное, больше не позовут. Зато сравнила Грегори Крейна с Альдом Мануцием и рассказала про “Конкорданс к Ливию” Дэвида Паккарда Мл. Запись обещают. #выступления
7
Вот это странное чувство, когда ввел круглую скобку в ворде и ждешь, где же вторая. #несмешно
😁9
Forwarded from какая-то библиотека (Elena K.)
Media is too big
VIEW IN TELEGRAM
Scholarcy – это инструмент на основе AI. Он реферирует статьи.

⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.

⚙️ Как использовать?
Установи
расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.

Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.

🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.

#заметки
👍21
Обычно в своих англоязычных публикациях я не даю ссылок на свои русскоязычные публикации, потому что — ну кто их будет читать? Но на днях, оформляя библиографию, подумала, что пора уже начать забывать, на каком языке написана статья, потому что все равно скоро переводить и реферировать будет AI. И наконец все смогут писать на любом языке, хоть на урду, хоть на индонезийском. И тирания английского закончится. А вы как думаете, дать ссылку на себя русскую или будущее еще не наступило?
👍10😱1
Любопытный проект: векторное представление слова в зависимости от того, какой вы философ: https://philosophydata.com/w2v.html

Только английский. Тот же проект на Kaggle.

upd. можете вбить свой текст в окошко (на англ.) и проверить, какого вы толка (сейчас тоже проверю и расскажу в каментах)

#word2vec #философия
3🔥1
Открытие дня: в библиотеке treebanks (бог весть как это по-русски) INESS есть письма к Аттику (но не все).

Текст там уже снабжен морфорлогической и синтаксической разметкой, к которой при должном умении можно обратиться за подсказкой.

А еще можно использовать регулярные выражения для поиска по всем деревьям (см. фото).

Искать можно не только слова, но и части речи или конкретные формы, например первое лицо глагола. Хорошее объяснение в видео (вторая часть видео, доклад Dag Haug) #regex #treebank
4