RAntiquity
1.09K subscribers
295 photos
11 videos
5 files
545 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
Лучшее, что есть о регулярных выражениях в R. #regex Чтобы не потерять https://cran.r-project.org/web/packages/stringr/vignettes/regular-expressions.html
Только что выступила на семинаре IT во благо с тезисом о том, что надо учить латынь и греческий. Наверное, больше не позовут. Зато сравнила Грегори Крейна с Альдом Мануцием и рассказала про “Конкорданс к Ливию” Дэвида Паккарда Мл. Запись обещают. #выступления
7
Вот это странное чувство, когда ввел круглую скобку в ворде и ждешь, где же вторая. #несмешно
😁9
Forwarded from какая-то библиотека (Elena K.)
Media is too big
VIEW IN TELEGRAM
Scholarcy – это инструмент на основе AI. Он реферирует статьи.

⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.

⚙️ Как использовать?
Установи
расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.

Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.

🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.

#заметки
👍21
Обычно в своих англоязычных публикациях я не даю ссылок на свои русскоязычные публикации, потому что — ну кто их будет читать? Но на днях, оформляя библиографию, подумала, что пора уже начать забывать, на каком языке написана статья, потому что все равно скоро переводить и реферировать будет AI. И наконец все смогут писать на любом языке, хоть на урду, хоть на индонезийском. И тирания английского закончится. А вы как думаете, дать ссылку на себя русскую или будущее еще не наступило?
👍10😱1
Любопытный проект: векторное представление слова в зависимости от того, какой вы философ: https://philosophydata.com/w2v.html

Только английский. Тот же проект на Kaggle.

upd. можете вбить свой текст в окошко (на англ.) и проверить, какого вы толка (сейчас тоже проверю и расскажу в каментах)

#word2vec #философия
3🔥1
Открытие дня: в библиотеке treebanks (бог весть как это по-русски) INESS есть письма к Аттику (но не все).

Текст там уже снабжен морфорлогической и синтаксической разметкой, к которой при должном умении можно обратиться за подсказкой.

А еще можно использовать регулярные выражения для поиска по всем деревьям (см. фото).

Искать можно не только слова, но и части речи или конкретные формы, например первое лицо глагола. Хорошее объяснение в видео (вторая часть видео, доклад Dag Haug) #regex #treebank
4
RAntiquity
παραχαράττειν τὸ νόμισμα – Digital classics: стрим с О. Алиевой
Сегодня в общении со Стасом (которому большое спасибо за интересные вопросы и возможность встречи с единомышленниками) вспомнила, что Гарольд Таррант аффилирован с Center for Literary and Linguistic Computing Ньюкаслского университета. А у истоков этого центра стоит Джон Берроуз, который Дельта Берроуза. И есть, видимо, какой-то провиденциальный замысел в том, что в книге, которую мы делали в соредакторстве с Гарольдом, я впервые в своей жизни задумалась о Дельте, не зная, конечно, обо всех этих связях. Обо всем этом и другом 🔼🔼
8
Часть два о переоформлении библиографии. #regex
Проект Tesserae предназначен для исследования интертекстуальности в греческих и латинских текстах. Исследование традиции возможно не только для целых текстов, но и отдельных цитат и образов: так называемая микро-традиция.

🔗 Сайт проекта

🔗 Репозиторий проекта

🔗 Пример исследования: о “вирусной” цитате из Вергилия (открытый доступ)

#интертестуальность
2👨‍💻2
Вчера прозвучал вопрос о лемматизации для поздней латыни. Вот примерный порядок действий:

1. Устанавливаем библиотеку udpipe, она позволяет обучать модели используя функцию udpipe_train (подробнее см. виньетку).

2. Идем на сайт https://universaldependencies.org, ищем трибанк для поздней латыни (например, Late Latin Charter Treebank или Index Thomisticus Treebank) и скачиваем файл в формате CONLL-U.

3. Используем файл для обучения udpipe, следуя инструкции из виньетки, аннотируем и оцениваем результ.

Пока не пробовала, но выглядит вполне выполнимо.

Про формат CONLL-U можно почитать здесь (сложно) или посмотреть короткое видео (англ.). Собственно, это и есть синтаксическое дерево, которое нам показывали вчера в видео, но если в xml оно и хранится в виде дерева, то в CONLL-U растянуто в строку, но с сохранением информации о структуре. То есть это текстовый документ, по сути, но с фишечками оформления. #лемматизация #treebank #udpipe

О трибанках и с чем их едят хорошая статья Д. Челано The Dependency Treebanks for Ancient Greek and Latin
👍42
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Доброе утро, в цифровом понедельнике сегодня смотрим на слова, которые вносят наибольший вклад в негативную и позитивную тональность писем Аттику Цицерона. Negotium в негативных, что в начале рабочей недели очень ободряет.

https://vk.com/video-211800158_456239298
😁1
Пусть у меня сегодня на всех каналах будет день Монти Пайтона
❤‍🔥31
Винценты Лютославский (1897), выделил 500 признаков позднего стиля Платона (синтаксические, морфологические, лексические, ритмические, драматические и др.), присвоив каждому одну из 4-х "степеней значимости" , и сгруппировал диалоги по "стилистической близости" (Affinity). У него получилось нечто вроде множественной регрессии :

Affinity = x1 + 2*x2 + 3*x3 + 4*x4

Вот, например, как это выглядит для “Апологии”.

9*1 + 2*2 + 3*1 + 0 = 16. Итого 16 единиц стилистической близости.

Цифру 0,02 он получает, просто разделив 16 на 718 (столько “единиц” он нашел в самих “Законах”).

#стилометрия
2