RAntiquity

Лучшее, что есть о регулярных выражениях в R. #regex Чтобы не потерять https://cran.r-project.org/web/packages/stringr/vignettes/regular-expressions.html

275 views09:14

RAntiquity

Только что выступила на семинаре IT во благо с тезисом о том, что надо учить латынь и греческий. Наверное, больше не позовут. Зато сравнила Грегори Крейна с Альдом Мануцием и рассказала про “Конкорданс к Ливию” Дэвида Паккарда Мл. Запись обещают. #выступления

❤7

1.28K viewsedited 16:41

RAntiquity

Вот это странное чувство, когда ввел круглую скобку в ворде и ждешь, где же вторая. #несмешно

😁9

235 viewsedited 17:56

RAntiquity

Forwarded from какая-то библиотека (Elena K.)

2:14

Media is too big

VIEW IN TELEGRAM

Scholarcy – это инструмент на основе AI. Он реферирует статьи.

⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.

⚙️ Как использовать?
Установи расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.

Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.

🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.

#заметки

👍2❤1

250 views08:38

RAntiquity

Так, апрель перестает быть томным. https://hum.hse.ru/announcements/822194729.html #выступления

hum.hse.ru

Круглый стол «Количественные методы в современном гуманитарном знании»

👍4

302 views10:20

RAntiquity

По правде говоря, у меня есть вопросы к этому лексикону. Почему “сенат” должен быть положительно окрашен? Но других латинских sentiment lexicons у меня для вас нет. А греческих вообще нет.

Antibarbari HSE

👾 Сегодня в цифровом понедельнике анализируем чувства, точнее — эмоциональную тональность писем Аттику, причем в диахронном аспекте.

👀 Видео

🔗 Код

🔤 Лексикон Latin Affectus

Затевая такой анализ, мы ожидали, что с возрастом Цицерон будет грустнеть. Но…

🤔3

279 views07:07

RAntiquity

Обычно в своих англоязычных публикациях я не даю ссылок на свои русскоязычные публикации, потому что — ну кто их будет читать? Но на днях, оформляя библиографию, подумала, что пора уже начать забывать, на каком языке написана статья, потому что все равно скоро переводить и реферировать будет AI. И наконец все смогут писать на любом языке, хоть на урду, хоть на индонезийском. И тирания английского закончится. А вы как думаете, дать ссылку на себя русскую или будущее еще не наступило?

👍10😱1

278 viewsedited 08:27

RAntiquity

Чуть не пропустили такой важный анонс! Я не очень знаю, что говорить, но все равно приходите. #события

παραχαράττειν τὸ νόμισμα

В субботу, 1 апреля, в 19.00 проведем стрим с Ольгой Алиевой — филологом-классиком, доцентом Школы философии ВШЭ, руководителем Греко-латинского клуба ВШЭ (@antibarbari). Обсудим digital classics применительно к античной философии: зачем антиковедам программировать…

🦄6❤1🔥1

234 viewsedited 18:23

RAntiquity

Любопытный проект: векторное представление слова в зависимости от того, какой вы философ: https://philosophydata.com/w2v.html

Только английский. Тот же проект на Kaggle.

upd. можете вбить свой текст в окошко (на англ.) и проверить, какого вы толка (сейчас тоже проверю и расскажу в каментах)

#word2vec #философия

❤3🔥1

288 viewsedited 18:28

RAntiquity

Открытие дня: в библиотеке treebanks (бог весть как это по-русски) INESS есть письма к Аттику (но не все).

Текст там уже снабжен морфорлогической и синтаксической разметкой, к которой при должном умении можно обратиться за подсказкой.

А еще можно использовать регулярные выражения для поиска по всем деревьям (см. фото).

Искать можно не только слова, но и части речи или конкретные формы, например первое лицо глагола. Хорошее объяснение в видео (вторая часть видео, доклад Dag Haug) #regex #treebank

❤4

182 viewsedited 13:33

RAntiquity

Но, конечно, асы могут скачать все файлы из репозитория PROIEL и искать регэкспами там.

GitHub

GitHub - proiel/proiel-treebank: Official releases of the PROIEL treebank of ancient Indo-European languages

Official releases of the PROIEL treebank of ancient Indo-European languages - proiel/proiel-treebank

❤4

185 views13:36

RAntiquity

Через три минуты стартуем.

παραχαράττειν τὸ νόμισμα

❤2

179 views15:56

RAntiquity

Digital classics: стрим с О. Алиевой

παραχαράττειν τὸ νόμισμα

❤‍🔥12⚡2🔥2

177 views17:28

RAntiquity

παραχαράττειν τὸ νόμισμα – Digital classics: стрим с О. Алиевой

Сегодня в общении со Стасом (которому большое спасибо за интересные вопросы и возможность встречи с единомышленниками) вспомнила, что Гарольд Таррант аффилирован с Center for Literary and Linguistic Computing Ньюкаслского университета. А у истоков этого центра стоит Джон Берроуз, который Дельта Берроуза. И есть, видимо, какой-то провиденциальный замысел в том, что в книге, которую мы делали в соредакторстве с Гарольдом, я впервые в своей жизни задумалась о Дельте, не зная, конечно, обо всех этих связях. Обо всем этом и другом 🔼🔼

The University of Newcastle, Australia

People

Centre for Literary and Linguistic and Computing, Research

❤8

186 viewsedited 17:39

RAntiquity

По поводу гужевого транспорта имею сказать. Новый челлендж: решительно переоформить библиографию, которая занимает 50+ страниц. Желательно при этом не умереть (таковы издержки миграции из одного издательства в другое). Наброски кода готовы — когда будет минута…

Решила рассказать подробнее о том, как R помог с переоформлением библиографии. Часть раз. #regex

Code Snack #5 Regex & Stringr (R)

Переоформляем библиографию в R (часть 1)

❤2

183 views19:47

RAntiquity

Часть два о переоформлении библиографии. #regex

180 viewsedited 19:52

RAntiquity

Проект Tesserae предназначен для исследования интертекстуальности в греческих и латинских текстах. Исследование традиции возможно не только для целых текстов, но и отдельных цитат и образов: так называемая микро-традиция.

🔗 Сайт проекта

🔗 Репозиторий проекта

🔗 Пример исследования: о “вирусной” цитате из Вергилия (открытый доступ)

#интертестуальность

GitHub

tesserae - Overview

tesserae has 9 repositories available. Follow their code on GitHub.

❤2👨‍💻2

197 views05:10

RAntiquity

❔Вчера прозвучал вопрос о лемматизации для поздней латыни. Вот примерный порядок действий:

1. Устанавливаем библиотеку udpipe, она позволяет обучать модели используя функцию udpipe_train (подробнее см. виньетку).

2. Идем на сайт https://universaldependencies.org, ищем трибанк для поздней латыни (например, Late Latin Charter Treebank или Index Thomisticus Treebank) и скачиваем файл в формате CONLL-U.

3. Используем файл для обучения udpipe, следуя инструкции из виньетки, аннотируем и оцениваем результ.

Пока не пробовала, но выглядит вполне выполнимо.

Про формат CONLL-U можно почитать здесь (сложно) или посмотреть короткое видео (англ.). Собственно, это и есть синтаксическое дерево, которое нам показывали вчера в видео, но если в xml оно и хранится в виде дерева, то в CONLL-U растянуто в строку, но с сохранением информации о структуре. То есть это текстовый документ, по сути, но с фишечками оформления. #лемматизация #treebank #udpipe

О трибанках и с чем их едят хорошая статья Д. Челано The Dependency Treebanks for Ancient Greek and Latin

cran.r-project.org

UDPipe Natural Language Processing - Model Building

👍4❤2

216 viewsedited 05:36

RAntiquity

Forwarded from Antibarbari HSE (Olga Alieva)

👾 Доброе утро, в цифровом понедельнике сегодня смотрим на слова, которые вносят наибольший вклад в негативную и позитивную тональность писем Аттику Цицерона. Negotium в негативных, что в начале рабочей недели очень ободряет.

https://vk.com/video-211800158_456239298

VK Видео

R: Модуль 5 Урок 5. Наиболее распространенные негативные и позитивные слова в письмах Аттику

Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.

😁1

154 views06:02

RAntiquity

Пусть у меня сегодня на всех каналах будет день Монти Пайтона

❤‍🔥3❤1

184 views16:43

RAntiquity

Винценты Лютославский (1897), выделил 500 признаков позднего стиля Платона (синтаксические, морфологические, лексические, ритмические, драматические и др.), присвоив каждому одну из 4-х "степеней значимости" , и сгруппировал диалоги по "стилистической близости" (Affinity). У него получилось нечто вроде множественной регрессии :

Affinity = x1 + 2*x2 + 3*x3 + 4*x4

Вот, например, как это выглядит для “Апологии”.

9*1 + 2*2 + 3*1 + 0 = 16. Итого 16 единиц стилистической близости.

Цифру 0,02 он получает, просто разделив 16 на 718 (столько “единиц” он нашел в самих “Законах”).

#стилометрия

❤2

1.81K views17:12

About

Blog

Apps

Platform