Лучшее, что есть о регулярных выражениях в R. #regex Чтобы не потерять https://cran.r-project.org/web/packages/stringr/vignettes/regular-expressions.html
Только что выступила на семинаре IT во благо с тезисом о том, что надо учить латынь и греческий. Наверное, больше не позовут. Зато сравнила Грегори Крейна с Альдом Мануцием и рассказала про “Конкорданс к Ливию” Дэвида Паккарда Мл. Запись обещают. #выступления
❤7
Вот это странное чувство, когда ввел круглую скобку в ворде и ждешь, где же вторая. #несмешно
😁9
Forwarded from какая-то библиотека (Elena K.)
Media is too big
VIEW IN TELEGRAM
Scholarcy – это инструмент на основе AI. Он реферирует статьи.
⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.
⚙️ Как использовать?
Установи расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.
Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.
🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.
#заметки
⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.
⚙️ Как использовать?
Установи расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.
Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.
🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.
#заметки
👍2❤1
Так, апрель перестает быть томным. https://hum.hse.ru/announcements/822194729.html #выступления
hum.hse.ru
Круглый стол «Количественные методы в современном гуманитарном знании»
👍4
По правде говоря, у меня есть вопросы к этому лексикону. Почему “сенат” должен быть положительно окрашен? Но других латинских sentiment lexicons у меня для вас нет. А греческих вообще нет.
Telegram
Antibarbari HSE
👾 Сегодня в цифровом понедельнике анализируем чувства, точнее — эмоциональную тональность писем Аттику, причем в диахронном аспекте.
👀 Видео
🔗 Код
🔤 Лексикон Latin Affectus
Затевая такой анализ, мы ожидали, что с возрастом Цицерон будет грустнеть. Но…
👀 Видео
🔗 Код
🔤 Лексикон Latin Affectus
Затевая такой анализ, мы ожидали, что с возрастом Цицерон будет грустнеть. Но…
🤔3
Обычно в своих англоязычных публикациях я не даю ссылок на свои русскоязычные публикации, потому что — ну кто их будет читать? Но на днях, оформляя библиографию, подумала, что пора уже начать забывать, на каком языке написана статья, потому что все равно скоро переводить и реферировать будет AI. И наконец все смогут писать на любом языке, хоть на урду, хоть на индонезийском. И тирания английского закончится. А вы как думаете, дать ссылку на себя русскую или будущее еще не наступило?
👍10😱1
Чуть не пропустили такой важный анонс! Я не очень знаю, что говорить, но все равно приходите. #события
Telegram
παραχαράττειν τὸ νόμισμα
В субботу, 1 апреля, в 19.00 проведем стрим с Ольгой Алиевой — филологом-классиком, доцентом Школы философии ВШЭ, руководителем Греко-латинского клуба ВШЭ (@antibarbari). Обсудим digital classics применительно к античной философии: зачем антиковедам программировать…
🦄6❤1🔥1
Любопытный проект: векторное представление слова в зависимости от того, какой вы философ: https://philosophydata.com/w2v.html
Только английский. Тот же проект на Kaggle.
upd. можете вбить свой текст в окошко (на англ.) и проверить, какого вы толка (сейчас тоже проверю и расскажу в каментах)
#word2vec #философия
Только английский. Тот же проект на Kaggle.
upd. можете вбить свой текст в окошко (на англ.) и проверить, какого вы толка (сейчас тоже проверю и расскажу в каментах)
#word2vec #философия
❤3🔥1
Открытие дня: в библиотеке treebanks (бог весть как это по-русски) INESS есть письма к Аттику (но не все).
Текст там уже снабжен морфорлогической и синтаксической разметкой, к которой при должном умении можно обратиться за подсказкой.
А еще можно использовать регулярные выражения для поиска по всем деревьям (см. фото).
Искать можно не только слова, но и части речи или конкретные формы, например первое лицо глагола. Хорошее объяснение в видео (вторая часть видео, доклад Dag Haug) #regex #treebank
Текст там уже снабжен морфорлогической и синтаксической разметкой, к которой при должном умении можно обратиться за подсказкой.
А еще можно использовать регулярные выражения для поиска по всем деревьям (см. фото).
Искать можно не только слова, но и части речи или конкретные формы, например первое лицо глагола. Хорошее объяснение в видео (вторая часть видео, доклад Dag Haug) #regex #treebank
❤4
RAntiquity
Открытие дня: в библиотеке treebanks (бог весть как это по-русски) INESS есть письма к Аттику (но не все). Текст там уже снабжен морфорлогической и синтаксической разметкой, к которой при должном умении можно обратиться за подсказкой. А еще можно использовать…
Но, конечно, асы могут скачать все файлы из репозитория PROIEL и искать регэкспами там.
GitHub
GitHub - proiel/proiel-treebank: Official releases of the PROIEL treebank of ancient Indo-European languages
Official releases of the PROIEL treebank of ancient Indo-European languages - proiel/proiel-treebank
❤4
Через три минуты стартуем.
Telegram
παραχαράττειν τὸ νόμισμα
В субботу, 1 апреля, в 19.00 проведем стрим с Ольгой Алиевой — филологом-классиком, доцентом Школы философии ВШЭ, руководителем Греко-латинского клуба ВШЭ (@antibarbari). Обсудим digital classics применительно к античной философии: зачем антиковедам программировать…
❤2
RAntiquity
παραχαράττειν τὸ νόμισμα – Digital classics: стрим с О. Алиевой
Сегодня в общении со Стасом (которому большое спасибо за интересные вопросы и возможность встречи с единомышленниками) вспомнила, что Гарольд Таррант аффилирован с Center for Literary and Linguistic Computing Ньюкаслского университета. А у истоков этого центра стоит Джон Берроуз, который Дельта Берроуза. И есть, видимо, какой-то провиденциальный замысел в том, что в книге, которую мы делали в соредакторстве с Гарольдом, я впервые в своей жизни задумалась о Дельте, не зная, конечно, обо всех этих связях. Обо всем этом и другом 🔼🔼
The University of Newcastle, Australia
People
Centre for Literary and Linguistic and Computing, Research
❤8
RAntiquity
По поводу гужевого транспорта имею сказать. Новый челлендж: решительно переоформить библиографию, которая занимает 50+ страниц. Желательно при этом не умереть (таковы издержки миграции из одного издательства в другое). Наброски кода готовы — когда будет минута…
Vk
Code Snack #5 Regex & Stringr (R)
Переоформляем библиографию в R (часть 1)
❤2
Проект Tesserae предназначен для исследования интертекстуальности в греческих и латинских текстах. Исследование традиции возможно не только для целых текстов, но и отдельных цитат и образов: так называемая микро-традиция.
🔗 Сайт проекта
🔗 Репозиторий проекта
🔗 Пример исследования: о “вирусной” цитате из Вергилия (открытый доступ)
#интертестуальность
🔗 Сайт проекта
🔗 Репозиторий проекта
🔗 Пример исследования: о “вирусной” цитате из Вергилия (открытый доступ)
#интертестуальность
GitHub
tesserae - Overview
tesserae has 9 repositories available. Follow their code on GitHub.
❤2👨💻2
❔Вчера прозвучал вопрос о лемматизации для поздней латыни. Вот примерный порядок действий:
1. Устанавливаем библиотеку udpipe, она позволяет обучать модели используя функцию udpipe_train (подробнее см. виньетку).
2. Идем на сайт https://universaldependencies.org, ищем трибанк для поздней латыни (например, Late Latin Charter Treebank или Index Thomisticus Treebank) и скачиваем файл в формате CONLL-U.
3. Используем файл для обучения udpipe, следуя инструкции из виньетки, аннотируем и оцениваем результ.
Пока не пробовала, но выглядит вполне выполнимо.
Про формат CONLL-U можно почитать здесь (сложно) или посмотреть короткое видео (англ.). Собственно, это и есть синтаксическое дерево, которое нам показывали вчера в видео, но если в xml оно и хранится в виде дерева, то в CONLL-U растянуто в строку, но с сохранением информации о структуре. То есть это текстовый документ, по сути, но с фишечками оформления. #лемматизация #treebank #udpipe
О трибанках и с чем их едят хорошая статья Д. Челано The Dependency Treebanks for Ancient Greek and Latin
1. Устанавливаем библиотеку udpipe, она позволяет обучать модели используя функцию udpipe_train (подробнее см. виньетку).
2. Идем на сайт https://universaldependencies.org, ищем трибанк для поздней латыни (например, Late Latin Charter Treebank или Index Thomisticus Treebank) и скачиваем файл в формате CONLL-U.
3. Используем файл для обучения udpipe, следуя инструкции из виньетки, аннотируем и оцениваем результ.
Пока не пробовала, но выглядит вполне выполнимо.
Про формат CONLL-U можно почитать здесь (сложно) или посмотреть короткое видео (англ.). Собственно, это и есть синтаксическое дерево, которое нам показывали вчера в видео, но если в xml оно и хранится в виде дерева, то в CONLL-U растянуто в строку, но с сохранением информации о структуре. То есть это текстовый документ, по сути, но с фишечками оформления. #лемматизация #treebank #udpipe
О трибанках и с чем их едят хорошая статья Д. Челано The Dependency Treebanks for Ancient Greek and Latin
cran.r-project.org
UDPipe Natural Language Processing - Model Building
👍4❤2
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Доброе утро, в цифровом понедельнике сегодня смотрим на слова, которые вносят наибольший вклад в негативную и позитивную тональность писем Аттику Цицерона. Negotium в негативных, что в начале рабочей недели очень ободряет.
https://vk.com/video-211800158_456239298
https://vk.com/video-211800158_456239298
VK Видео
R: Модуль 5 Урок 5. Наиболее распространенные негативные и позитивные слова в письмах Аттику
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
😁1
Винценты Лютославский (1897), выделил 500 признаков позднего стиля Платона (синтаксические, морфологические, лексические, ритмические, драматические и др.), присвоив каждому одну из 4-х "степеней значимости" , и сгруппировал диалоги по "стилистической близости" (Affinity). У него получилось нечто вроде множественной регрессии :
Affinity = x1 + 2*x2 + 3*x3 + 4*x4
Вот, например, как это выглядит для “Апологии”.
9*1 + 2*2 + 3*1 + 0 = 16. Итого 16 единиц стилистической близости.
Цифру 0,02 он получает, просто разделив 16 на 718 (столько “единиц” он нашел в самих “Законах”).
#стилометрия
Affinity = x1 + 2*x2 + 3*x3 + 4*x4
Вот, например, как это выглядит для “Апологии”.
9*1 + 2*2 + 3*1 + 0 = 16. Итого 16 единиц стилистической близости.
Цифру 0,02 он получает, просто разделив 16 на 718 (столько “единиц” он нашел в самих “Законах”).
#стилометрия
❤2