Вот кстати поделюсь и здесь: не из тщеты, а потому что это тот самый проект, ради которого я выучила R. Он так долго был в подготовке / печати, что успело несколько других моих статей выйти про стилометрию — и вообще уже со стилометрии интересы сместились на что-то более волнующее. Но если говорить о порядке создания — это самый первый опыт.
Telegram
Antibarbari HSE
⚡ На днях в издательстве Brill вышла коллективная монография The Making of the Platonic Corpus о становлении и развитии платоновского корпуса.
Эта книга посвящена памяти недавно ушедшего от нас Хольгера Теслеффа. Последняя работа проф. Теслеффа публикуется…
Эта книга посвящена памяти недавно ушедшего от нас Хольгера Теслеффа. Последняя работа проф. Теслеффа публикуется…
❤8❤🔥3👍2
RAntiquity
Сегодня читали “Горе от ума” 👻 https://youtu.be/_5Q4zRFUo_U?si=lJwkbKXEJnp6H0KW
Возвращаюсь после небольших каникул с новым видео. Первая пара: синтаксис Markdown, вторая — создание библиографии в формате BibTeX, привязка к Markdown, интеграция с Zotero, изменение стилей цитирования. Special guest Соня, опытный редактор и пользователь LaTeX’а, подсказывает, как сделать так, чтобы “Фома Аквинский” не превращался в “Аквинский, Ф.” Кажется, с пользой посидели.
YouTube
Занятие 9. Markdown & BibTeX
Занятие 3.11.2023
👍7❤3🤝2
Регулярные выражения. Найдите все 🍎🍏 в строке pen pineapple apple pen. https://youtu.be/40-oQ2DkmRI
YouTube
Занятие 10. Регулярные выражения
Занятие 10.11.2023
❤4✍1🍓1
Вбежала в большой DH на тоненьких стилометрических ножках. -- В свежем выпуске "Вестник Digital Humanities # 21". Спасибо коллегам за внимание 😍
💬 Филолог-классик Ольга Алиева постепенно превращается в одного из ключевых экспертов по Дельте Барроуза в российской науке: если пока не по известности, то по глубине проникновения в метод. В отличие от многих из нас, кто просто немножко посмотрел на формулы, научился запускать stylo и воспринял стилометрию как феномен, данный нам в результатах кластеризации, Ольга Алиева глубоко погрузилась в код, соотнесла его с математическим выражением метода Delta и уже после этого применила его к древнегреческому корпусу с целью определить оптимальные параметры для атрибуции авторства (число слов, необходимость лемматизации и т.п.). Ольга Алиева показывает, что в этом корпусе классификатор ошибается «на одной и той же небольшой группе текстов». В частности, смешиваются авторы-врачи, а также представители «второй софистики».
Подписаться на "Вестник" можно здесь.
Подписаться на "Вестник" можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
List-Manage
DH Network
DH Network Email Forms
❤18
Скрапим телеграм-канал, Новую философскую энциклопедию, страничку сайта Вышки и Викитеку. https://youtu.be/NL_UVQ_NAho
YouTube
Занятие 11. Веб-скрапинг с Rvest и SelectorGadget
Занятие 18.11.2023
❤🔥12❤4
Forwarded from Системный Блокъ
Стилометрия древнегреческих текстов: работает ли Дельта — и что кроме нее
Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что с языками древними? Историк философии Ольга Алиева исследовала, как работает Дельта и другие стилометрические меры на древнегреческих текстах. Разбираемся вместе с ней, может ли стилометрия отличить Аристотеля от Платона, а Геродота от Плутарха.
Кратко: о чем статья?
Считается, что первый проект в области цифрового антиковедения (Digital classics) был создан ещё в 1960-е годы — это был конкорданс ко всем дошедшим до нас текстам древнеримского историка Тита Ливия. Сегодня изучение античности с помощью цифровых методов продолжается.
Для эксперимента с Дельтой Бёрроуза были выбраны 23 прозаических текста 14-ти древнегреческих авторов. Оказалось, что этот метод хорошо справляется с определением авторства, но путаница всё-таки возникает в случае текстов ораторов и врачей. А ещё Дельта может перепутать Ксенофонта с Фукидидом и Плутархом, вероятнее всего, из-за сходства жанров. Зато эта метрика отлично подойдет, если нужно составить шорт-лист из нескольких «подозреваемых» авторов.
О других стилометрических методах и о том, какие из них оказались наиболее эффективными в работе с античными текстами, узнаете из полной версии статьи.
Время чтения: 20 минут.
Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что с языками древними? Историк философии Ольга Алиева исследовала, как работает Дельта и другие стилометрические меры на древнегреческих текстах. Разбираемся вместе с ней, может ли стилометрия отличить Аристотеля от Платона, а Геродота от Плутарха.
Кратко: о чем статья?
Считается, что первый проект в области цифрового антиковедения (Digital classics) был создан ещё в 1960-е годы — это был конкорданс ко всем дошедшим до нас текстам древнеримского историка Тита Ливия. Сегодня изучение античности с помощью цифровых методов продолжается.
Для эксперимента с Дельтой Бёрроуза были выбраны 23 прозаических текста 14-ти древнегреческих авторов. Оказалось, что этот метод хорошо справляется с определением авторства, но путаница всё-таки возникает в случае текстов ораторов и врачей. А ещё Дельта может перепутать Ксенофонта с Фукидидом и Плутархом, вероятнее всего, из-за сходства жанров. Зато эта метрика отлично подойдет, если нужно составить шорт-лист из нескольких «подозреваемых» авторов.
О других стилометрических методах и о том, какие из них оказались наиболее эффективными в работе с античными текстами, узнаете из полной версии статьи.
Время чтения: 20 минут.
Системный Блокъ
Стилометрия древнегреческих текстов: работает ли Дельта — и что кроме нее - Системный Блокъ
Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что там с языками древними? Историк философии Ольга Алиева исследовала, как работает Дельта и другие стилометрические меры на древнегреческих текстах.…
❤7
Токенизация, лемматизация и частеречная разметка "Гордости и предубеждения" в пятничный вечер, когда все то же самое лучше бы потреблять в виде кино под пиццу. Но жызнь сложилась иначе, потому что у нее никакого compassion for my poor nerves.
YouTube
Занятие 12. Токенизация и лемматизация
Запись занятия 24.11.2023
❤12
Гениальный мульт про количественные исследования. "Он нас считает, а ему никто не давал на это право".
YouTube
Козленок Который Считал до Десяти. Союзмультфильм,Творческое объединение кукольных фильмов
Мультфильм о козлёнке, который научился считать от 1 до 10. Просматривая его, можно научить считать своего малыша.
Помощь:https://sbordeneg.com/explore/35176…
Помощь:https://sbordeneg.com/explore/35176…
😁17❤3
Forwarded from Гуманитарии в цифре
Друзья, сегодня не забываем подключиться к трансляции семинара: редко можно увидеть столь высокую концентрацию цифровых гуманитариев, «без галстуков» рассуждающих о тенденциях и прогнозах в мире Digital Humanities.
Наши гости – авторы монографии «Цифровые гуманитарные исследования», ведущие российские специалисты по базам данных, анализу текстов, геоинформационному и сетевому анализу, оцифровке историко-культурного наследия, информационному моделированию и трёхмерным виртуальным реконструкциям из СФУ, МГУ, НИУ ВШЭ, ПГНИУ, БРЭ, ИНИОН РАН.
Модератор – доцент кафедры исторической информатики МГУ, руководитель стратегического проекта DHRI Андрей Володин.
#цифроваясреда
Please open Telegram to view this post
VIEW IN TELEGRAM
dhri.timepad.ru
«Цифровые гуманитарные исследования»: презентация коллективной монографии на семинаре „Цифровая среда“ DHRI@SFU / События на TimePad.ru
29 ноября 2023 года в 16:00 (msk) / 20:00 (krsk) состоится очередное заседание постоянного научного семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступят авторы коллективной…
❤2
"Вот если бы Платон написал не 12 книг Законов, а 13, там обязательно были бы какие-нибудь гапаксы". Глаголом жгли, глаголом жжом, глаголом будем жечь.
https://youtu.be/xM23fj27DCI
https://youtu.be/xM23fj27DCI
YouTube
Занятие 13. Распределения слов и анализ частотностей
Запись занятия 01.12.2023
🔥7❤1
RAntiquity
"Вот если бы Платон написал не 12 книг Законов, а 13, там обязательно были бы какие-нибудь гапаксы". Глаголом жгли, глаголом жжом, глаголом будем жечь. https://youtu.be/xM23fj27DCI
Вчера обсуждали Локка, а сегодня попалось вот такое высказывание у Виктора Кузена: дескать, философия Локка -- дитя Декарта, развития у него на родине не получила, пришлось ждать нашего Кондильяка. А все почему? Потому, месье, что Англия -- это остров ☝️
🤣5🔥4❤1😁1
Forwarded from Vox mediaevistae
Объявление для франкоязычных: до 19 декабря можно записаться на трехдневный воркшоп про цифровые издания и (что я нахожу исключительно интересным) цифровую стемматологию. Состоится он в январе под Греноблем и очно
20 декабря 2023 года в 16:00 (msk) / 20:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Ольга Валерьевна Алиева (НИУ ВШЭ) с докладом «Платоноведение в фокусе алгоритма LDA: тематическое моделирование как способ изучения диахронных сдвигов». https://dhri.timepad.ru/event/2707001/
Историки философии не спешат осваивать инструментарий DH. Количественные подходы оказываются более всего востребованы в той области, которая методологически связана с Кембриджской школой, а содержательно — с политической мыслью Нового времени. Цифровая «история идей» активнее всего разрабатывает методы, связанные с дистрибутивной семантикой, однако за пределами этого подхода встречаются и другие методы «дальнего чтения».
Один из них — тематическое моделирование с использованием Латентного размещения Дирихле (LDA). В 2019 г. группа канадских исследователей применила метод тематического моделирования для ответа на вопрос о том, что такое «философия науки» и как трансформировалось это понятие за последние 100 лет. Это и подобные исследования показывают, что инструментарий DH может быть востребован как способ организации эмпирического материала в большие исторические нарративы. Достоинства и ограничения такого подхода мы решили проверить на собственном опыте, смоделировав небольшой (всего за 10 лет) архив журнала «Платоновские исследования», и о результатах этого эксперимента и пойдет речь в докладе.
Историки философии не спешат осваивать инструментарий DH. Количественные подходы оказываются более всего востребованы в той области, которая методологически связана с Кембриджской школой, а содержательно — с политической мыслью Нового времени. Цифровая «история идей» активнее всего разрабатывает методы, связанные с дистрибутивной семантикой, однако за пределами этого подхода встречаются и другие методы «дальнего чтения».
Один из них — тематическое моделирование с использованием Латентного размещения Дирихле (LDA). В 2019 г. группа канадских исследователей применила метод тематического моделирования для ответа на вопрос о том, что такое «философия науки» и как трансформировалось это понятие за последние 100 лет. Это и подобные исследования показывают, что инструментарий DH может быть востребован как способ организации эмпирического материала в большие исторические нарративы. Достоинства и ограничения такого подхода мы решили проверить на собственном опыте, смоделировав небольшой (всего за 10 лет) архив журнала «Платоновские исследования», и о результатах этого эксперимента и пойдет речь в докладе.
❤🔥13
Немного Роберта Фроста этим снежным вечером.
https://youtu.be/5DwWXjcf390
https://youtu.be/5DwWXjcf390
YouTube
Занятие 14. Анализ эмоциональной тональности
Запись занятия 08.12.2023
❤🔥9
Мудрость дня: с tesseract можно распознавать многоязычные pdf. В моем случае -- английский, русский, древнегреческий. Справляется отлично. Всех дел на несколько строчек кода (точнее одну, если не считать загрузку пакетов):
Хитрость в этом плюсике, без него ничего не получится.
library(purrr)
library(pdftools)
corpus <- map(pdf_names, pdf_ocr_text, language = "rus+eng+grc")Хитрость в этом плюсике, без него ничего не получится.
👍6🔥4❤3😱2
Любопытная дискуссия о применимости цифры в философии из одного древнего блога.
Скептическая реплика о применимости цифры в философии:
Ответ, пожалуй, спорный -- но интересный.
Интересно, что такого рода споров в журналах почти не найти. В журналы и монографии попадают только рапорты об успехах -- впрочем, все мы понимаем, почему.
Скептическая реплика о применимости цифры в философии:
The kind of research questions with which philosophers engage require precisely the kind of intelligence that we haven’t been able to teach machines...
Ответ, пожалуй, спорный -- но интересный.
When we compare the familiar methods of reading and writing to some of the more recent computational methods and visualizations, the former can seem a transparent window on philosophical truth and the latter comparatively opaque and bewildering. But surely the art of reading and writing text is itself merely another technology, and there is no essential link between traditional text-based methods and philosophical truth.
Интересно, что такого рода споров в журналах почти не найти. В журналы и монографии попадают только рапорты об успехах -- впрочем, все мы понимаем, почему.
Digital Scholarship in the Humanities
Exploring the Significance of Digital Humanities for Philosophy
On February 23, I was honored to speak at an Invited Symposium on Digital Humanities at the American Philosophical Association’s Central Division Meeting in New Orleans. Organized by Cameron …
❤5
Forwarded from Гуманитарии в цифре
«Цифровая среда»: Платоноведение в фокусе алгоритма LDA
В эту среду, 20 декабря, приглашаем всех желающих присоединиться к онлайн-заседанию научно-методического семинара с участием Ольги Алиевой (НИУ ВШЭ).
✨ Начало: 16:00 (мск) / 20:00 (крск)
«Цифровая среда» – проект Института цифровых гуманитарных исследований СФУ, научная платформа для обмена результатами актуальных исследований и мнениями о новых технологиях и подходах в области цифровой гуманитаристики.
⏺ Посмотреть записи предыдущих выпусков «Цифровой среды».
⏺ Зарегистрироваться на семинар.
#цифроваясреда #смотреть #слушать
В эту среду, 20 декабря, приглашаем всех желающих присоединиться к онлайн-заседанию научно-методического семинара с участием Ольги Алиевой (НИУ ВШЭ).
«Цифровая среда» – проект Института цифровых гуманитарных исследований СФУ, научная платформа для обмена результатами актуальных исследований и мнениями о новых технологиях и подходах в области цифровой гуманитаристики.
⏺ Посмотреть записи предыдущих выпусков «Цифровой среды».
⏺ Зарегистрироваться на семинар.
#цифроваясреда #смотреть #слушать
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰12
Как жить с этим знанием и когда читать книги, памагитя.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7❤🔥5❤2