Forwarded from Antibarbari HSE (Olga Alieva)
👾 Сегодня в цифровом понедельнике боремся с сокращениями в письмах Аттику.
Все эти календы и иды, консулы и трибуны, спрятанные за одной буквой луции, сокращенные приветы и “будь здоров” — от всего безжалостно избавляемся, потому что проще так, чем долго объяснять токенайзеру, что точка — это не конец предложения.
👀 Видео по ссылке
🔗 Код по ссылке
🤔 Кстати, по ходу работы выяснилось, что в письмах Цицерона можно найти сокращения для всех месяцев, кроме Quintilis. Почему-то Quintilis (будущий июль) никогда не сокращается.
#regex #цицерон
Все эти календы и иды, консулы и трибуны, спрятанные за одной буквой луции, сокращенные приветы и “будь здоров” — от всего безжалостно избавляемся, потому что проще так, чем долго объяснять токенайзеру, что точка — это не конец предложения.
👀 Видео по ссылке
🔗 Код по ссылке
🤔 Кстати, по ходу работы выяснилось, что в письмах Цицерона можно найти сокращения для всех месяцев, кроме Quintilis. Почему-то Quintilis (будущий июль) никогда не сокращается.
#regex #цицерон
VK
Antibarbari HSE. Запись со стены.
R: Модуль 5 Урок 2. Письма Аттику: удаляем сокращения и делим на слова
Добро пожаловать на канал, дорогие читатели!
Многое из того, что будет здесь публиковаться, носит черновой или, как говорится, разведывательный характер. Таков и этот челлендж по составлению индекса: начиная его, я пока не очень хорошо понимаю, куда приду.
Может быть, ничего не получится. Но это тоже результат.
https://vk.com/video-211800158_456239288
Для обсуждения у канала есть чат.
Многое из того, что будет здесь публиковаться, носит черновой или, как говорится, разведывательный характер. Таков и этот челлендж по составлению индекса: начиная его, я пока не очень хорошо понимаю, куда приду.
Может быть, ничего не получится. Но это тоже результат.
https://vk.com/video-211800158_456239288
Для обсуждения у канала есть чат.
VK Видео
R: Index Challenge 1
Прочитаем документ docx с помощью библиотеки officer
👍1
Forwarded from БЛОКНОТ ФИЛОСОФА
🖥 В рамках семинара, посвященного IT-технологиям в гуманитарных науках, выступит доцент Школы философии и культурологии, Ольга Валерьевна Алиева
⌨️ О.В. Алиева, кандидат филологических наук и руководитель проекта «Цифровая античность» представит доклад «Digital Classics вчера и сегодня». Ее выступление будет посвящено цифровым библиотекам, формированию электронных каталогов, компьютерному анализу и автоматическому сопоставлению текстов, а также вопросу о том, как программирование и анализ данных можно применять в философии.
🗒 Ольга Валерьевна уже давно занимается Digital Humanities в рамках вышкинского греко-латинского клуба «Antibarbari HSE», где регулярно выходит рубрика «Цифровой понедельник». Также, недавно она решила создать отдельный канал «RAntiquity», посвященный исключительно цифровой части проектов Antibarbari.
🏢 Мероприятие пройдет 21 марта в 18:10 в очном формате. Также, принять участие можно онлайн через платформу Zoom.
📍 Адрес: Покровский бульвар, 11, аудитория R204.
🖇 Регистрация доступна по ссылке.
Приглашаем всех, кому интересно использование IT-технологий в гуманитарных науках!
#нашипреподаватели #полезныересурсы #антиковедение #digitalhumanities
⌨️ О.В. Алиева, кандидат филологических наук и руководитель проекта «Цифровая античность» представит доклад «Digital Classics вчера и сегодня». Ее выступление будет посвящено цифровым библиотекам, формированию электронных каталогов, компьютерному анализу и автоматическому сопоставлению текстов, а также вопросу о том, как программирование и анализ данных можно применять в философии.
🗒 Ольга Валерьевна уже давно занимается Digital Humanities в рамках вышкинского греко-латинского клуба «Antibarbari HSE», где регулярно выходит рубрика «Цифровой понедельник». Также, недавно она решила создать отдельный канал «RAntiquity», посвященный исключительно цифровой части проектов Antibarbari.
🏢 Мероприятие пройдет 21 марта в 18:10 в очном формате. Также, принять участие можно онлайн через платформу Zoom.
📍 Адрес: Покровский бульвар, 11, аудитория R204.
🖇 Регистрация доступна по ссылке.
Приглашаем всех, кому интересно использование IT-технологий в гуманитарных науках!
#нашипреподаватели #полезныересурсы #антиковедение #digitalhumanities
❤4
🌭 Бывает excercise snacking: воркауты по пять минут между борщом и работой. А у меня будет сode snacking: по пять минут между парами латыни и греческого.
Все эксперименты с индексом и другие код-снэки отправляются в отдельный плейлист.
https://vk.com/video/playlist/-211800158_19
Все эксперименты с индексом и другие код-снэки отправляются в отдельный плейлист.
https://vk.com/video/playlist/-211800158_19
Vk
Code Snacking | VK
VK is the largest European social network with more than 100 million active users. Our goal is to keep old friends, ex-classmates, neighbors and colleagues in touch.
❤5
Вот так начнешь перекусывать и фиг остановишься. Слабоумие и отвага. Зато наши индексы неплохо продвинулись! #regex #stringr
https://vk.com/video-211800158_456239291
https://vk.com/video-211800158_456239291
Vk
Code Snack #3 Regex & Stringr (R)
Вылавливаем фамилии с дефисами и диакритикой из библиографии
❤1
Находим соавторов, находим имена с пробелом в середине #regex #stringr
https://vk.com/video-211800158_456239292
https://vk.com/video-211800158_456239292
Vk
Code Snack #4 Regex & Stringr (R)
Вылавливаем имена с пробелом в середине, а также пишем регулярное выражение для поиска соавторов
RAntiquity
Находим соавторов, находим имена с пробелом в середине #regex #stringr https://vk.com/video-211800158_456239292
Ну и на этом серия про индексы завершается — потому что (простите, без видео) сегодня за полдня я их доделала. Великая сила векторизации. Год назад я бы до судороги в запястье копипастила имена из одного файла в другой, проклиная участь редактора и свою судьбу.
Итог: 500 новых и около 100 старых уникальных имен. Плифона и Фичино, так и быть, отправила к новым. По дороге замечено около десяти опечаток и расхождений в написании имен, исправлено.
Полдня для такой задачи — это долго и нет? Я не знаю. В итоге все равно получился “полуавтомат”. Проверка глазами по тексту спорных случаев. (Что это за Климент, Римский или Александрийский?) Проверка глазами библиографии (потерялись “средние” редакторы — там, где их больше двух — но в итоге в тексте они все равно et al., так что зря вылавливала).
Судьба книжки туманна, но зато мы с regex теперь лучшие друзья. Очень помогла справиться с задачей глава про stringr из Hadley Wickham R for Data Science
Очень толково и для людей.
#regex #stringr #книги
Итог: 500 новых и около 100 старых уникальных имен. Плифона и Фичино, так и быть, отправила к новым. По дороге замечено около десяти опечаток и расхождений в написании имен, исправлено.
Полдня для такой задачи — это долго и нет? Я не знаю. В итоге все равно получился “полуавтомат”. Проверка глазами по тексту спорных случаев. (Что это за Климент, Римский или Александрийский?) Проверка глазами библиографии (потерялись “средние” редакторы — там, где их больше двух — но в итоге в тексте они все равно et al., так что зря вылавливала).
Судьба книжки туманна, но зато мы с regex теперь лучшие друзья. Очень помогла справиться с задачей глава про stringr из Hadley Wickham R for Data Science
Очень толково и для людей.
#regex #stringr #книги
r4ds.had.co.nz
Welcome | R for Data Science
This book will teach you how to do data science with R: You’ll learn how to get your data into R, get it into the most useful structure, transform it, visualise it and model it. In this book, you will find a practicum of skills for data science. Just as a…
🔥4
Forwarded from Antibarbari HSE (Olga Alieva)
Как сообщают отраслевые медиа, ChatGPT успел высказаться о “Теэтете”, Гомере и Горации, определил ямбический триметр, а также назвал главного специалиста по Платону в России. По этому поводу второстепенные специалисты по Платону соизволили дать небольшой добродушный комментарий. Но самое уморительное там, конечно, не про Платона, а про "Любовь и голуби".
Итак, однажды ChatGPT спросили...
Итак, однажды ChatGPT спросили...
Системный Блокъ
«Крейсер “Россия”» и другие фантазии ChatGPT - Системный Блокъ
Всерьез полагаться на ChatGPT пока не стоит. И вот почему. Доцент школы лингвистики НИУ ВШЭ Борис Орехов разобрался на примерах.
❤3
Forwarded from DH CLOUD
Digital Humanities Summer Institute (DHSI)
A Place for Open Digital Scholarship
DHSI 2023: 5-9 June on-campus | 12-16 June online
Самая большая в мире летняя школа по DH - Digital Humanities Summer Institute (DHSI) 2023 - в этом году пройдет гибридно. Регистрация до 1 мая (early birds до 1 апреля), есть разные варианты участия.
https://dhsi.org/registration-fees/
A Place for Open Digital Scholarship
DHSI 2023: 5-9 June on-campus | 12-16 June online
Самая большая в мире летняя школа по DH - Digital Humanities Summer Institute (DHSI) 2023 - в этом году пройдет гибридно. Регистрация до 1 мая (early birds до 1 апреля), есть разные варианты участия.
https://dhsi.org/registration-fees/
“Треухов до поздней ночи взволнованно стирал белье и объяснял жене преимущества трамвайного транспорта перед гужевым”. #жыза
Вообще жизнь не радует нас датасетами. Это не то, что сейчас хотелось бы делать.
😢1
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Сегодня в рубрике “Цифровой понедельник” лемматизируем письма Аттику. Лемматизация — это приведение всех слов к их начальной (словарной) форме. Иногда это полезно сделать перед подсчетом частотности или созданием облака слов. В R это достигается несколькими строчками кода.
👀 Видео
🔗 Код
👀 Видео
🔗 Код
GitHub
Elements_Stylometry/Module5/M5L3.R at main · locusclassicus/Elements_Stylometry
Contribute to locusclassicus/Elements_Stylometry development by creating an account on GitHub.
Лучшее, что есть о регулярных выражениях в R. #regex Чтобы не потерять https://cran.r-project.org/web/packages/stringr/vignettes/regular-expressions.html
Только что выступила на семинаре IT во благо с тезисом о том, что надо учить латынь и греческий. Наверное, больше не позовут. Зато сравнила Грегори Крейна с Альдом Мануцием и рассказала про “Конкорданс к Ливию” Дэвида Паккарда Мл. Запись обещают. #выступления
❤7
Вот это странное чувство, когда ввел круглую скобку в ворде и ждешь, где же вторая. #несмешно
😁9
Forwarded from какая-то библиотека (Elena K.)
Media is too big
VIEW IN TELEGRAM
Scholarcy – это инструмент на основе AI. Он реферирует статьи.
⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.
⚙️ Как использовать?
Установи расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.
Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.
🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.
#заметки
⌛️ Что он делает?
Из научной статьи выделяет аннотацию, ключевые результаты, пишет краткий пересказ исследования.
⚙️ Как использовать?
Установи расширение для браузера или используй форму на сайте. Найди статью, для которой нужен реферат.
Если ты используешь расширение, то нажми на иконку и подожди, пока статья загрузится. Если через сайт – вставь ссылку в соответствующее окно.
Готовый текст откроется в том же окне и будет доступен для скачивания.
Есть и платный функционал: ведение библиотеки, большие лимиты на реферирование. Об этом подробно – в твиттере @MushtaqBilalPhD.
🔋 Для чего можно использовать?
Для быстрых обзоров статей, если нужно поверхностно, но быстро разобраться в теме (референты и аналитики оценят). И для принятия решения, читать ли статью полностью, или нет. Можно сэкономить время и прочитать действительно полезные статьи.
#заметки
👍2❤1
Так, апрель перестает быть томным. https://hum.hse.ru/announcements/822194729.html #выступления
hum.hse.ru
Круглый стол «Количественные методы в современном гуманитарном знании»
👍4
По правде говоря, у меня есть вопросы к этому лексикону. Почему “сенат” должен быть положительно окрашен? Но других латинских sentiment lexicons у меня для вас нет. А греческих вообще нет.
Telegram
Antibarbari HSE
👾 Сегодня в цифровом понедельнике анализируем чувства, точнее — эмоциональную тональность писем Аттику, причем в диахронном аспекте.
👀 Видео
🔗 Код
🔤 Лексикон Latin Affectus
Затевая такой анализ, мы ожидали, что с возрастом Цицерон будет грустнеть. Но…
👀 Видео
🔗 Код
🔤 Лексикон Latin Affectus
Затевая такой анализ, мы ожидали, что с возрастом Цицерон будет грустнеть. Но…
🤔3
Обычно в своих англоязычных публикациях я не даю ссылок на свои русскоязычные публикации, потому что — ну кто их будет читать? Но на днях, оформляя библиографию, подумала, что пора уже начать забывать, на каком языке написана статья, потому что все равно скоро переводить и реферировать будет AI. И наконец все смогут писать на любом языке, хоть на урду, хоть на индонезийском. И тирания английского закончится. А вы как думаете, дать ссылку на себя русскую или будущее еще не наступило?
👍10😱1