Forwarded from БЛОКНОТ ФИЛОСОФА
С докладом «Digital Classics вчера и сегодня» выступила Ольга Алиева, доцент Школы философии и культурологии, руководитель проекта «Цифровая античность», Antibarbari и RAntiquity. В нём она сравнила Грегори Крейна с Альдом Мануцием и рассказала про «Конкорданс к Ливию» Дэвида Паккарда Мл. Запись семинара можно найти на Youtube-канале ФКН ВШЭ, а презентация доступна по ссылке.
#нашиисследователи #полезныересурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
Forwarded from Kandinsky
Результат генерации по запросу "Существо с телом литературного критика, головой статистика и растрёпанной шевелюрой Стивена Пинкера"
👾3
Программа.pdf
4 MB
Между тем, организаторы конференции Terra Hominis поделились программой… #выступления
🔥1
Для тех, кто еще не наигрался в алгоритмы, совершенно залипательная вещь. Определяет пол и темперамент по текстам. Что там за начинка, не знаю, но съедает и русский, и английский в любом объеме. В русских заметках я, кстати, импульсивная женщина. Зато в английских статьях трудолюбивый мужчина.
Впрочем, я скармливала совсем крохи — но там есть инструкция, как скачать весь блог. Можно загружать зипом. Скажем, познакомились вы с кем-то и хотите составить психометрический профиль. Или думаете, брать ли человека на работу. Пожалуйста. Ante amicitiam iudicandum.
https://applymagicsauce.com/demo
#приложения
Впрочем, я скармливала совсем крохи — но там есть инструкция, как скачать весь блог. Можно загружать зипом. Скажем, познакомились вы с кем-то и хотите составить психометрический профиль. Или думаете, брать ли человека на работу. Пожалуйста. Ante amicitiam iudicandum.
https://applymagicsauce.com/demo
#приложения
Apply Magic Sauce
Apply Magic Sauce - Prediction API
Apply Magic Sauce translates individuals' digital footprints into psychological profiles. It generates a Big Five Personality Profile, prediction of age, gender, sexual, religion and politics preferences.
🔥8❤6👍2
Пока идет пора сдачи курсовых, кодировать сильно не успеваю, но расскажу поучительную историю о распределениях.
Года два назад, только начиная учить статистику, я решила, что пора уже применять в жизни полученные знания. А мне как раз надо было отчитываться по гранту. И прежде чем подать статью в журнал, я пошла на сайт https://apasurvey.philx.org/, забрала оттуда сведения о сроках рассмотрения статьи и выбрала такой журнал, чтобы с 95% попасть в интервал до 8 мес. Не помню, какое распределение брала, скорее всего, Стьюдента. Все посчитала, подала статью, жду.
Жду и жду. На исходе 10-го месяца пишу в редакцию: кхе-кхе, вы про меня не забыли? А они отвечают: забыли! Ваша статья принята к печати. Извините, дескать, ковид, мы все умерли.
С тех пор я хотя и верю в p-значения, но на всякий случай всегда беру с собой зонтик. #статистика #распределения
Года два назад, только начиная учить статистику, я решила, что пора уже применять в жизни полученные знания. А мне как раз надо было отчитываться по гранту. И прежде чем подать статью в журнал, я пошла на сайт https://apasurvey.philx.org/, забрала оттуда сведения о сроках рассмотрения статьи и выбрала такой журнал, чтобы с 95% попасть в интервал до 8 мес. Не помню, какое распределение брала, скорее всего, Стьюдента. Все посчитала, подала статью, жду.
Жду и жду. На исходе 10-го месяца пишу в редакцию: кхе-кхе, вы про меня не забыли? А они отвечают: забыли! Ваша статья принята к печати. Извините, дескать, ковид, мы все умерли.
С тех пор я хотя и верю в p-значения, но на всякий случай всегда беру с собой зонтик. #статистика #распределения
apasurvey.philx.org
APA Journal Survey Project - List of Journals
The Journal Surveys project is a way for scholars to provide feedback about their experiences with journals. Authors are encouraged to submit information about how long it took for their paper to be reviewed, the quality of the comments received, and whether…
❤9
Forwarded from Antibarbari HSE (Olga Alieva)
👾В день труда предлагаем потрудиться: освоить библиотеку leaflet для создания интерактивных карт и векторизировать условия с case_when().
Нет ничего лучше, друзья, векторизированных условий. Когда вы их освоите, код станет легким и элегантным. Меньше стучания по кнопкам, больше торжества мысли по ссылке.
Нет ничего лучше, друзья, векторизированных условий. Когда вы их освоите, код станет легким и элегантным. Меньше стучания по кнопкам, больше торжества мысли по ссылке.
VK Видео
R: Модуль 5 Урок 9. Место отправления письма на интерактивной карте
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
🔥2👍1
Forwarded from БЛОКНОТ ФИЛОСОФА
#нашиисследователи #полезныересурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
БЛОКНОТ ФИЛОСОФА
Спасибо колегам за запись! Пока ссылка на драйв; чуть позже перезалью в VK. #выступления
❤2❤🔥1
Forwarded from Antibarbari HSE (Olga Alieva)
В этот цифровой понедельник публикуем последнее видео из модуля 5 курса “R для антиковедов”. Это модуль весь был посвящен письмам Цицерона Аттику. Мы научились анализировать эмоциональную тональность, лемматизировать греческий и латинский тексты и делать интерактивные карты.
Осталась самая малость — опубликовать нашу карту на сайте https://antibarbari.ru/. Показываю самую что ни на есть изнанку этого модного ресурса для бескомпромиссных интеллектуалов.
А заодно ловите ссылочки на интересные датасеты, на которых можно потренироваться делать свои карты:
1) Ancient Greek and Roman Sites in Turkey
2) An Urban Geography of the Roman World
3) An R package that collects data for the ancient world including territorial extents from the Ancient World Mapping Centre, routes and places from Orbis, roads and shipwrecks from the Digital Atlas of Roman and Medieval Civilizations, and mints from Nomisma.
4) Римские рудники, кораблекрушения, винные прессы и еще всякая всячина от The OXREP Databases.
Высший пилотаж: почти 6 млн римских монет на карте: https://chre.ashmus.ox.ac.uk/
Мы будем рады видеть, что у вас получается, здесь и на канале RAntiquity. Если что, для публикации карты не обязателен сайт 😉
Осталась самая малость — опубликовать нашу карту на сайте https://antibarbari.ru/. Показываю самую что ни на есть изнанку этого модного ресурса для бескомпромиссных интеллектуалов.
А заодно ловите ссылочки на интересные датасеты, на которых можно потренироваться делать свои карты:
1) Ancient Greek and Roman Sites in Turkey
2) An Urban Geography of the Roman World
3) An R package that collects data for the ancient world including territorial extents from the Ancient World Mapping Centre, routes and places from Orbis, roads and shipwrecks from the Digital Atlas of Roman and Medieval Civilizations, and mints from Nomisma.
4) Римские рудники, кораблекрушения, винные прессы и еще всякая всячина от The OXREP Databases.
Высший пилотаж: почти 6 млн римских монет на карте: https://chre.ashmus.ox.ac.uk/
Мы будем рады видеть, что у вас получается, здесь и на канале RAntiquity. Если что, для публикации карты не обязателен сайт 😉
VK Видео
R: Модуль 5 Урок 10. Публикация интерактивной карты на сайте с CMS Wordpress
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
🔥2
Это я так учу, что математическое ожидание суммы случайных величин можно представить как сумму их математических ожиданий. https://youtu.be/uhsnlwRASYo
YouTube
Вафли.avi
Из к\ф "Пять вечеров"
👍1😁1
В компьютерных методах обработки текста есть такое понятие, как “мешок слов”. Это когда (никогда не начинайте определение с “это когда”!) мы рассматриваем текст как набор слов, не учитывая их порядок и взаимные связи. Сегодня неожиданно встретила это выражение у Платона. Сократ говорит Феодору: “Экий же ты любитель потолковать, если и меня по доброте своей почитаешь каким-то мешком (με οἴει λόγων τινὰ εἶναι θύλακον), из которого я без труда могу извлечь любое рассуждение и заявить, что все это не так”.
Так что вот вам “мешок слов” (или аргументов в данном случае): θύλακος λόγων / ὀνομάτων. Правильно же говорят, что в Древней Греции все есть.
Так что вот вам “мешок слов” (или аргументов в данном случае): θύλακος λόγων / ὀνομάτων. Правильно же говорят, что в Древней Греции все есть.
Системный Блокъ
Что такое мешок слов и автоматическая обработка текста?
Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста
👍6❤3😁1😱1
Forwarded from Antibarbari HSE (Olga Alieva)
📆 17 мая в 18:10 (мск) в Греко-латинском клубе Antibarbari состоится встреча со Светланой Яцык, к.и.н., научным сотрудником Лаборатории медиевистических исследований НИУ «ВШЭ», участницей проекта Distinguo.
Тема встречи: Распознавание рукописного текста (HTR): история, перспективы, текущие проекты
За последние несколько лет развитие технологий распознавания рукописного текста (HTR) сделало автоматизированную транскрипцию древних документов доступной для широкого круга ученых. Существующее программное обеспечение позволяет безболезненно развертывать конвейеры HTR, а данные для обучения моделей (ground truth) становятся все более доступными, что дает ученым возможность быстро получать транскрипции в объемах, которые ранее потребовали бы годы интенсивной работы.
На этом заседании клуба мы обсудим существующие методы автоматической транскрипции, познакомимся с готовыми инструментами (Tesseract, Transkribus, kraken / eScriptorium) и проектами, которые их применяют.
В частности, на примере платформы eScriptorium мы разберем, как
- готовить данные для тренировки;
- обучать модели и делать их тонкую настройку (fine-tuning);
- оценивать качество транскрипции;
- использовать «грязную» неотредактированную транскрипцию для решения дальнейших исследовательских задач. #antibarbari_colloquia
Встреча пройдет на платформе Zoom. Ссылка для подключения.
Тема встречи: Распознавание рукописного текста (HTR): история, перспективы, текущие проекты
За последние несколько лет развитие технологий распознавания рукописного текста (HTR) сделало автоматизированную транскрипцию древних документов доступной для широкого круга ученых. Существующее программное обеспечение позволяет безболезненно развертывать конвейеры HTR, а данные для обучения моделей (ground truth) становятся все более доступными, что дает ученым возможность быстро получать транскрипции в объемах, которые ранее потребовали бы годы интенсивной работы.
На этом заседании клуба мы обсудим существующие методы автоматической транскрипции, познакомимся с готовыми инструментами (Tesseract, Transkribus, kraken / eScriptorium) и проектами, которые их применяют.
В частности, на примере платформы eScriptorium мы разберем, как
- готовить данные для тренировки;
- обучать модели и делать их тонкую настройку (fine-tuning);
- оценивать качество транскрипции;
- использовать «грязную» неотредактированную транскрипцию для решения дальнейших исследовательских задач. #antibarbari_colloquia
Встреча пройдет на платформе Zoom. Ссылка для подключения.
❤1
Forwarded from Vox mediaevistae
В рамках моего увлечения анализом сетей и постсоветской медиевистикой возникла идея посмотреть на то, на какие группы распадаются отечественные исследователи, отталкиваясь не от того, кто кого цитирует, а от того, кого особенно часто можно встретить в сносках в рамках одной статьи.
У Артема Клюева нашелся студент, который согласился подготовить данные. Мы решили начать с «Казуса» (руководствуясь его меньшим в сравнении со «Средними веками» объемом и гипотезой о большей гомогенности его авторов). Пока что удалось обсчитать первые 4 выпуска, и уже выходит любопытно: на картинке — авторы, которые в этих четырех номерах цитировались вместе от 25 до 75 раз.
У Артема Клюева нашелся студент, который согласился подготовить данные. Мы решили начать с «Казуса» (руководствуясь его меньшим в сравнении со «Средними веками» объемом и гипотезой о большей гомогенности его авторов). Пока что удалось обсчитать первые 4 выпуска, и уже выходит любопытно: на картинке — авторы, которые в этих четырех номерах цитировались вместе от 25 до 75 раз.
🔥2
Forwarded from Antibarbari HSE (Olga Alieva)
👾 В этот цифровой понедельник мы начинаем новый модуль курса “R для антиковедов.” Модуль будет посвящен методу латентно-семантического анализа. Этот метод основан на векторном представлении слов и документов.
В англоязычной литературе такие представления называют эмбеддингами. По-английски embedding означает «вложение». Представляя объект в виде вектора, мы как бы «вкладываем» его в векторное пространство, что позволяет найти «ближайших» к нему соседей.
LSA лежит в основе многих рекомендательных механизмов. Почему бы не сделать такую же штуку, но не для товаров или фильмов, а, скажем, для древних текстов? Прочитали «Категории» Аристотеля? Вам может понравиться «Исагога» Порфирия! Рекомендуем также заглянуть в Боэция.
Кодировать начнем на следующей неделе, а пока публикую вводное видео и рекомендую прочитать статью “Как понять, о чем текст, не читая его”, на портале “Системный блок”.
В англоязычной литературе такие представления называют эмбеддингами. По-английски embedding означает «вложение». Представляя объект в виде вектора, мы как бы «вкладываем» его в векторное пространство, что позволяет найти «ближайших» к нему соседей.
LSA лежит в основе многих рекомендательных механизмов. Почему бы не сделать такую же штуку, но не для товаров или фильмов, а, скажем, для древних текстов? Прочитали «Категории» Аристотеля? Вам может понравиться «Исагога» Порфирия! Рекомендуем также заглянуть в Боэция.
Кодировать начнем на следующей неделе, а пока публикую вводное видео и рекомендую прочитать статью “Как понять, о чем текст, не читая его”, на портале “Системный блок”.
VK Видео
R: Модуль 6. Латентно-семантический анализ: введение
О шестом модуле курса R для гуманитариев
👍5