Forwarded from Antibarbari HSE (Olga Alieva)
👾 С вами цифровой понедельник. Сегодня говорим о распределении дискретных величин и испытаниях Бернулли.
https://vk.com/video-211800158_456239233
https://vk.com/video-211800158_456239233
Vk
R: Модуль 3 Урок 3. Распределения дискретных величин (часть 1)
Распределения дискретных величин. Часть 1: Биномиальное распределение. Испытания Бернулли. Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
🎞 Публикуем видео лекции Бориса Орехова "Параллельный древнегреческо-русский корпус: как и зачем?"
В рамках проекта "Цифровая античность" (НИУ ВШЭ) начинается работа над созданием параллельного древнегреческо-русского корпуса.
Первый этап работы потребует подготовки и тестирования электронных инструментов, позволяющих создавать параллельные корпуса древнегреческих текстов и их русских переводов.
О том, что это за инструменты, и как "научить" их правильно соотносить оригинал с переводом, смотрите в первом видео проекта.
В рамках проекта "Цифровая античность" (НИУ ВШЭ) начинается работа над созданием параллельного древнегреческо-русского корпуса.
Первый этап работы потребует подготовки и тестирования электронных инструментов, позволяющих создавать параллельные корпуса древнегреческих текстов и их русских переводов.
О том, что это за инструменты, и как "научить" их правильно соотносить оригинал с переводом, смотрите в первом видео проекта.
Vk
Борис Орехов: Параллельный древнегреческо-русский корпус: как и зачем?
В рамках проекта "Цифровая античность" (НИУ ВШЭ) начинается работа над созданием параллельного древнегреческо-русского корпуса. Первый этап работы потребует подготовки и тестирования электронных инструментов, позволяющих создавать параллельные корпуса древнегреческих…
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Снова цифровой понедельник — и чарующие слова “распределение Пуассона”. Вместе с Гаральдом Баайеном разбираемся, можно ли с помощью распределения Пуассона описать встречаемость некоторых слов в корпусе. https://vk.com/video-211800158_456239236
Vk
R: Модуль 3 Урок 3.2. Дискретные распределения (продолжение)
Распределение Пуассона и частотность слов. Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 В мире много вещей непостижимых. Например, то, что точка с запятой (;) и греческий знак вопроса (;) в Unicode -- это разные знаки.
Это легко проверить, используя логические операторы в R/Python. Вот код для R:
В греческой политонической раскладке ";" (под буквой q) -- обычная точка с запятой. Проверяем:
А вот в TLG, оказывается, наоборот (во всяком случае, там, где мы проверяли)
Это легко проверить, используя логические операторы в R/Python. Вот код для R:
a <- "\U037E" # Greek question mark
b = ";" # semicolon
a == b
Ответ
[1] FALSE
В греческой политонической раскладке ";" (под буквой q) -- обычная точка с запятой. Проверяем:
c = ";" # polytonic keyboard
c == a
[1] FALSE
c == b
[1] TRUEА вот в TLG, оказывается, наоборот (во всяком случае, там, где мы проверяли)
d = ";" # from TLG
d == a
TRUE
d == b
FALSE
Отсюда мораль: разрезая текст на предложения, на всякий случай прописывайте в алгоритме оба знака. Или делайте замену по всему документу. Такие дела.Forwarded from Antibarbari HSE (Olga Alieva)
👾 С вами цифровой понедельник. Сегодня разбираемся с доверительными интервалами и делаем выводы о длине предложения в “Государстве” и “Законах”. https://vk.com/video-211800158_456239240
VK Видео
R: Модуль 3 Урок 4. Доверительные интервалы
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Цифровой понедельник. Сравниваем длину предложения в выборках из разных диалогов Платона и делаем выводы. Статистические выводы 🤨
https://vk.com/video-211800158_456239242
https://vk.com/video-211800158_456239242
VK Видео
R: Модуль 3 Урок 5. Проверка гипотезы. Z-критерий Фишера
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
🏺👾 Встречайте, это мы
Новая страница проекта на сайте Факультета гуманитарных наук НИУ ВШЭ: https://hum.hse.ru/proj/digital_antiquity
В октябре официально (и успешно) завершается предшествующий проект, и начинается новый, с новыми акцентами и задачами. Приятно зафиксировать это символически 🙂
Новая страница проекта на сайте Факультета гуманитарных наук НИУ ВШЭ: https://hum.hse.ru/proj/digital_antiquity
В октябре официально (и успешно) завершается предшествующий проект, и начинается новый, с новыми акцентами и задачами. Приятно зафиксировать это символически 🙂
hum.hse.ru
Цифровая античность
Проект ФГН НИУ ВШЭ (2022-2024)
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Снова цифровой понедельник, сегодня сравниваем частотность артикля у Платона и Аристотеля и делаем статистические выводы с применением критерия Стьюдента https://vk.com/wall-211800158_122
VK
Antibarbari HSE. Запись со стены.
R: Модуль 3 Урок 6. T-распределение и критерий Стьюдента
Forwarded from Antibarbari HSE (Olga Alieva)
👾На связи цифровой понедельник и ранговый критерий Уилкоксона-Манна-Уитни. Отличная штука, если надо что-то сравнить, а уверенности в характере распределения нет. Тренируемся снова на хомячках на артиклях у Платона и Аристотеля.
https://vk.com/wall-211800158_125
https://vk.com/wall-211800158_125
VK
Antibarbari HSE. Пост со стены.
R: Модуль 3 Урок 7. Ранговый критерий Уилкоксона-Манна-Уитни
Forwarded from Antibarbari HSE (Olga Alieva)
👾 На связи цифровой понедельник. Можно ли сказать, что в пересказанных диалогах чаще всего действует Сократ, в то время как в диалогах в прямой драматической форме другие протагонисты ? Есть ли связь между категориальными переменными, подскажет тест хи-квадрат. https://vk.com/video-211800158_456239247
VK Видео
R: Модуль 3 Урок 8. Критерий χ2 ("хи-квадрат")
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Любите ли вы цифровой понедельник так, как любим его мы? Впрочем, это неважно, потому что он все равно тут. https://vk.com/video-211800158_456239249
VK Видео
R: Модуль 3 Урок 9. F-критерий Фишера
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Цифровой понедельник -- это хорошо. И статистическая мощность -- это хорошо. А все вместе хорошо в квадрате.
https://vk.com/wall-211800158_131
Кстати, это последнее видео в Модуле 3 "Описательная статистика и основы статистического вывода".
Модуль 4 “Межтекстовые расстояния” уже почти записан — не отключайтесь.
Записи всех уроков этого и предыдущих модулей доступны в отдельном плейлисте VK, на обновления которого тоже можно подписаться (а там понедельник начинается в субботу).
https://vk.com/video/playlist/-211800158_1
https://vk.com/wall-211800158_131
Кстати, это последнее видео в Модуле 3 "Описательная статистика и основы статистического вывода".
Модуль 4 “Межтекстовые расстояния” уже почти записан — не отключайтесь.
Записи всех уроков этого и предыдущих модулей доступны в отдельном плейлисте VK, на обновления которого тоже можно подписаться (а там понедельник начинается в субботу).
https://vk.com/video/playlist/-211800158_1
VK
Antibarbari HSE. Запись со стены.
R: Модуль 3 Урок 10. Оценка статистической мощности
Forwarded from Antibarbari HSE (Olga Alieva)
Так вот, талантливые люди сделали такую штуку и для Perseus, где есть почти все, что нужно сердцу классика, в оригинале и в переводе. ὄλωλα, μῆτερ,’ ὄλωλα κἀποθνήσκω 💜
И даже можно быстренько определить части речи / формы для любого отрывка, а также стремительно запараллелить оригиналы/переводы.
https://ropensci.github.io/rperseus/articles/rperseus-vignette.html
https://github.com/ropensci/rperseus
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Этот цифровой понедельник для нас особенный, потому что сегодня мы начинаем четвертый модуль нашего импровизированного видеокурса «R для антиковедов». Весь этот модуль будет посвящен тому, что можно назвать межтекстовыми расстояниями —и способам их измерения в R.
Многие из тех, кто последние 38 недель терпеливо наблюдал, как мы раскачиваемся, то есть учимся читать и считать на языке R, скорее всего имел в мыслях что-нибудь сравнить. Что ж, ближайшие 13 недель мы будем заниматься именно этим — сравнивать.
Начнем, как всегда, с простых примеров с кошечками и собачками — это поможет понять математическую логику происходящего. Но заскучать не успеете: уже очень скоро перейдем к экспериментам на реальном корпусе из 3 авторов и 6 текстов. Это, конечно, немного — но для первого опыта хватит.
Некоторые расчеты будем воспроизводить вручную, это помогает лучше понять происходящее в голове у машинки. Придется вспомнить немного школьной математики: теорему Пифагора, модули, логарифмы, косинусы и немного транспонирования матриц.Это все не страшнее латинской грамматики.
Узнаем, какие бывают метрики, какие из них уже реализованы в библиотеках R, а какие еще не реализованы — под такие попробуем сами написать функции.Это уж точно не сложнее перевода на древнегреческий.
Мы надеемся, что по итогам модуля вы станете на шаг ближе к своему первому количественному исследованию, а может быть даже убедитесь, как древние пифагорейцы, что все есть число.
За отзывы и предложения опытным кодерам скажем спасибо. А пока встречайте первое видео, посвященное расстоянию городских кварталов. https://vk.com/video-211800158_456239253
Многие из тех, кто последние 38 недель терпеливо наблюдал, как мы раскачиваемся, то есть учимся читать и считать на языке R, скорее всего имел в мыслях что-нибудь сравнить. Что ж, ближайшие 13 недель мы будем заниматься именно этим — сравнивать.
Начнем, как всегда, с простых примеров с кошечками и собачками — это поможет понять математическую логику происходящего. Но заскучать не успеете: уже очень скоро перейдем к экспериментам на реальном корпусе из 3 авторов и 6 текстов. Это, конечно, немного — но для первого опыта хватит.
Некоторые расчеты будем воспроизводить вручную, это помогает лучше понять происходящее в голове у машинки. Придется вспомнить немного школьной математики: теорему Пифагора, модули, логарифмы, косинусы и немного транспонирования матриц.
Узнаем, какие бывают метрики, какие из них уже реализованы в библиотеках R, а какие еще не реализованы — под такие попробуем сами написать функции.
Мы надеемся, что по итогам модуля вы станете на шаг ближе к своему первому количественному исследованию, а может быть даже убедитесь, как древние пифагорейцы, что все есть число.
За отзывы и предложения опытным кодерам скажем спасибо. А пока встречайте первое видео, посвященное расстоянию городских кварталов. https://vk.com/video-211800158_456239253
Vk
R: Модуль 4 Урок 1. Манхэттенское расстояние
Расстояние городских кварталов для текстов, представленных в виде векторов. Подробнее о модуле 4 и этом видео см. 5 декабря 2022 в телегам-канале сообщества: https://t.iss.one/antibarbari (рубрика "Цифровой понедельник") Видео подготовлено по результатам проекта…
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Сегодня в рубрике “Цифровой понедельник” — Еквлидово расстояние. Кратчайший путь между двумя точками, используется для решения задач классификации и кластеризации.
https://vk.com/video-211800158_456239258
https://vk.com/video-211800158_456239258
VK Видео
R: Модуль 4 Урок 2. Евклидово расстояние
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 Достали двойные листочки, не забываем голову, звонок для учителя! Сегодня в рубрике “Цифровой понедельник” вспоминаем косинусы 📐 А зачем?
Косинусное сходство используется для автоматической классификации текстов, и позже мы обязательно применим его для определения авторства древнегреческих текстов. Но мы же не будем его применять, не понимая, что это такое?
Поэтому сначала — немного школьной алгебры. https://vk.com/video-211800158_456239261
Косинусное сходство используется для автоматической классификации текстов, и позже мы обязательно применим его для определения авторства древнегреческих текстов. Но мы же не будем его применять, не понимая, что это такое?
Поэтому сначала — немного школьной алгебры. https://vk.com/video-211800158_456239261
VK Видео
R: Модуль 4 Урок 3.1. Косинусное расстояние (часть 1)
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 📐В рубрике “Цифровой понедельник” продолжаем осмыслять косинусное сходство. Зная косинус, можно вычислить угол между двумя векторами — для этого нужен арккосинус.
В R угол всегда возвращается в радианах, которые мы научимся переводить в градусы. А еще познакомимся с библиотекой philentropy, при помощи которой можно легко вычислить уже известные нам и многие другие расстояния. https://vk.com/video-211800158_456239263
В R угол всегда возвращается в радианах, которые мы научимся переводить в градусы. А еще познакомимся с библиотекой philentropy, при помощи которой можно легко вычислить уже известные нам и многие другие расстояния. https://vk.com/video-211800158_456239263
VK Видео
R: Модуль 4 Урок 3.2. Косинусное расстояние (часть 2). Тригонометрические функции в R
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
Please open Telegram to view this post
VIEW IN TELEGRAM
VK
Antibarbari HSE. Пост со стены.
R: Модуль 4 Урок 4. Вычисление расстояния с philentropy. Визуализация матриц расстояния: дендрограмм... Смотрите полностью ВКонтакте.
Forwarded from Antibarbari HSE (Olga Alieva)
👾 В рубрике Цифровой понедельник знакомимся с тремя метриками из библиотеки Stylo.
👀 Смотреть здесь: https://vk.com/video-211800158_456239266
📖 Дельта Берроуза, о которой писали наши коллеги:
🔹А автор кто? Рассудит дельта Бёрроуза
🔹Стилометрия: как в разное время люди искали авторов текстов
📖Дельта Аргамона, которая по сути тот же Берроуз, но с евклидовой метрикой вместо Манхэттена (статья на англ. языке)
📖Вюрцбургская Дельта — то же косинусное сходство, но со стандартизацией (статья на англ. языке)
👀 Смотреть здесь: https://vk.com/video-211800158_456239266
📖 Дельта Берроуза, о которой писали наши коллеги:
🔹А автор кто? Рассудит дельта Бёрроуза
🔹Стилометрия: как в разное время люди искали авторов текстов
📖Дельта Аргамона, которая по сути тот же Берроуз, но с евклидовой метрикой вместо Манхэттена (статья на англ. языке)
📖Вюрцбургская Дельта — то же косинусное сходство, но со стандартизацией (статья на англ. языке)
Forwarded from Antibarbari HSE (Olga Alieva)
👀 Смотреть здесь: https://vk.com/video-211800158_456239269
📖 А вот тут можно почитать интересную статью о корпусе Цезаря, где задействована эта метрика.
🖋 Наши эксперименты на большом древнегреческом корпусе показывают, что minmax работает даже лучше, чем знаменитая Дельта Берроуза и ее аналоги, о которых мы писали в прошлый понедельник. Статья в работе.
Please open Telegram to view this post
VIEW IN TELEGRAM
VK Видео
R: Модуль 4 Урок 6. Расстояние Ружечки, или minmax. Связь между дистанциями Ружечки и Танимото
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2022 году.
Forwarded from Antibarbari HSE (Olga Alieva)
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
PhilosophyToday
Вышло сразу аж два "Аристея". В них и нам кое-что интересно, в основном в 25 номере. Например есть Ольга Алиева про цифровые технологии, которые вместо нас уже читают Платона, Подосинов, стихи поезии, статья про Эпиктета и Оригена и мн. др.