Я тут завела плейлист с занятиями по R у магистров, пока там первые две записи, это четыре пары. Так что желающие могут идти вместе с нами: https://vk.com/video/playlist/91786643_1
Курс, с одной стороны, опирается на то, что я делала в прошлом году, но за лето я существенно переработала первые 16 уроков и сейчас работаю над тем, чтобы добавить к ним еще 16 новых; обновленный handbook по ссылке, но надо иметь в виду, что это пока work очень сильно in progress. https://locusclassicus.github.io/text_analysis_2024/
обновления по тегу #tar2024
Курс, с одной стороны, опирается на то, что я делала в прошлом году, но за лето я существенно переработала первые 16 уроков и сейчас работаю над тем, чтобы добавить к ним еще 16 новых; обновленный handbook по ссылке, но надо иметь в виду, что это пока work очень сильно in progress. https://locusclassicus.github.io/text_analysis_2024/
обновления по тегу #tar2024
locusclassicus.github.io
Компьютерный анализ текста
❤25🔥4👍2
Немного поэкспериментировала с разными ИИ-моделями, как они справятся с текстом на древнегреческом. Текст взят (что было под рукой) из платоновской схолии — такое обычно не переводят ни на какие языки, так что надо подумать.
Вот текст.
Сначала мой любимый Клод (Claude Haiku). Очень неплохо, 4+.
Теперь две горячие новинки. GPT-4o. “С этой моделью за каждый текстовый запрос к боту списывается 3 обычных запросов с баланса”. Явно хуже, на 3.
И, наконец, o1. “С этой моделью за каждый текстовый запрос к боту списывается 12 обычных запросов с баланса”. Ну ок, гулять так гулять. И что же? Полный провал.
Говорят, о1 умеет думать. Ну вот пусть думает
Вот текст.
ἀναβάλλεσθαι.(1) ἀντὶ τοῦ προοιμιάζεσθαι. (2) τῶν γὰρ ἀπαιδεύτων καὶ τὸ ἔνδυμα
καὶ τὸ σχῆμα θορυβῶδες. ἄλλοι δὲ τὸ ἀναβάλλεσθαι ἐπὶ τῶν κιθαρῶν ἀκούουσιν τῆς ᾠδῆς, οἷον τὸ ἄρχεσθαι κιθαρίζειν. καὶ οἶμαι οὐ κακῶς·
Сначала мой любимый Клод (Claude Haiku). Очень неплохо, 4+.
ἀναβάλλεσθαι. (1) Вместо того, чтобы начинать речь. (2) Ведь и одежда, и внешний вид необразованных людей бывают суетливыми. Другие же понимают "ἀναβάλλεσθαι" применительно к игре на кифаре, то есть как начало игры на кифаре. И я думаю, что это не плохое толкование.
Теперь две горячие новинки. GPT-4o. “С этой моделью за каждый текстовый запрос к боту списывается 3 обычных запросов с баланса”. Явно хуже, на 3.
ἀναβάλλεσθαι. (1) Вместо того, чтобы начинать вступление. (2) Потому что у необразованных и одежда, и внешний вид суетливы. Другие же слышат "αναβάλλεσθαι" в отношении игры на кифаре, как бы означая начало игры на инструментах. И думаю, не зря.
И, наконец, o1. “С этой моделью за каждый текстовый запрос к боту списывается 12 обычных запросов с баланса”. Ну ок, гулять так гулять. И что же? Полный провал.
ἀναβάλλεσθαι 1. Instead of προοιμιάζεσθαι (to make a prelude). 2. For among the uneducated, both the attire and the demeanor are boisterous. But others understand ἀναβάλλεσθαι in relation to the kitharas (lyres), meaning to begin to play the kithara. And I think this is not incorrect.
Говорят, о1 умеет думать. Ну вот пусть думает
😁8👍1👎1🔥1🤔1
RAntiquity
Немного поэкспериментировала с разными ИИ-моделями, как они справятся с текстом на древнегреческом. Текст взят (что было под рукой) из платоновской схолии — такое обычно не переводят ни на какие языки, так что надо подумать. Вот текст. ἀναβάλλεσθαι.(1)…
“both the attire and the demeanor are boisterous” 🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2🤡1
А еще я очень рада, что традиция цифровых понедельников на дружественном канале Antibarbari развивается, и теперь новый цифровой хаб для изучения древнегреческого делает мой коллега Кирилл Прокопов. Кажется, не будет преувеличением сказать, что антиварвары — самое цифровизированное из греко-латинских сообществ (и самое греко-латинское из цифровизированных). Очень приятно быть частью такой сильной и смелой команды 🫶
Telegram
Antibarbari HSE
Учебный год продолжается, а вместе с ним и наш курс древнегреческого языка. На прошлой неделе мы разобрали со студентами особенности греческого произношения и ударения, на этой неделе приступаем к чтению первой главы #athenaze. Всем, кто желает идти с нами…
❤12🔥3👏3💘1
Интересное наблюдение про округление в R. На практике часто не так важно, как происходит округление, главное, чтобы это было последовательно. Но если нужно именно математическое округление, то вот есть полезный пакетик scrutiny. Позволяет идти вверх или вниз от 0.5 или установить порог произвольно.
> library(scrutiny)
> round_up(2.5)
[1] 3
> round_down(2.5)
[1] 2
> round_up(2.499)
[1] 2
Telegram
R4marketing | канал Алексея Селезнёва | Язык R
Округление в R
Вчера мы столкнулись с расхождением в расчёте LT на одних и тех же данных в Power BI и R. После некоторого ресёрча я понял, что разница была в округлении. Функция round() в R округлила число 6.5 до 6, а Power BI - до 7.
Впервые для себя я…
Вчера мы столкнулись с расхождением в расчёте LT на одних и тех же данных в Power BI и R. После некоторого ресёрча я понял, что разница была в округлении. Функция round() в R округлила число 6.5 до 6, а Power BI - до 7.
Впервые для себя я…
RAntiquity
Интересное наблюдение про округление в R. На практике часто не так важно, как происходит округление, главное, чтобы это было последовательно. Но если нужно именно математическое округление, то вот есть полезный пакетик scrutiny. Позволяет идти вверх или вниз…
Вот кстати интересное объяснение. В духе Зеноновых апорий вполне, про бесконечную делимость.
И еще они советуют просто умножить на 10^n, посчитать, а потом разделить обратно. Но наверняка есть какое-то объяснение с точки зрения эволюционной биологии, почему так никто не делает.
upd. Т.е. логика такая. В мире бесконечной делимости все неопределенно. И округлять тоже надо неопределенно, иногда в большую сторону, иногда в меньшую. Получится как раз примерно как “есть” (хотя глагол “быть” в мире бесконечной делимости, конечно, не работает — привет “текучникам” из “Теэтета”). Очень изящно.
The logic behind the round to even rule is that we are trying to represent an underlying continuous value and if x comes from a truly continuous distribution, then the probability that x==2.5 is 0 and the 2.5 was probably already rounded once from any values between 2.45 and 2.54999999999999
И еще они советуют просто умножить на 10^n, посчитать, а потом разделить обратно. Но наверняка есть какое-то объяснение с точки зрения эволюционной биологии, почему так никто не делает.
upd. Т.е. логика такая. В мире бесконечной делимости все неопределенно. И округлять тоже надо неопределенно, иногда в большую сторону, иногда в меньшую. Получится как раз примерно как “есть” (хотя глагол “быть” в мире бесконечной делимости, конечно, не работает — привет “текучникам” из “Теэтета”). Очень изящно.
Appsilon
Rounding in R: Common Data Wrangling Frustrations and Workarounds in R, Julia, and Python
Maths, Rounding, Decimals! Enter the messy world of rounding in R and other languages.
👍1
RAntiquity
Пока вы думали, не построить ли социальную сеть из “Людей Платона”, тама уже все сделали. Эксель для желающих поиграть с датасетом прилагается по ссылке. #network #сети #платон
Решила вернуться к гарвардскому датасету о людях Сократа, хочу его использовать для “сетевых” глав курса по R, которые я сейчас перерабатываю.
C удивлением обнаружила, что датасет достаточно неряшливый.
- неоднобразно оформлены ссылки на некоторые источники (например, диалог "Менон" упоминается то как Meno, то как M.).
- не очень хорошо продумана онтология отношений с Сократом: inner circle, friends, students и даже просто philosophers смешались в кучу; это неизбежно, конечно, но непонятно, почему Аристипп и, например, Антисфен — в разных категориях.
- Есть прямые ошибки и опечатки. Например, Менексен II (сын Сократа) связан с Ктесиппом — это явно ошибка, должен быть Менексен I.
- В “Федоне” нет не только стражника и сердобольного прислужника, у которых по реплике, но и Платона; допустим, о нем говорится как об отсутствующем, но при этом другие отсутствующие люди (Эвен) все же в данных есть;
- Немного огорчает, что для ребер нет никаких атрибутов, которые бы обозначали характер связи персонажей между собой, а не только с Сократом; интересно при этом, что в статье по мотивам датасета (пример из Ксенофонта) эти атрибуты упомянуты, то есть изначально они где-то собирались. Возможно, их просто решили не публиковать.
Посмотрим, что получится из этого соорудить.
C удивлением обнаружила, что датасет достаточно неряшливый.
- неоднобразно оформлены ссылки на некоторые источники (например, диалог "Менон" упоминается то как Meno, то как M.).
- не очень хорошо продумана онтология отношений с Сократом: inner circle, friends, students и даже просто philosophers смешались в кучу; это неизбежно, конечно, но непонятно, почему Аристипп и, например, Антисфен — в разных категориях.
- Есть прямые ошибки и опечатки. Например, Менексен II (сын Сократа) связан с Ктесиппом — это явно ошибка, должен быть Менексен I.
- В “Федоне” нет не только стражника и сердобольного прислужника, у которых по реплике, но и Платона; допустим, о нем говорится как об отсутствующем, но при этом другие отсутствующие люди (Эвен) все же в данных есть;
- Немного огорчает, что для ребер нет никаких атрибутов, которые бы обозначали характер связи персонажей между собой, а не только с Сократом; интересно при этом, что в статье по мотивам датасета (пример из Ксенофонта) эти атрибуты упомянуты, то есть изначально они где-то собирались. Возможно, их просто решили не публиковать.
Посмотрим, что получится из этого соорудить.
research-bulletin.chs.harvard.edu
The Social Network of Socrates – Research Bulletin
Dedicated to the work of fellows at the Center for Hellenic Studies
🔥11❤1🤔1
RAntiquity
Я тут завела плейлист с занятиями по R у магистров, пока там первые две записи, это четыре пары. Так что желающие могут идти вместе с нами: https://vk.com/video/playlist/91786643_1 Курс, с одной стороны, опирается на то, что я делала в прошлом году, но за…
Это все новости из мира бинарных оппозиций.
Please open Telegram to view this post
VIEW IN TELEGRAM
rstudio.github.io
Inspect ggplot2 Plots for Automated Grading in Learning Exercises
ggcheck provides functions that inspect ggplot2 objects
to make it easier for teachers to check that student plots meet
expectations. Designed primarily for automated grading via gradethis
in interactive learnr tutorials.
to make it easier for teachers to check that student plots meet
expectations. Designed primarily for automated grading via gradethis
in interactive learnr tutorials.
❤5👍2
Вероятно, многие уже знают про прекрасный проект Orbis, позволяющий рассчитать (в днях и в денариях) пусть из города А в город Б в Римской империи. https://orbis.stanford.edu/
Например, в летний день из Кесарии Каппадокийской в Константинополь ехатьна ослике 25 дней, почти 1000 км. Ни моря, ни рек на маршруте, пыльно и грустно.
Самое приятное, что для этого проекта все данные есть в открытом доступе: их можно забрать по ссылке и использовать для пространственного / сетевого анализа (что я и намерена сделать в ближайшее время) в рамках проекта“помоги ежику найти свой домик” “помоги епископу добраться до собора”
Например, в летний день из Кесарии Каппадокийской в Константинополь ехать
Самое приятное, что для этого проекта все данные есть в открытом доступе: их можно забрать по ссылке и использовать для пространственного / сетевого анализа (что я и намерена сделать в ближайшее время) в рамках проекта
purl.stanford.edu
ORBIS (v2) Network Edge and Node Tables
ORBIS is a multimodal, seasonally variable transportation network model available at orbis.stanford.edu. The model provides for practically unlimited permutations by allowing users to limit modes, ...
👏7👍3
RAntiquity
Вероятно, многие уже знают про прекрасный проект Orbis, позволяющий рассчитать (в днях и в денариях) пусть из города А в город Б в Римской империи. https://orbis.stanford.edu/ Например, в летний день из Кесарии Каппадокийской в Константинополь ехать на…
За проезд не забываем передавать! — У Лондиниума остановите, пожалуйста!
данные: orbis
графика: ggplot
палитра: brutal
#цифровые_этюды #spatial_data
данные: orbis
графика: ggplot
палитра: brutal
#цифровые_этюды #spatial_data
❤8
RAntiquity
За проезд не забываем передавать! — У Лондиниума остановите, пожалуйста! данные: orbis графика: ggplot палитра: brutal #цифровые_этюды #spatial_data
кстати, после нескольких дней возни с картографическими проекциями, должна сказать, что вместе с дарвином пусть тогда уж забирают круглую землю. я согласна на плоскую 🐢🐘🐘🐘
😁16
Сегодня читали Эразма под руководством Мары Тимощук @thalatta_thalassa. Это был прекрасный семинар на живой латыни, но пост не об этом.
Есть такой датасет “Словарь русских писателей XVIII века: сеть персоналий” Это прекрасный датасет, подготовленный Борисом Ореховым @nevmenandr, но пост тоже не об этом.
Там собраны междустатейные ссылки в Словаре русских писателей XVIII века (1988–2010. Вып. 1–3). Узлами сети выступают посвященные персоналиям статьи словаря, а ребрами — ссылки на другие статьи в том же словаре. Но сейчас речь не об этом.
И вот, там 780 персоналий, и все они друг с другом как-то связаны. Но есть две странные изолированные пары.
Стало мне интересно, что это за несчастные, на которых ни одна статья не ссылается и их статьи тоже ни с кем не связаны.
Оказалось, что один из них -- Иоганн-Вернер Паузе, переводчик Эразма и Яна Коменского на русский. Вот о нем я и хотела написать.
Есть такой датасет “Словарь русских писателей XVIII века: сеть персоналий” Это прекрасный датасет, подготовленный Борисом Ореховым @nevmenandr, но пост тоже не об этом.
Там собраны междустатейные ссылки в Словаре русских писателей XVIII века (1988–2010. Вып. 1–3). Узлами сети выступают посвященные персоналиям статьи словаря, а ребрами — ссылки на другие статьи в том же словаре. Но сейчас речь не об этом.
И вот, там 780 персоналий, и все они друг с другом как-то связаны. Но есть две странные изолированные пары.
Стало мне интересно, что это за несчастные, на которых ни одна статья не ссылается и их статьи тоже ни с кем не связаны.
Оказалось, что один из них -- Иоганн-Вернер Паузе, переводчик Эразма и Яна Коменского на русский. Вот о нем я и хотела написать.
❤15😁4
Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров.
данные: римские амфитеатры
графика: tmap
#цифровые_этюды #spatial_data
данные: римские амфитеатры
графика: tmap
#цифровые_этюды #spatial_data
👍4
Forwarded from HSE R Meet Up
Всем привет!
Мы рады сообщить о запуске проекта HSE R Meet Up! Это пространство для обмена знаниями и опытом в мире анализа данных с использованием языка R. Наша цель — создать сообщество, где каждый сможет углубить свои навыки в data science, обсудить прикладные вопросы и новинки из этой области, а также найти единомышленников.
🔍 Что вас ждет?
- Мастер-классы от экспертов по разным методам анализа данных.
- Совместное решение и обсуждение реальных кейсов.
- Возможность делиться своими проектами и получать обратную связь.
Мы встречаемся как в очном формате, так и онлайн в Москве, Санкт-Петербурге и Перми.
В этом Telegram-канале мы будем публиковать анонсы мероприятий и всю актуальную информацию.
Let's RMeetUp ~ 🚀
Мы рады сообщить о запуске проекта HSE R Meet Up! Это пространство для обмена знаниями и опытом в мире анализа данных с использованием языка R. Наша цель — создать сообщество, где каждый сможет углубить свои навыки в data science, обсудить прикладные вопросы и новинки из этой области, а также найти единомышленников.
🔍 Что вас ждет?
- Мастер-классы от экспертов по разным методам анализа данных.
- Совместное решение и обсуждение реальных кейсов.
- Возможность делиться своими проектами и получать обратную связь.
Мы встречаемся как в очном формате, так и онлайн в Москве, Санкт-Петербурге и Перми.
В этом Telegram-канале мы будем публиковать анонсы мероприятий и всю актуальную информацию.
Let's RMeetUp ~ 🚀
❤9❤🔥4👍1
library(imager)
img <- load.image("https://upload.wikimedia.org/wikipedia/commons/thumb/a/ae/Aristotle_Altemps_Inv8575.jpg/1024px-Aristotle_Altemps_Inv8575.jpg")
# цветовые каналы
ar.red <- img
G(ar.red) <- 0
B(ar.red) <- 0
ar.blue <- img
R(ar.blue) <- 0
G(ar.blue) <- 0
ar.green <- img
R(ar.green) <- 0
B(ar.green) <- 0
ar.yellow <- img
B(ar.yellow) <- 0
library(purrr)
par(mfrow = c(2,2))
walk(list(ar.red, ar.blue, ar.green, ar.yellow), plot,
axes=FALSE)
#images #цифровые_этюды
👾5🔥3
RAntiquity
Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров. данные: римские амфитеатры графика: tmap #цифровые_этюды #spatial_data
В общем, объяснение нашлось, и это не ошибка в сборе данных.
Греки не любили, значит, мордобой, им новые сезоны нетфликс не заходили. Уважаю.
By comparison with the West, there are far fewer purpose-built amphitheaters known in the eastern Roman provinces. This has been traditionally explained by the idea that the Greek East was more “civilized” than Italy and the Western Provinces, and therefore would not have indulged in the kind of blood sports these structures accommodated.
Греки не любили, значит, мордобой, им новые сезоны нетфликс не заходили. Уважаю.
SpringerLink
Amphitheater
'Amphitheater' published in 'Encyclopedia of Global Archaeology'
❤8😁5👍3🕊1
Forwarded from Antibarbari HSE (полина крупинина)
📘В свежем выпуске журнала "Философия. Журнал Высшей школы экономики" вышла статья нашего редактора Ольги Алиевой "Pseudoplatonica: блеск и нищета стилометрии”.
🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?
🔎Почему количественные методы атрибуции авторства не могут достоверно установить, какие тексты считать подлинными?
🔎Достаточно ли "аномальной" статистики для того, чтобы усомниться в авторстве диалога?
Обо всем этом✨с картинками✨читайте по ссылке.
🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?
🔎Почему количественные методы атрибуции авторства не могут достоверно установить, какие тексты считать подлинными?
🔎Достаточно ли "аномальной" статистики для того, чтобы усомниться в авторстве диалога?
Обо всем этом✨с картинками✨читайте по ссылке.
❤🔥10
Antibarbari HSE
📘В свежем выпуске журнала "Философия. Журнал Высшей школы экономики" вышла статья нашего редактора Ольги Алиевой "Pseudoplatonica: блеск и нищета стилометрии”. 🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?…
Я очень довольна этим текстом. Он емкий и внятный. Будет еще один в серии, как только я доведу до ума курс по R.
Telegram
Antibarbari HSE
⚡ В свежих "Платоновских исследованиях" читайте статью Ольги Алиевой "Новая количественная модель Платоновского корпуса 1: Pseudoplatonica: проблемы происхождения и датировки"
Под влиянием филологической критики XIX в. диалоги из числа dubia и spuria долгое…
Под влиянием филологической критики XIX в. диалоги из числа dubia и spuria долгое…
❤10🔥4