RAntiquity
1.09K subscribers
295 photos
10 videos
5 files
540 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
📝 На подходе свежий выпуск “Вестника ПСТГУ. Серия: Филология”, в котором опубликовано мое исследование — последнее в серии — о платоновской стилометрии.

Главные выводы:
Четкой ранней группы диалогов Платона обнаружить не удалось. То, что считалось ранним стилем Платона, внешне почти неотличимо от работ его последователей и подражателей.
Стилометрия действительно выделяет группу «Законов» (и сопутствующих диалогов). Они сильно выделяются и, вероятно, были написаны в поздний период или были отредактированы “секретарем”.
Авторский стиль Платона воспроизводим даже в эпоху эллинизма. Машина не всегда способна отличить оригинал от талантливого имитатора.

Мораль? Стилометрия — мощный инструмент, но она не может однозначно датировать диалоги или определить подлинность. Полностью текст статьи по ссылке.

P.S. Первая часть была опубликована в журнале “Платоновские исследования” годом ранее. Там никакой цифры, только содержательный обзор вопросов, связанных с датировкой и подлинностью.

P.S.S. Анонимные рецензенты проделали огромную работу. Я, разумеется, догадалась, кто это, но продолжу делать вид, что нет. Спасибо вам, коллеги, это очень ценно.
29🥰8👏8
Forwarded from Boris Orekhov
Мне кажется, сюжет Вашей статьи о Платоне параллелен этому старому стишку про теорию относительности:

Был этот мир глубокой тьмой окутан.
Да будет свет! И вот явился Ньютон.
Но сатана недолго ждал реванша.
Пришел Эйнштейн — и стало все, как раньше.
😁36💯4
Forwarded from Antibarbari HSE (Olga Alieva)
🗓 Мы открываем новый сезон #antibarbari_colloquia, и 9 октября в 18-10 мск встречаемся с Львом Шадриным, чтобы поговорить о том, зачем эллинисту XIX в. вести дневник на древнегреческом — и как сегдоня цифровые методы позволяют эти записи расшифровывать.

Представьте себя подающим надежды студентом-классиком в Париже XIX века. Вы больше не путаете аблятив и конъюнктив, легко спрягаете глагол εἴμι, и на глаз определяете genitivus absolutus.

К кому обратиться за протекцией и советом в продолжении академической карьеры? Что делать, если вам срочно нужна для консультации византийская рукопись? Как быть, если втайне хочется учить и новогреческий (ῥωμαϊκά) в дополнение к классическому?

Карл Бенедикт Хазе (1780 –1864) был выдающимся учёным-классиком, знатоком латыни и греческого, блестящим палеографом и филологом, остававшимся в центре парижской интеллектуальной жизни на протяжение всей своей карьеры. Закончив Йенский университет и вдохновившись революционными веяниями, в 1801 году Хазе отправился пешком в Париж, где спустя череду головокружительных в своей случайности встреч, получил место в отделе рукописей Bibliothèque impériale.

За свою долгую и плодотворную научную карьеру, включавшую профессорство в École des langues orientales vivantes и в École Polytechnique, вступление в престижное сообщество Académie des Inscriptions et Belles-Lettres, многочисленные издания византийских текстов, от Льва Дьякона до Михаила Пселла, а также участие в колоссальном проекте по переизданию Thesaurus Graecae Linguae Анри Этьенна, Хазе выстроил обширную сеть научных контактов как во Франции, так и по всей Европе.

Помимо работы над изданиями, лексикографией, и знаменитой рукописной подделкой “Записок Готского топарха”, Хазе имел обыкновение вести личные ежедневные записи на древнегреческом. Больше века эти дневники считались утерянными, пока в 2020 не были обнаружены девять сохранившихся оригинальных томов. Проект LAGOOS (lagoos.org) занимается оцифровкой и изучением дневников Хазе, а также готовит цифровые издания каждого тома при помощи HTR-платформы Transkribus.

На лекции мы поговорим о научных трудах Хазе, обсудим цифровые методы распознавания рукописей и анализа текста, а также заглянем на страницы дневника, полные деталей парижской интеллектуальной жизни и филологических загадок.


🎙О спикере: Лев Шадрин изучал историю искусств в РАЖВиЗ, медиевистику в CEU, цифровые методы и прикладную лингвистику в НИУ-ВШЭ. Бывший научный сотрудник проекта DBBE (https://www.dbbe.ugent.be/) о византийских книжных эпиграммах. В настоящее время – PhD студент Инсбрукского университета, сотрудник исследовательского проекта LAGOOS (lagoos.org).

🔗 Участие свободное, подключение по ссылке (Zoom). Ждем вас 9 октября в 18-10 мск!
🔥11
Прочитала в Зоопарке, что Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. Решила глянуть, кто в топе по философии (спойлер: наших нет). Оформила в табличку, ищите друзей и знакомых!

@curiousonya, тебе там кое-что может понравиться 🏃‍♀️🎶

P.S. не спрашивайте меня, как хайдеггер попал в чехи, мне кажется ему с жижеком должно быть нескучно

P.S.S. и как фуко попал в великобританцы тоже не спрашивайте 🤷‍♀️ это наукометрия им виднее
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉95
RAntiquity
Прочитала в Зоопарке, что Elsevier выпустил свои традиционные ежегодные таблички по топ-2% наиболее цитируемых ученых. Решила глянуть, кто в топе по философии (спойлер: наших нет). Оформила в табличку, ищите друзей и знакомых! @curiousonya, тебе там кое-что…
Простите, посмотрела на географическое распределение философов и вспомнила прекрасное.

Индийское море славилось тайфуном, Вязьма -- пряниками, Пампасы -- лесами, Льяносы -- степями, Венеция -- каналами, Китай -- уважением к предкам.
Все славилось!
Хорошая славушка дома сидит, а худая по свету бежит -- и даже Пинские болота славились лихорадками.


(добавим на эту карту соединенные штаты философии.)
😁116
На днях доделала сайт с упражнениями к Цезарю, о чем писала на дружественном канале. Сайт сделан полностью в Quarto c использованием пакета webexercises.

Из интересного: экспорт упражнений в pdf выглядит вполне прилично без дополнительного шаманства с LaTex. Единственное, что я сделала, — это убрала нумерацию страниц через yaml (чтобы потом склеить отдельные страницы в один файл):

pdf:
toc: false
include-in-header:
text: |
\pagenumbering{gobble}


Кривыми при экспорте мне показались только вопросы mcq(); наверное, форматирование списков тоже можно было докрутить через LaTex, но я не большой любитель лежать под капотом, поэтому просто в последний момент придумала штуку, как их заменить на fitb().

По содержанию.

- Первые несколько упражнений я делала на основе правил: сначала лемматизировала текст моделью EvaLatin, потом заменяла по условию некоторые формы на функцию fitb() с правильным ответом и склеивала результат обратно в связный текст. Это оказалось трудоемко и не очень интересно.

- Потом еще несколько упражнений я писала хитроумные промты для GPT со множеством примеров, которые начинались словами “You are a professor of Latin who reads Caesar with your Classics students….” Это оказалось тоже очень трудоемко: приходилось объяснять, как правильно сокращаются формы глагола, что в некоторых глагольных формах два слова, что если ты просишь поставить в нужный падеж существительное, неплохо бы спрятать тот же падеж у прилагательного… И еще кучу, казалось бы, очевидных вещей.

- Это меня так утомило, что последние несколько упражнений я сделала сама, благо там из всего webexercises нужна, по сути, одна функция.

В целом, опыт интересный. Не знаю, принесут ли кому-нибудь пользу эти упражнения, но я эти 18 параграфов Цезаря, пока делала, выучила почти наизусть.
🔥15🙏97❤‍🔥1👎1
Коллеги обратили внимание на вышедший недавно сразу на двух языках сборник:

Nunn, Christopher A. und van Oorschot, Frederike (Hrsg.): Compendium Computational Theology, Bd. 1: Introducing Digital Humanities to Theology, Heidelberg: heiBOOKS, 2024. https://doi.org/10.11588/heibooks.1521

Nunn, Christopher A. und van Oorschot, Frederike (Hrsg.): Kompendium Computational Theology, Bd. 1: Forschungspraktiken in den Digital Humanities, Heidelberg: heiBOOKS, 2024. https://doi.org/10.11588/heibooks.1459

Я заглянула больше из любопытства: как они будут вычислять, что 3 = 1? Но оказалось, что теологии там как таковой нет, есть стандартный набор DH-методов: цифровые издания, анализ эмоциональной тональности (?!), тематическое моделирование, сетевой анализ…

Мое внимание сразу же привлекла глава под названием «Python or R? Getting Started with Programming for Humanists». Ну что могу сказать.

R, on the other hand, was built for statistics. It has several advantages over Python. First, R’s syntax and functionality are tailored for statistical modeling, allowing for complex analyses with concise code.

Фраза «was built for statistics» создает впечатление, что R так и остался узкоспециализированным инструментом, что уже давно не соответствует действительности.

Second, R provides an extensive collection of packages like ggplot2 (Wickham 2016) and Shiny that enable high-quality data visualization and interactive web applications. While Python boasts of good visualization libraries like Plotly and Seaborn (Waskom et al. 2017), the visualizations in R are easier to produce, tend to look nicer, and are easier to customize.

Автор создает впечатление, что Plotly — это исключительно преимущество Python, что не соответствует действительности. С Plotly можно полноценно работать в R.

Third, R’s integration with various data sources and its data manipulation capabilities through packages like dplyr make it a powerful tool for data wrangling. Fourth, although R’s machine learning capabilities may not be as extensive as Python’s, packages like caret and randomForest still provide robust tools for machine learning.

Это утверждение тоже серьезно устарело. Оно основано на ситуации пяти- семилетней давности. Пакет caret сейчас в основном поддерживается в режиме «обслуживания». Его современная замена — это мета-фреймворк tidymodels, который предоставляет унифицированный, современный и строгий интерфейс для сотен моделей машинного обучения в R, полностью интегрированный в tidyverse.

Надеюсь, богословствуют они лучше. Хотя после Великой схизмы уверенности нет.
15🔥9❤‍🔥4👍2😁2
Добрый вечер.
16
Сегодня упражнялась с Google Books API, который совершенно бесплатно, то есть даром, возвращает метаданные к литературе по запросу. Между прочим, там есть и ссылка на обложку, так что вот. A little bit of {magick}
🔥1354
Действительно, петух.
🔥16
Forwarded from Antibarbari HSE (Olga Alieva)
Как говорить по-древнегречески о котиках, маркитантках и карантине? Узнали сегодня из лекции Льва Шадрина о дневниках Карла Бенедикта Хазе.

Свидетель «времен очаковских» и наставник Наполеона III, византинист, по личному распоряжению графа Николая Румянцева издавший Льва Диакона, бонвиван и немножко фальсификатор, Хазе описывает на аттическом наречии Париж начала XIX в., в котором золотая молодежь буянит в кабаках, женщины переодеваются в атласные штаны, а котик Портной, разбив кувшин, получает четверть курочки.

Удивительный документ эпохи благодаря проекту LAGOOS и новейшим цифровым инструментам возвращает к жизни целую эпоху. Смотрите новое видео в рубрике #antibarbari_colloquia
10🔥2
А у вас нет такого же, но с перламутровыми пуговицами? #gpt
😁20
This media is not supported in your browser
VIEW IN TELEGRAM
Гуманист: 🦜
Цифровой гуманист:
17
Потратила некоторое время, чтобы разобраться с настройками автоматической проверки кода на R в GitHub Classroom. Вот тут подробная инструкция: https://teletype.in/@locusclassicus/autograding-github-classroom-r

Особенности:
- поначалу можно сломать голову, но дальше проще;
- нет (пока не вижу) возможности оценивать не по бинарной шкале (passed / failed), а более нюансированно;
- на бесплатном плане придется сделать видимыми студенческие репозитории из-за ограничений Actions;
- под каждое задание надо создавать отдельную пару репозиториев (шаблон + тесты)

Пока ощущение такое, что для преподавателя намного проще скачивать полностью все репозитории и проверять с GradeR. Однако студентам было бы полезнее заранее видеть результат тестов, поэтому буду еще думать.

Если у кого-то есть опыт решения этой проблемы малой кровью, буду рада услышать. #gradeR
🔥5❤‍🔥4👍2
У коллег из ИТМО завтра интересный движ про гуманность, гуманизм и гуманитарность, в связи с чем я вдруг призадумалась, как для себя соотношу все эти понятия.

Наверное, так (но это во мне говорит переводчик Йегера):

- гуманность – это качества, подобающие человеку, Bild или Form;
- гуманизм – институты (в широком смысле) воспитания и культуры, которые эти качества поддерживают (Bildung или Formation);
- гуманитарные науки — то, что поддерживает сам гуманизм, типа монашества в Церкви (все не могут так жить, но кто-то обязательно должен).

При этом разлепить второе и третье я могу только концептуально, не на практике.
15🔥5👏4
🖼️ В Вышке закончился первый учебный модуль, время открывать новый тег с обзором обновлений и доработок курса по R для ОП «Цифровые методы в гуманитарных науках». В прошлом году это был тег #tar2024, но, как становится понятно, это история не на один год, так что пусть будет просто #tar (=Text Analysis with R), на вырост.

🔹 Из урока по табличным данным после некоторых колебаний все же полностью убрала датафреймы, как советовал еще в прошлом году Георгий Мороз. Сразу бескомпромиссный tidyverse во всем!

🔹 Существенно переработала урок по итерациям и функциям, уделив особое внимание теме таинственного аргумента «три точки». Три точки — это сила!

🔹 Разбила на два урока единую тему структурированных данных; теперь JSON отдельно, XML отдельно. Каждый блок существенно расширила, в JSON добавила примеры запросов по API (но эту часть еще надо будет допиливать, там остались мелкие косяки).

🔹 После колебаний все же полностью перешла с пакета XML на xml2. Долго не понимала, зачем (потому что училась по этой книге), но наконец оценила его достоинства: все векторизовано, никаких sapply() и прочих сложных обходов дерева узлов. Опрятно, что и говорить. Буду дальше пользоваться.

🔹 Добавилось новое домашнее задание по мотивам проекта Tolstoy Digital! Огромное спасибо Анастасии Бонч-Осмоловской и Борису Орехову за помощь.

🔹 Экспериментировала с разными методами OCR, очень полезно, о практических результатах расскажут чуть позже коллеги отдельным постом (мы дообучили модель Tesseract!) Основная сложность для студентов пока — дообучение сложно запускать на Windows, а в облаке Posit нет прав для использования команды sudo. Все равно сделали много!

🔹 За техническую поддержку благодарю еще раз Александру Горшенину, за материал для распознавания— Анастасию Богданову, за проверку эталонных данных — Анастасию Богданову и Анастасию Орлову, за подготовку эталонных данных — студентов ОП «Компаративистика», за помощь с проверкой дз — Дарью Галкину, Владу Гурьеву и снова Настю Орлову. Скоро, надеюсь, сможем рассказать больше.

🔹В планах — переработать и остальные уроки; учесть вышедшие за прошедшие месяцы обновления (следить за ними ОЧЕНЬ помогает канал «Наука и данные» @naukaidannye ) и кое-что переделать, а также добавить несколько новых тем.

Ухожу на короткие каникулы — но не отдыхать, а писать очередную заявку, статью и курс лекций.
Please open Telegram to view this post
VIEW IN TELEGRAM
25❤‍🔥11🥰8👍4🔥4
RAntiquity
Коллеги обратили внимание на вышедший недавно сразу на двух языках сборник: Nunn, Christopher A. und van Oorschot, Frederike (Hrsg.): Compendium Computational Theology, Bd. 1: Introducing Digital Humanities to Theology, Heidelberg: heiBOOKS, 2024. https:…
Стоило пошутить по поводу возможности применения количественных методов в теологии, как на отзыв прилетела диссертация по теологии… с применением количественных методов. Очень, между прочим, интересная, чуть позже напишу подробнее. В итоге что? Сижу в ночи лемматизирую Оригена. Осторожнее надо шутить, осторожнее 😇
🔥13💋13💅3👻1
RAntiquity
Потратила некоторое время, чтобы разобраться с настройками автоматической проверки кода на R в GitHub Classroom. Вот тут подробная инструкция: https://teletype.in/@locusclassicus/autograding-github-classroom-r Особенности: - поначалу можно сломать голову…
Охота пуще неволи: один раз решишь, что надо настроить автопроверку, и потом все — как babulenka в “Игроке” Достоевского, начала играть, так уж не остановишь. Столько времени потрачено на эту затею, и так хочется “отыграться” (спойлер: все получилось). И перед мысленным взором носятся образы разных героев, непременно рационализаторов и сторонников прогресса. Поэтому мои входящие за эту ночь выглядят так.

Правда, в отличие от “бабуленьки”, я кое-какую пользу из этого извлекла, все настроила, все постигла и теперь чувствую себя как Фауст. #gradeR
21😁3