RAntiquity
1.09K subscribers
296 photos
11 videos
5 files
546 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
Forwarded from ФГН НИУ ВШЭ
⚡️Магистерская программа ФГН «Цифровые методы в гуманитарных науках» приглашает на вебинар для поступающих ⚡️

Программа готовит специалистов по применению современных инструментов сбора, обработки и моделирования данных в гуманитарных исследованиях.

Здесь студенты:
🔹изучают программирование и математику,
🔹анализируют данные,
🔹работают с корпусными технологиями, средствами автоматической обработки текста и другими актуальными инструментами.

На вебинаре вы узнаете о процессе обучения, особенностях программы и об уникальных карьерных перспективах для выпускников.

Когда: 15 июня 13:00
Где:
Zoom
👍421
Forwarded from DH CLOUD
Что почитать летом?

В этом году исполняется 5 лет магистерской программе Цифровые методы в гуманитарных науках НИУ ВШЭ. Не такой маленький срок в нашем быстро живущем мире.
К юбилею мы составили список публикаций и выступлений по DH преподавателей магистратуры 😎, среди которых два сооснователя DH CLOUD.
Список рубрицирован, а внутри каждой тематической рубрики пункты разделены на научные текстовые публикации, видео выступлений (чаще всего тоже научных) и популяризаторские высказывания (чаще всего текстовые). Перечень снабжен ссылками. Он включает материалы с 2013 по 2024 год, так что получился изрядным.

Если вы пропустили что-то из этих текстов и видео, то лето — хороший момент, чтобы наверстать.
10
📆 Исторический факультет МГУ имени М.В. Ломоносова и Ассоциация «История и компьютер» 27 – 30 июня 2024 г. проводят международную летнюю школу молодых ученых по исторической информатике — «Историческая информатика – 2024».

☑️ Регистрация на Школу будет открыта до 21:00 (msk) 26 июня 2024 года. Заявки с докладом принимаются до 17 июня (включительно).


Nomina, как у нас говорят, date! 27 июня приведу 10 причин для того, чтобы полюбить R 🩷
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤‍🔥3👍1
Many statistical and computational humanities projects often proceed on the basis of ‘because we can’. Which is to say that, for example, a literary or philosophical corpus is interrogated by developing data on, say, frequencies of word use, or patterns of lexical coassociation. This data might then be exported into a software package for visualisation and, for example, a word cloud is produced. Why do projects carry out this kind of research and presentation of findings? Often it is ‘because we can’, because the software packages allow one to do this. In many of these cases the first and most important question has not been asked or framed in a useful way.

Питер де Болла, руководитель многолетнего кембриджского проекта по цифровой истории идей (отсюда).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥4👾3
👆🔹🔸🕊

Есть некая кривая, на которой отражена связь между словом W и всеми другими словами корпуса. По оси Y некая мера ассоциации, по оси X — ранг (рис. 1). Авторы исследования рассуждают, где “отсекать” незначимые связи (рис. 2).

Вопрос. Почему производная именно -1? Почему, например, не вторая производная = 0 (если имеется в виду точка перегиба)?

Добавление. Код они не выкладывают, степень полинома не уточняют. Но допустим, что это полином третьего порядка.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Yan Holtz сделал поисковик по палитрам в R💜

Сразу с примерами графиков, проверкой на дальтонизм и возможность экспорта как списком hex кодов (можно забрать в Табло), так и библиотекой в R.

https://r-graph-gallery.com/color-palette-finder
🔥6
Вы уже поняли, что последнее время я углубилась в разных древних французов, и одного из них зовут Мишель Пешё. Он был марксистом, фрейдистом и структуралистом, но в сущности славным парнем. Начал считать в 1969 г. — еще до того, как это стало модным. Кажется, в его сторону посматривает Фуко, когда говорит в «Археологии знания» о пользе дистрибутивной семантики. Некоторые работы Пешё, как ни странно, переведены на русский в далеком 1999 г.

Меня заинтересовала статья под названием «Как читать архивный документ сегодня?» Это коротенький текст, который всем рекомендую. Для тех, у кого идиосинкразия на витиеватый стиль французских «-истов» — сейчас напою, но не вините Карузо.

Есть две культуры чтения архивных документов (под которыми М.П. понимает широкий круг исторических источников). Одна — условно «гуманитарная». Так читают историки, философы и литературоведы, создающие «полемическое пространство способов чтения».

Вторая культура — это культура условных «технарей». Это огромная анонимная работа, при помощи которой власть управляет коллективной памятью. Так читают нотарии, секретари, «канцелярские крысы» и т.п. Здесь считается доблестью отказ от оригинальности и «молчаливое самоустранение» в пользу Церкви, Короля, Государства или Предприятия.

Развитие методов массовой обработки информации архивных документов в государственных или коммерческих интересах … нашли в этой сфере одно из своих применений: проблема «объективности» процедур и результатов … приобретала столь важное значение, что апелляция к Науке (в виде математики, прежде всего статистики… и математической логики…) постепенно утвердилась как нечто само собой разумеющееся.


Разделение между «гуманитариями» и «технарями» (в оригинале le littéraire и le scientifique) отражает социальное разделение в подходах к чтению. Первым дано право на оригинальные прочтения, вторым — «подневольная работа» по поддержанию заранее заданных «интерпретаций».

Хочется спросить, зачем же тогда сам Пешё берется за компьютерные методы? Он видит угрозу в том, что он сам называет «нормализация чтения и мысли». Эта нормализация ведет к стиранию исторической памяти. Противостоять такой нормализации можно, лишь постоянно размышляя о языке «как особой материальной сущности». Эта сущность противостоит и «иллюзии универсальности», которая так свойственна «технарям», и обособленности множества языков «гуманитариев».

В одном из примечаний он добавляет, что надо бороться с этим «разделением труда»,

иначе велика опасность выхода на ведущие позиции, в том числе и в областях, связанных с классическими гуманитарными дисциплинами, исследователей с чисто математическим образованием — со всеми неудобствами, которые это могло бы за собой повлечь.


Сложно поверить, но это написано в 1982 г.
9❤‍🔥3🔥3🤔3👍1
📝 Вычислить Платона

Древнегреческий философ Платон оставил не меньше загадок для филологов, чем Уильям Шекспир. До нас дошло немало диалогов под его именем, но какие были действительно написаны им, а какие более поздний подлог? Кроме того, Платон был умелым стилистом: он хорошо писал в разных жанрах и отлично имитировал речи и тексты других людей, включая женщин того времени. Все это создаёт проблемы в хронологической периодизации его сочинений. С учётом влияния, которое платонизм оказал на всю европейскую философию, культуру и религию, установление подлинного авторства ряда диалогов представляет важную проблему.

Как в этом могут помочь статистические методы, такие как стилометрия, рассказывает в своей авторской колонке на IQ.HSE доцент факультета гуманитарных наук НИУ ВШЭ, основательница телеграм-канала о древних языках, античной культуре и философии Antibarbari HSE, Ольга Алиева @rantiquity.
Please open Telegram to view this post
VIEW IN TELEGRAM
10❤‍🔥3🔥3👏1
В лекциях и статьях по векторной семантике часто упоминается, что за всей этой историей со смыслом, производным от контекста, есть что-то от “речевых игр” Витгенштейна. Но обычно ссылки следуют на Харриса и Ферса, и не очень ясно, какими путями в компьютерную лингвистику проник Витгенштейн (понятно, что после войны он был везде, но хотелось бы поконкретнее).

Сегодня нашла одну интересную ниточку. Маргарет Мастерман, в 1933-1934 была одной из студентов Витгенштейна, чьи заметки легли в основу “Голубой книги”. В 1955 г. основала лабораторию Cambridge Language Research Unit, которая занималась исследованиями в области компьютерной семантики и автоматического перевода. Среди прочего, Мастерман разработала алгоритмы, которые позволяли переводить с английского на латынь (куда же еще?). Об этом здесь.

А я вспомнила про другую Маргарет, Гамильтон, которая тоже не только умела кодить, но и знала древние языки.
10❤‍🔥1
«В компьютерных играх иногда так бывает, что есть у персонажа линейки разных качеств: мораль, сила, магия, выносливость. По сравнению, например, с руководством лаборатории внутри университета, когда ты становишься ректором, такие качества нужно всерьёз прокачать?»

Узнаем, послушав новый выпуск «Лиги Айвы»: в подкасте Бориса Орехова («об университете как о республике ученых») вышла беседа с ректором СФУ Максимом Румянцевым.

🌐 YouTube
🫥 Mave
🎵 Яндекс.Музыка
🌐 VK Видео
🍏 Apple podcasts

#людиdh
Please open Telegram to view this post
VIEW IN TELEGRAM
62🔥2
🐍 Друзья, посоветуйте, пожалуйста, онлайн-интерпретатор питона, бесплатный, для групповой работы, с хорошей синхронизацией. Collab не сразу отражает изменения, а мне надо, чтобы как на Miro/Figma, было видно, кто что делает. Вообще бывает такое?
RAntiquity
Мне уже приходилось рассказывать о том, что количественные исследования в платоноведении начались во второй половине 19 в., когда никаких компьютеров не было даже в планах, но вот чего вы скорее всего не знали — несколько таких работ написаны на латыни. Такова…
Продолжаю пополнять латинский словарь цифрового гуманиста.

🌺lingua programmandi язык программирования

🪄programmator / -trix программист

🌺Salve, munde! Hello, world

🪄Interrete Интернет

🌺situs interretialis сайт

🪄intellegentia artificialis искуственный интеллект

🌺machina autodidacta / machina autodocens машинное обучение (как область знания -- ars machinae autodidactae / autodocentis)

Последнее подслушала в латинской речи одного гарвардского выпускника, который написал нейросетку для классификации текстов Платона. Прекрасная диссертация, прекрасная латынь (и греческий, само собой).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15😍7👍3
RAntiquity
Сегодня полезная штуковина для тех, кто занимается сравнением переводов, версий документа и т.п. Выравниватель на основе алгоритма Смита — Ватермана. library(text.alignment) a <- "Gallia est omnis divisa in pates tres." b <- "Gallia omnis divisa in partes…
Есть у меня замысел сравнить один оригинальный перевод Платона с версией, решительно исправленной редактором. Желательно не вручную. Вспомнила про старый пост о выравнивателе. Как бы от этого перейти к html?

Пока придумала задействовать регулярные выражения, чтобы расставить html-теги:



library(text.alignment)
a <- "Gallia est omnis divisa partes tres."
b <- "Gallia omnis divisa in partes tres"

res <- smith_waterman(a, b, type = "words")

library(stringr)
library(tidyverse)
tbl <- tibble(a = res$a$alignment$tokens, b = res$b$alignment$tokens)

tbl_new <- tbl |> mutate(a_new = case_when(str_detect(a, "#+") ~ paste0("<mark>", b, "</mark>"), .default = a)) |> mutate(b_new = case_when(str_detect(b, "#+") ~ paste0("<mark>", a, "</mark>"), .default = b))



Это вернет табличку как на картинке. От которой несложно перейти к html как на картинке. Чувствую, что будут еще подвохи на этом пути, но хочется пробовать. Может быть надо идти через ecomparatio, но почему-то этот путь кажется мне проще.
1
RAntiquity
Уже сейчас.
Невероятно приятно и почетно получить такое письмо от одной из старейших профессиональных ассоциаций в области цифровых гуманитарных наук в России. Большое спасибо, коллеги, я очень тронута 💚
Please open Telegram to view this post
VIEW IN TELEGRAM
27🎉12😍5👍1
Forwarded from Antibarbari HSE (Olga Alieva)
🌱Одно из первых открытий, которое делают изучающие латинский язык, заключается в том, что слово «культура» происходит от латинского глагола colo «возделывать». Гораздо менее известно, что свое сельскохозяйственное значение существительное сохраняло почти до середины XIX в.

🖥 Появление больших машиночитаемых корпусов позволило визуализировать историю «культуры». Исследователи натренировали векторные модели (подробнее о том, что это такое, — здесь) на корпусе British Periodicals Online и отобрали ближайших «соседей» культуры в разные периоды. То, что у них получилось, вы видите на картинке.

🌱Изначально в семантическом окружении слова преобладают смыслы, связанные с культурой или возделыванием земли («садоводство», «растительность», «орошение»); родственные сельскохозяйственные термины («посадка», «посев», «почва») продолжают появляться в орбите слова вплоть до XIX века. Лишь в 1820-1840 гг. становится заметна семантика, связанная с «культивацией» умов («образование», «интеллектуальный», «обучение»), а в конечном итоге — и всего общества («просвещение», «науки», «цивилизация»).



А как вы думаете, какое слово в европейских языках соответствовало “культуре” до сер. XIX в.? Или же понятия культуры вообще не было?
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥4
Forwarded from ФГН НИУ ВШЭ
📚В помощь абитуриентам: список публикаций и выступлений о цифровых гуманитарных исследованиях от преподавателей магистерской программы «Цифровые методы в гуманитарных науках» ФГН.

На программе преподают доценты ФГН Ольга Алиева, Анастасия Бонч-Осмоловская, Борис Орехов, которые давно занимаются разработками в этой области.

Список покрывает практически все аспекты цифровых методов, востребованных гуманитариями, и включает около 120 пунктов. В него вошли научные статьи, популярные публикации, видео лекций и докладов. Список будет пополняться по мере появления новых статей и выступлений, и доступен по ссылке 🖥

«Вряд ли где-то еще в России или даже в мире вы увидите такую широту и разнообразие компетенций, освоенных цифровыми гуманитариями Вышки», — сказал академический руководитель магистратуры доцент ФГН Борис Орехов.


В этом году магистратуре «Цифровые методы в гуманитарных науках» исполняется пять лет.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥113👍2🍓1