RAntiquity
1.09K subscribers
297 photos
11 videos
5 files
547 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
Для перевода названия населенного пункта "Вороново" на латынь можно использовать следующий вариант:

Corvinum

Объяснение:

- "Вороново" происходит от слова "ворона", поэтому латинский перевод будет базироваться на этом.
- Слово "корвус" (corvus) в латыни означает "ворона".
- Путем добавления окончания "-inum" образуется прилагательное "корвинум" (Corvinum), что означает "принадлежащий воронам" или "связанный с воронами".

Таким образом, латинский вариант названия населенного пункта "Вороново" будет Corvinum.
6🔥2👎1
Forwarded from DH CLOUD
Широко известен эффект, который дают операции с векторами слов (о них можно почитать в главе про анализ текста в монографии Цифровые гуманитарные исследования и послушать в лекции Д. А. Рыжовой на курсе Критическое введение в Digital Humanities в НИУ ВШЭ): если вычесть из вектора слова «король» вектор слова «мужчина» и прибавить вектор слова «женщина», то получится вектор, близкий к вектору слова «королева».

Ученые из DH CLOUD выяснили, что этот эффект был предсказан 🔮 в классической русской литературе, а именно — в пьесе Гоголя "Женитьба": "Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожалуй, прибавить к этому ещё дородности Ивана Павловича".
😁8
💎 Как говорил Гераклит, начало и конец -- одно и то же, и наш курс, закруглившись, пришел к вводной лекции. Мы сделали полный круг: поговорили о различных инструментах и подходах в DH, а теперь пришло время посмотреть на отрасль в целом.

Свои рассуждения о DH в общенаучном контексте предложил руководитель магистерской программы “Цифровые методы в гуманитарных науках”, доцент Школы лингвистики НИУ ВШЭ Борис Орехов.

Одним из неожиданных выводов лекции стала мысль о том, что междисциплинарность невозможна, а самые интересные цифровые исследования посвящены традиционным вопросам гуманитарных дисциплин. Когда же DH пытаются быть "просто" набором цифровых инструментов, это выглядит глупо наивно.

Вот такой парадоксальный вывод курса получился. Видео всех лекций вы можете найти на сайте: https://criticaldh.ru/

На следующей неделе планируем еще одно мероприятие, оставайтесь на связи. #criticaldh
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73❤‍🔥1
Stylo: какие слова отличают один текст от другого?

Stylo — программа для исследования стилистики текста. «‎Системный Блокъ»‎ подготовил для вас уже третий гайд по этому инструменту (вот ссылки на первые два, базовый и продвинутый). На этот раз разбираемся с функцией oppose(), которая помогает найти отличия между лексическими составами двух корпусов текстов. Например, выяснить, чем Толстой отличается от Достоевского, а Тургенев — от Гончарова.

Для каждого из корпусов oppose() показывает, какие слова характерны для входящих в него текстов и в то же время редко встречаются во втором наборе. Также функция может учитывать дополнительный, контрольный, корпус — его добавляют, если нужно проверить точность результатов или определить, какой из двух исследуемых корпусов больше похож на контрольный (используется при определении автора текста).

oppose() анализирует текст по фрагментам (длины можно выбрать самостоятельно), и благодаря этому учитывает распределение слов в тексте: даже если какое-то слово встречается часто, но лишь в одном фрагменте длинного текста, оно не будет отмечено как характерное для всего корпуса.

В полной версии гайда мы сравнили романы Тургенева «Накануне» и «Дворянское гнездо» с «Обрывом» и «Обыкновенной историей» Гончарова, добавив контрольный корпус из «Обломова» и «Рудина». В результате получилось, что у Тургенева персонажи больше говорят (для выбранных романов характерны слова типа промолвить, воскликнуть, возразить), а у Гончарова — смотрят (романы отличают слова поглядеть, смотреть, посмотреть, взгляд).

Если изменить параметры визуализации, то можно получить график, где будет показано, насколько далеко отстоят друг от друга тексты из разных корпусов — то есть, насколько сильно они отличаются и, наоборот, какие похожи друг на друга. Предлагаем читателям угадать, какие выводы удалось сделать на основе получившегося у нас графика.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71
🛠 Робин Коллингвуд о (текст-)майнинге. Очень полезное чтение для цифровых гуманистов.

Став преподавателем философии, я не забросил исторических и археологических занятий. Каждое лето я работал в каких-то крупных археологических партиях, а с 1913 г. сам возглавлял раскопки. Раскопки стали одним из самых больших наслаждений моей жизни. В свое время я научился руководить школьниками, теперь я должен был руководить рабочими, заботиться об их нуждах и здоровье, понимать их отношение к решению нашей общей задачи и помогать им понять мое собственное. Занимаясь раскопками, я неожиданно для себя оказался включенным в своеобразную экспериментальную работу лаборатории мысли. Сначала я задавал себе очень неопределенные вопросы типа: «Было ли на этом месте поселение эпохи Флавиев?» Затем этот вопрос делился на ряд подвопросов, которые принимали, например, такую форму: «Появились ли эти флавиевские черепки и монеты в более поздний период или в то же самое время, которым они датируются?»

Я рассматривал все возможные решения, проверял их одно за другим до тех пор, пока не смог сказать себе: «Да, здесь в эпоху Флавиев действительно было поселение; здесь в А±В году действительно был построен земляной и деревянный форт, имевший такой-то план, и этот форт был оставлен по таким-то и таким-то причинам в X±Y году». Опыт мыслительной работы подобного рода скоро научил меня, что вообще ничего нельзя найти, если заранее не поставить вопроса, причем вопроса не расплывчатого, а вполне определенного. Когда люди копают, просто говоря: «Давайте-ка посмотрим, что тут есть»,— то они ничего не узнают
Please open Telegram to view this post
VIEW IN TELEGRAM
7
☀️ Впереди жаркий июнь, и это время можно провести вместе с нами на фестивале "В разработке"!

ПАНДАН
запускает совместный проект с библиотеками Выборгского района в Санкт-Петербурге. ПАНДАН выступит с открытыми лекциями, дискуссиями и кинопоказами в библиотеках Санкт-Петербурга.

Можно ли перестать учить правила орфографии и грамматики, если у нас есть автоматическое исправление ошибок? Зачем писать курсовую и диссертацию самостоятельно, если есть chatGPT? Что происходит с ответами на вопросы анкет, когда мы заполняем их по просьбе людей на улице или в интернете? Если изменить свое лицо на фотографии на мордочку кота – это будет считаться преступлением?

Ответы на эти и другие вопросы вы найдете на открытых мероприятиях фестиваля.

Подробнее с программой фестиваля можно ознакомится на сайте проекта.

📌Для кого организован проект?

Для людей, которые хотят развиваться в сфере анализа данных или уже имеют опыт работы с цифровыми методами.

💬Как следить за новостями?

Для того, чтобы следить за новостями, присоединяйтесь в телеграм-чат.

📌Первое мероприятие пройдет 13 июня в 19:00: открытая дискуссия: «Образование в IT: как выжить?».

Приходите к нам!
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥4👍1
Ну ладно, ок, почему бы и нет.
😭9🔥3😁31
Всем сторонникам поиска объективного знания через цифру посвящается.

Инструменты — суть не что иное, как материализованные теории. Из них выходят явления, которые на любой своей части несут теоретическую печать.

Гастон Башляр. Новый научный дух. 1934.
11
Недавно Соня @curiousonya прислала ссылку на очень любопытную статью. Называется Michel Foucault and the Digital Humanities. Смысл такой: Мишель Фуко ничего не считал. Но мог бы!



Вообще сослагательное наклонение в таких случаях выглядит подозрительно, но если заглянуть во введение к «Археологии знания», то можно заметить, что Фуко рекомендует историкам применять «частотный и дистрибутивный (!) анализ». До word2vec оставалось каких-то 45 лет…

На дворе 1969 г., в журнале Langages только что опубликовали перевод статьи американского лингвиста Зеллига Харриса «Анализ дискурса» (англ. текст вышел в 1952 г.). Где-то по соседству марксист Пешё пишет программулину на FORTRAN, воплощая в жизнь заветы Харриса. Все очень оживлены и надеются, что вот-вот компьютер станет на сторону человека в идеологической борьбе с угнетателями.

Но что-то пошло не так.
Please open Telegram to view this post
VIEW IN TELEGRAM
8🤔3
Forwarded from DH CLOUD
“ЦИФРОВОЙ ГУМАНИТАРИЙ” – ЗВУЧИТ НЕОБЫЧНО И ПАРАДОКСАЛЬНО?
Магистерская программа “Цифровые методы в гуманитарных науках” НИУ ВШЭ
❤️ приглашает на вебинар для поступающих.
Ссылка на вебинар.
В субботу 15 июня в 13.00 (мск.) мы ждем 🔘 тех, кто:
📖 … уже является специалистом в гуманитарной области и хочет научиться применять новейшие компьютерные методы в работе с гуманитарным знанием;
👀 … на “ты” с программированием, анализом данных, статистикой и другими цифровыми технологиями – и хочет с их помощью узнавать новое про литературу, историю и культуру;
☕️ … всех, кому интересно как: подружить нейросети с поэзией, создать цифровую копию Помпей, вычислить настоящего автора шекспировских пьес, построить компьютерную модель “Войны и мира”, научить компьютер расшифровывать древние манускрипты – и многое другое!
Руководители и преподаватели расскажут о магистерской программе и ответят на ваши вопросы.
🔗 Наш сайт: https://www.hse.ru/ma/dh
🖥 Наше сообщество: https://dhcloud.org/
🆕 Наши новости: https://t.iss.one/dhcloud https://t.iss.one/rantiquity
💬 Наши люди: Борис Орехов, Ольга Алиева, Анастасия Бонч-Осмоловская и др.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥53👾3
Forwarded from ФГН НИУ ВШЭ
⚡️Магистерская программа ФГН «Цифровые методы в гуманитарных науках» приглашает на вебинар для поступающих ⚡️

Программа готовит специалистов по применению современных инструментов сбора, обработки и моделирования данных в гуманитарных исследованиях.

Здесь студенты:
🔹изучают программирование и математику,
🔹анализируют данные,
🔹работают с корпусными технологиями, средствами автоматической обработки текста и другими актуальными инструментами.

На вебинаре вы узнаете о процессе обучения, особенностях программы и об уникальных карьерных перспективах для выпускников.

Когда: 15 июня 13:00
Где:
Zoom
👍421
Forwarded from DH CLOUD
Что почитать летом?

В этом году исполняется 5 лет магистерской программе Цифровые методы в гуманитарных науках НИУ ВШЭ. Не такой маленький срок в нашем быстро живущем мире.
К юбилею мы составили список публикаций и выступлений по DH преподавателей магистратуры 😎, среди которых два сооснователя DH CLOUD.
Список рубрицирован, а внутри каждой тематической рубрики пункты разделены на научные текстовые публикации, видео выступлений (чаще всего тоже научных) и популяризаторские высказывания (чаще всего текстовые). Перечень снабжен ссылками. Он включает материалы с 2013 по 2024 год, так что получился изрядным.

Если вы пропустили что-то из этих текстов и видео, то лето — хороший момент, чтобы наверстать.
10
📆 Исторический факультет МГУ имени М.В. Ломоносова и Ассоциация «История и компьютер» 27 – 30 июня 2024 г. проводят международную летнюю школу молодых ученых по исторической информатике — «Историческая информатика – 2024».

☑️ Регистрация на Школу будет открыта до 21:00 (msk) 26 июня 2024 года. Заявки с докладом принимаются до 17 июня (включительно).


Nomina, как у нас говорят, date! 27 июня приведу 10 причин для того, чтобы полюбить R 🩷
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤‍🔥3👍1
Many statistical and computational humanities projects often proceed on the basis of ‘because we can’. Which is to say that, for example, a literary or philosophical corpus is interrogated by developing data on, say, frequencies of word use, or patterns of lexical coassociation. This data might then be exported into a software package for visualisation and, for example, a word cloud is produced. Why do projects carry out this kind of research and presentation of findings? Often it is ‘because we can’, because the software packages allow one to do this. In many of these cases the first and most important question has not been asked or framed in a useful way.

Питер де Болла, руководитель многолетнего кембриджского проекта по цифровой истории идей (отсюда).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥4👾3
👆🔹🔸🕊

Есть некая кривая, на которой отражена связь между словом W и всеми другими словами корпуса. По оси Y некая мера ассоциации, по оси X — ранг (рис. 1). Авторы исследования рассуждают, где “отсекать” незначимые связи (рис. 2).

Вопрос. Почему производная именно -1? Почему, например, не вторая производная = 0 (если имеется в виду точка перегиба)?

Добавление. Код они не выкладывают, степень полинома не уточняют. Но допустим, что это полином третьего порядка.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Yan Holtz сделал поисковик по палитрам в R💜

Сразу с примерами графиков, проверкой на дальтонизм и возможность экспорта как списком hex кодов (можно забрать в Табло), так и библиотекой в R.

https://r-graph-gallery.com/color-palette-finder
🔥6
Вы уже поняли, что последнее время я углубилась в разных древних французов, и одного из них зовут Мишель Пешё. Он был марксистом, фрейдистом и структуралистом, но в сущности славным парнем. Начал считать в 1969 г. — еще до того, как это стало модным. Кажется, в его сторону посматривает Фуко, когда говорит в «Археологии знания» о пользе дистрибутивной семантики. Некоторые работы Пешё, как ни странно, переведены на русский в далеком 1999 г.

Меня заинтересовала статья под названием «Как читать архивный документ сегодня?» Это коротенький текст, который всем рекомендую. Для тех, у кого идиосинкразия на витиеватый стиль французских «-истов» — сейчас напою, но не вините Карузо.

Есть две культуры чтения архивных документов (под которыми М.П. понимает широкий круг исторических источников). Одна — условно «гуманитарная». Так читают историки, философы и литературоведы, создающие «полемическое пространство способов чтения».

Вторая культура — это культура условных «технарей». Это огромная анонимная работа, при помощи которой власть управляет коллективной памятью. Так читают нотарии, секретари, «канцелярские крысы» и т.п. Здесь считается доблестью отказ от оригинальности и «молчаливое самоустранение» в пользу Церкви, Короля, Государства или Предприятия.

Развитие методов массовой обработки информации архивных документов в государственных или коммерческих интересах … нашли в этой сфере одно из своих применений: проблема «объективности» процедур и результатов … приобретала столь важное значение, что апелляция к Науке (в виде математики, прежде всего статистики… и математической логики…) постепенно утвердилась как нечто само собой разумеющееся.


Разделение между «гуманитариями» и «технарями» (в оригинале le littéraire и le scientifique) отражает социальное разделение в подходах к чтению. Первым дано право на оригинальные прочтения, вторым — «подневольная работа» по поддержанию заранее заданных «интерпретаций».

Хочется спросить, зачем же тогда сам Пешё берется за компьютерные методы? Он видит угрозу в том, что он сам называет «нормализация чтения и мысли». Эта нормализация ведет к стиранию исторической памяти. Противостоять такой нормализации можно, лишь постоянно размышляя о языке «как особой материальной сущности». Эта сущность противостоит и «иллюзии универсальности», которая так свойственна «технарям», и обособленности множества языков «гуманитариев».

В одном из примечаний он добавляет, что надо бороться с этим «разделением труда»,

иначе велика опасность выхода на ведущие позиции, в том числе и в областях, связанных с классическими гуманитарными дисциплинами, исследователей с чисто математическим образованием — со всеми неудобствами, которые это могло бы за собой повлечь.


Сложно поверить, но это написано в 1982 г.
9❤‍🔥3🔥3🤔3👍1