Forwarded from Vox mediaevistae
Объявление для франкоязычных: до 19 декабря можно записаться на трехдневный воркшоп про цифровые издания и (что я нахожу исключительно интересным) цифровую стемматологию. Состоится он в январе под Греноблем и очно
20 декабря 2023 года в 16:00 (msk) / 20:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Ольга Валерьевна Алиева (НИУ ВШЭ) с докладом «Платоноведение в фокусе алгоритма LDA: тематическое моделирование как способ изучения диахронных сдвигов». https://dhri.timepad.ru/event/2707001/
Историки философии не спешат осваивать инструментарий DH. Количественные подходы оказываются более всего востребованы в той области, которая методологически связана с Кембриджской школой, а содержательно — с политической мыслью Нового времени. Цифровая «история идей» активнее всего разрабатывает методы, связанные с дистрибутивной семантикой, однако за пределами этого подхода встречаются и другие методы «дальнего чтения».
Один из них — тематическое моделирование с использованием Латентного размещения Дирихле (LDA). В 2019 г. группа канадских исследователей применила метод тематического моделирования для ответа на вопрос о том, что такое «философия науки» и как трансформировалось это понятие за последние 100 лет. Это и подобные исследования показывают, что инструментарий DH может быть востребован как способ организации эмпирического материала в большие исторические нарративы. Достоинства и ограничения такого подхода мы решили проверить на собственном опыте, смоделировав небольшой (всего за 10 лет) архив журнала «Платоновские исследования», и о результатах этого эксперимента и пойдет речь в докладе.
Историки философии не спешат осваивать инструментарий DH. Количественные подходы оказываются более всего востребованы в той области, которая методологически связана с Кембриджской школой, а содержательно — с политической мыслью Нового времени. Цифровая «история идей» активнее всего разрабатывает методы, связанные с дистрибутивной семантикой, однако за пределами этого подхода встречаются и другие методы «дальнего чтения».
Один из них — тематическое моделирование с использованием Латентного размещения Дирихле (LDA). В 2019 г. группа канадских исследователей применила метод тематического моделирования для ответа на вопрос о том, что такое «философия науки» и как трансформировалось это понятие за последние 100 лет. Это и подобные исследования показывают, что инструментарий DH может быть востребован как способ организации эмпирического материала в большие исторические нарративы. Достоинства и ограничения такого подхода мы решили проверить на собственном опыте, смоделировав небольшой (всего за 10 лет) архив журнала «Платоновские исследования», и о результатах этого эксперимента и пойдет речь в докладе.
❤🔥13
Немного Роберта Фроста этим снежным вечером.
https://youtu.be/5DwWXjcf390
https://youtu.be/5DwWXjcf390
YouTube
Занятие 14. Анализ эмоциональной тональности
Запись занятия 08.12.2023
❤🔥9
Мудрость дня: с tesseract можно распознавать многоязычные pdf. В моем случае -- английский, русский, древнегреческий. Справляется отлично. Всех дел на несколько строчек кода (точнее одну, если не считать загрузку пакетов):
Хитрость в этом плюсике, без него ничего не получится.
library(purrr)
library(pdftools)
corpus <- map(pdf_names, pdf_ocr_text, language = "rus+eng+grc")Хитрость в этом плюсике, без него ничего не получится.
👍6🔥4❤3😱2
Любопытная дискуссия о применимости цифры в философии из одного древнего блога.
Скептическая реплика о применимости цифры в философии:
Ответ, пожалуй, спорный -- но интересный.
Интересно, что такого рода споров в журналах почти не найти. В журналы и монографии попадают только рапорты об успехах -- впрочем, все мы понимаем, почему.
Скептическая реплика о применимости цифры в философии:
The kind of research questions with which philosophers engage require precisely the kind of intelligence that we haven’t been able to teach machines...
Ответ, пожалуй, спорный -- но интересный.
When we compare the familiar methods of reading and writing to some of the more recent computational methods and visualizations, the former can seem a transparent window on philosophical truth and the latter comparatively opaque and bewildering. But surely the art of reading and writing text is itself merely another technology, and there is no essential link between traditional text-based methods and philosophical truth.
Интересно, что такого рода споров в журналах почти не найти. В журналы и монографии попадают только рапорты об успехах -- впрочем, все мы понимаем, почему.
Digital Scholarship in the Humanities
Exploring the Significance of Digital Humanities for Philosophy
On February 23, I was honored to speak at an Invited Symposium on Digital Humanities at the American Philosophical Association’s Central Division Meeting in New Orleans. Organized by Cameron …
❤5
Forwarded from Гуманитарии в цифре
«Цифровая среда»: Платоноведение в фокусе алгоритма LDA
В эту среду, 20 декабря, приглашаем всех желающих присоединиться к онлайн-заседанию научно-методического семинара с участием Ольги Алиевой (НИУ ВШЭ).
✨ Начало: 16:00 (мск) / 20:00 (крск)
«Цифровая среда» – проект Института цифровых гуманитарных исследований СФУ, научная платформа для обмена результатами актуальных исследований и мнениями о новых технологиях и подходах в области цифровой гуманитаристики.
⏺ Посмотреть записи предыдущих выпусков «Цифровой среды».
⏺ Зарегистрироваться на семинар.
#цифроваясреда #смотреть #слушать
В эту среду, 20 декабря, приглашаем всех желающих присоединиться к онлайн-заседанию научно-методического семинара с участием Ольги Алиевой (НИУ ВШЭ).
«Цифровая среда» – проект Института цифровых гуманитарных исследований СФУ, научная платформа для обмена результатами актуальных исследований и мнениями о новых технологиях и подходах в области цифровой гуманитаристики.
⏺ Посмотреть записи предыдущих выпусков «Цифровой среды».
⏺ Зарегистрироваться на семинар.
#цифроваясреда #смотреть #слушать
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰12
Как жить с этим знанием и когда читать книги, памагитя.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7❤🔥5❤2
RAntiquity
Подобное исследование
Свои выводы автор изложил в небольшой статье в онлайн-издании Daily Nous. Важнейший из них заключается в том, что
...существует огромная разница между работами конца XIX – начала XX века, которые современные аналитические философы воспринимают всерьез, и работами, которые обычно появляются в журналах в те годы.
В период с 1915 по 1941 год практически не обсуждалась работа Бертрана Рассела «On Denoting». Долгое время не обсуждались в журналах такие фигуры, как Джордж Эдвард Мур и Готлоб Фреге. Поздние работы Витгенштейна привлекают внимание современников, но «Трактат» также остается незамеченным, а тема позитивизма «активируется» уже в контексте проблемы верификации.
Напротив, замечает исследователь, журналы начала века полны статей о различных формах идеализма, при этом в британских журналах основное внимание уделяется сознанию (mind) и метафизике, а в американских — этике и политической философии. Многие выдающиеся авторы той эпохи сегодня более или менее полностью забыты.
Шэдворт Ходжсон опубликовал три десятка работ в ведущих журналах, и в наши дни о нем редко упоминают даже вскользь.
Для тех, кто желает воспроизвести экперимент, Уэзерсон подготовил небольшой туториал. Остальные могут просто приободриться, если их не цитируют -- или почитать оживленную дискуссию под постом в Daily Nous.
Please open Telegram to view this post
VIEW IN TELEGRAM
www.fulcrum.org
A History of Philosophy Journals, Volume 1: Evidence from Topic Modeling, 1876–2013
This book uses computer modeling to investigate trends in what is published in leading philosophy journals over the last century and a half. The notable trends include the rise of realism from a fringe view to the mainstream metaphysical outlook, the increase…
❤6👍1
Ну и совсем чтоб приободриться. "Новый метод максимумов и минимумов" (лат. Nova Methodus pro Maximis et Minimis) — первая опубликованная работа по математическому анализу. Она была опубликована Готфридом Лейбницем в немецком научном журнале «Acta Eruditorum» в октябре 1684 года. Считается рождением исчисления бесконечно малых. Смотрим на количество цитирований.
😁6💯2
Один из них мы нашли в работе американского DH-исследователя Камерона Блевинса, который смоделировал дневник американской акушерки XVIII в. Марты Баллард. За свою долгую и непростую жизнь (1735–1812) Баллард сделала около 10 000 дневниковых записей, в которых она рассказывает о принятых родах, о различных личных перипетиях и о многом другом. Эти записи легли в основу работы Л. Т. Ульрих «История повитухи» (1990), за которую она получила Пулитцеровскую премию.
Блевинс заметил, что свои записи Баллард нередко начинает с сообщения о погоде, и один из LDA-топиков собрал лексику, связанную с холодной погодой. Сюда вошли слова «ветер», «холод» и т.п. Измерив присутствие этой темы в разное время года, Блевинс увидел, что тема “активируется” в зимние месяцы; в то время как весной и летом Баллард больше говорит о своем саде.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1
Forwarded from Гуманитарии в цифре
На отечественном поле цифровой гуманитаристики не так много исследований, связанных с философией, потому «Платоноведение в фокусе алгоритма LDA» – доклад особенно интересный. Делимся видео!
#цифроваясреда #людиdh
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
„Платоноведение в фокусе алгоритма LDA“
20 декабря 2023 года состоялось очередное заседание научного семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета.
На семинаре Ольга Валерьевна Алиева (НИУ ВШЭ) выступила с докладом «Платоноведение…
На семинаре Ольга Валерьевна Алиева (НИУ ВШЭ) выступила с докладом «Платоноведение…
❤14🔥1
RAntiquity
https://youtu.be/80Dg8ybYCJA?si=JCA9Ft2mnaLRpOHF
Из домашки по курсу анализа текста на языке R родилась целая статья! Поздравляю Женю Дуненкова с этим достижением и радуюсь, как будто сама нобелевскую премию получила 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11❤🔥3
Все пройдет, и печаль и радость лишь латынь не проходит нет.
Ireland S. (1976). The Computer and Its Role in Classical Research // Greece and Rome 23.1:40-54.
Ireland S. (1976). The Computer and Its Role in Classical Research // Greece and Rome 23.1:40-54.
❤2
— Ну вот, я застряла. Но, как обычно, приходят на выручку регулярные… кто?
— Молитвы!
— Молитвы!
❤11🙏4👍1🔥1
Forwarded from Antibarbari HSE (Olga Alieva)
В 2024 году исполняется 10 лет с журналу «Платоновские исследования» — первому научному изданию в России, посвященному Платону и платоновскому наследию. Историк философии Ольга Алиева построила тематическую модель архива журнала при помощи алгоритма LDA и узнала, какие темы на протяжении этих лет интересовали платоноведов.
От автора: Самым главным выводом для меня, впрочем, стало то, что “тренды” в платоноведении создаются постоянными усилиями наших замечательных коллег. Совет очень прост: возделывай свою тему, публикуйся, и новый LDA-топик не замедлит себя ждать.
На сайт полная версия не вошла, но ее можно найти по ссылке (и там много имен).
Создателям и постоянным авторам журнала — мои поздравления!
От автора: Самым главным выводом для меня, впрочем, стало то, что “тренды” в платоноведении создаются постоянными усилиями наших замечательных коллег. Совет очень прост: возделывай свою тему, публикуйся, и новый LDA-топик не замедлит себя ждать.
На сайт полная версия не вошла, но ее можно найти по ссылке (и там много имен).
Создателям и постоянным авторам журнала — мои поздравления!
Системный Блокъ
Тематическое моделирование журнала «Платоновские исследования»
Журналу «Платоновские исследования» исполняется 10 лет. При помощи алгоритма LDA мы создали тематическую модель этого журнала и узнали, какие темы на протяжении этих лет интересовали платоноведов.
👏8
Forwarded from sonja, a kick ass young lady
Я придумала новую рубрику в канале: каждую субботу буду рассказывать про то, что я сейчас читаю и какой кофе я под это дело пью. Будут такие #кофейныечтения.
Пилотный пост пришелся на первую субботу нового года. В нем я немного порефлексирую о свежем исследовании Ольги Алиевой: это тематическое моделирование архива журнала «Платоновские исследования» за последние 10 лет.
Пилотный пост пришелся на первую субботу нового года. В нем я немного порефлексирую о свежем исследовании Ольги Алиевой: это тематическое моделирование архива журнала «Платоновские исследования» за последние 10 лет.
❤4👍2🔥1
Forwarded from sonja, a kick ass young lady
В кружке у меня батч брю на эфиопии из кофейни Rum Baba в Амстердаме. Мне обещали насыщенный вкус, даже spicy — но не скажу, что это было прям вау. Скорее, он был слегка передержанный (хотя я брала его до полудня), но хороший, классический.
Компанию фильтру составила статья о том, как можно применять текстовый анализ для исследований академических журналов. По моему скромному опыту, историки античной философии тяготеют к древовидному методу исследования. Машина [программа, код] дает возможность сломать эту линейность и иначе посмотреть на то, как мыслят авторы статей.
Меня это наталкивает на мысль о том, что текстовый анализ — это приведение мысли-древа к мысли-ризоме. Это возможно, например, благодаря алгоритму LDA:
Кажется, именно об этом пишут Делёз и Гваттари:
Анализ текста дает нам карту, которая состоит не из статичных точек, но из направлений. Эта карта не фиксирует и закрепляет, но приглашает к взаимодействию и модификации. Наконец, это не сверхкодирование (как может показаться на первый взгляд), а напротив — декодирование и разборка, которая ни в коем случае не претендует на открытие истины. Она лишь показывает другие возможные конфигурации и соединения.
Компанию фильтру составила статья о том, как можно применять текстовый анализ для исследований академических журналов. По моему скромному опыту, историки античной философии тяготеют к древовидному методу исследования. Машина [программа, код] дает возможность сломать эту линейность и иначе посмотреть на то, как мыслят авторы статей.
Меня это наталкивает на мысль о том, что текстовый анализ — это приведение мысли-древа к мысли-ризоме. Это возможно, например, благодаря алгоритму LDA:
LDA — это популярный алгоритм для построения тематических моделей, в рамках которого каждый документ рассматривается как смесь тем, а каждая тема — как смесь слов. Это позволяет документам «перекрывать» друг друга по содержанию, а не разделяться на отдельные группы — что свойственно для естественного языка.
Кажется, именно об этом пишут Делёз и Гваттари:
Все эти множества суть плоские, ибо они заполняют, оккупируют все свои измерения […] Множества определяются внешним — абстрактной линией, линией ускользания или детерриторизации, следуя которой, они меняют природу соединяясь с другими множествами.
Анализ текста дает нам карту, которая состоит не из статичных точек, но из направлений. Эта карта не фиксирует и закрепляет, но приглашает к взаимодействию и модификации. Наконец, это не сверхкодирование (как может показаться на первый взгляд), а напротив — декодирование и разборка, которая ни в коем случае не претендует на открытие истины. Она лишь показывает другие возможные конфигурации и соединения.
❤6🔥3💯2🤮1
Написала для IQ.HSE обзор, посвященный применению LDA в разных гуманитарных отраслях, от политической истории до литературоведения. Хозяйке на заметку.
https://iq.hse.ru/news/885865882.html
https://iq.hse.ru/news/885865882.html
🔥19❤1👍1
Интересная статья от Бориса Орехова об отчуждаемости знания в эпоху больших языковых моделей вышла в журнале “Историческая информатика”.
Мы живем в текстоцентричном мире, и поэтому нас так пугают нейросети. Ученый сегодня смотрит на LLM то ли с надеждой (поможет?), то ли с опасением (заменит?). Проблема это никакая не техническая, а вполне себе философская:
Ответ подсказывает Платон, причем даже не в "Федре", как вы могли подумать, а в "Евтидеме”:
В духе Платона Свифт, который в статье тоже упоминается (у него, кстати, описана подобная шайтан-машина), доводит до абсурда мысль о том, что знание хранится в текстах. Но если не в текстах, то где?
Мы живем в текстоцентричном мире, и поэтому нас так пугают нейросети. Ученый сегодня смотрит на LLM то ли с надеждой (поможет?), то ли с опасением (заменит?). Проблема это никакая не техническая, а вполне себе философская:
Нейросети прежде всего ставят перед гуманитарной наукой вопрос о том, что есть в ней помимо текста, есть ли у знаков в научном тексте референт. Возможно, что уже в ближайшем будущем наличие референта ученым-гуманитариям придется показывать и доказывать для внешнего наблюдателя.
Ответ подсказывает Платон, причем даже не в "Федре", как вы могли подумать, а в "Евтидеме”:
— Но, во имя богов, — сказал я, — если мы изучим искусство составления речей, то именно приобретение этого искусства сделает нас счастливыми? — Я этого не думаю, — отвечал Клиний, схватив мою мысль.
В духе Платона Свифт, который в статье тоже упоминается (у него, кстати, описана подобная шайтан-машина), доводит до абсурда мысль о том, что знание хранится в текстах. Но если не в текстах, то где?
Telegram
Antibarbari HSE
Свифт что-то подозревал
Среди бесполезных изобретений академиков из Лагадо (вроде добывания энергии из огурцов) Гулливер описывает нечто напоминающее современные порождающие модели. Называется проект "усовершенствования умозрительного знания при помощи…
Среди бесполезных изобретений академиков из Лагадо (вроде добывания энергии из огурцов) Гулливер описывает нечто напоминающее современные порождающие модели. Называется проект "усовершенствования умозрительного знания при помощи…
❤6🤔2👍1
Я уже писала (и еще один текст в печати), что Дельта Берроуза с древнегреческим справляется не очень хорошо. Даже более примитивная версия Дельты (расстояние Манхэттена без стандартизации) дает большую точность классификации, а лучше всего, по моим наблюдениям, показывает себя косинусное сходство.
Но, оказывается, есть возможность обойтись и без косинусов: достаточно просто взять корень квадратный из матрицы с частотностями, а потом посчитать тот же Манхэттен. Это называется Eder’s Simple. Наблюдение об эффективности для греков принадлежит не мне.
Но я проверила на своем корпусе, все так. Хотя косинус все равно лучше 📐
В связи с этой математической чертовщиной (квадратный корень? really?) мне вспоминается серия “Смешариков” про лунного ворона. Статистика — точная наука, но главное не перепутать, в какой руке держать бубен🪶
Но, оказывается, есть возможность обойтись и без косинусов: достаточно просто взять корень квадратный из матрицы с частотностями, а потом посчитать тот же Манхэттен. Это называется Eder’s Simple. Наблюдение об эффективности для греков принадлежит не мне.
Но я проверила на своем корпусе, все так. Хотя косинус все равно лучше 📐
В связи с этой математической чертовщиной (квадратный корень? really?) мне вспоминается серия “Смешариков” про лунного ворона. Статистика — точная наука, но главное не перепутать, в какой руке держать бубен
Please open Telegram to view this post
VIEW IN TELEGRAM
😁10❤3🗿2👍1