RAntiquity
1.09K subscribers
295 photos
11 videos
5 files
542 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
Вот, это я даже вынесу в отдельный пост

The cost of a conversation grows quadratically with the number of turns: if you want to save money, keep your conversations short.


https://ellmer.tidyverse.org/articles/ellmer.html
7👍4
Сегодня доработала и отправила в журнал рецензию на одну книгу о Платоне, которую медленно читала все праздники, чтобы не впасть в майонезную кому. Рецензия, как и книга, не имеет никакого отношения к цифре: речь идет о некоторых emerging trends в платоноведении.

Но, разумеется, после всех экспериментов с LLM мне стало интересно, может ли чат GPT помочь в написании рецензии. Вспомнив про эксперименты Ньютона с втыканием булавки в собственный глаз, для начала попросила модель резюмировать несколько своих статей. Результат показался внятным: тонкости аргументации потерялись, но общий смысл был сохранен. Это обнадеживало: модель вполне можно использовать, чтобы понять, о чем текст, а это уже очень близко к цели.

Как оставленные без присмотра герои Носова, я разрезала на главы пиратский pdf (ограничения по моей подписке — 100 000 знаков) и принялась варить кашу попросила GPT каждую из них резюмировать. Несмотря на путаную структуру книги и местами темную аргументацию, перемежающуюся длинными греческими цитатами, модель в целом для каждой главы корректно установила, о чем она, и перечислила основные выводы.

Но ни одной строчки этого внятного пересказа я в итоге не использовала. Почему? Рецензия — это не реферат (хотя и полноценный реферат — это не пересказ). Это гораздо более сложный жанр, или даже констелляция жанров, о которой коллеги in times of yore сделали целую книгу. Среди рецензий встречаются своего рода пересказы, и, хотя ценность подобных сочинений никогда не была особенно велика, они были и пока остаются востребованы в условиях перепроизводства публикаций.

Легкость получения такого пересказа при помощи GPT совершенно его обесценивает. Нельзя сказать, чтобы это было совсем бесполезно: полезно, например, сравнивать свой читательский опыт с тем, что тебе вернула машина. Это позволяет лишний раз подумать, правильно ли ты расставил акценты и все ли понял (не такая заурядная задача, хотя ей часто пренебрегают студенты, спеша сказать новое слово в науке).

Но в итоге в рецензию я постаралась включить только то, что модель никак не могла описать, а это две вещи.

Во-первых, теоретический и методологический контекст. Какое место занимает книга Х в научном поле, какие влияния она испытала и как сама может повлиять на других? Модель не представляет себе контекст. Она в каком-то смысле «начитана», но она не видит границ между дисциплинарными парадигмами, для нее все подходы равны и все ходы мысли по-своему приемлемы. «Читая» книгу, она может контекстуализировать ее лишь настолько, насколько это делает сам автор, например, во введении. Условно говоря, если ты просишь ее приготовить ужин из того, что есть в холодильнике, она не «вспомнит», что за шкафом есть банка крупы. А в гуманитарных науках очень важна способность к метаописанию или, проще говоря, самопознанию: мы это понимаем так, но это можно понимать и иначе. Хороший гуманитарий — не тот, кто хорошо играет по заданным правилам, но тот, кто понимает историческую контингентность этих правил.

Во-вторых, модель, как курос Парменида, не может познать небытие. Она не сможет пересказать то, что не сказано прямо. Речь идет не только о неизбежных упущениях (хотя это тоже важно: например, почему не процитированы релевантные работы или не поставлены очевидные вопросы). Речь идет в большей степени о том, что не принято говорить прямо — потому ли, что это знание считается общепринятым; потому ли, что сам автор не задумывался об основаниях, на которых держится вся его конструкция; потому ли, что контекст по определению исключен из текста. Условия, делающие возможным высказывание, сами остаются за его пределами.

Из этого делаю два предварительных вывода: как редактор — не соглашаться на пересказы; как автор — не опускаться до пересказов. А как быть? Учиться писать приличные рецензии.
28👍15🔥6💘52
Спасибо коллегам за такой обзор. Про прокурора это, конечно, преувеличение 😅 Просто логика диалектической беседы требует додумывать любой тезис до конца, причем in utramque partem. Сначала в одну сторону, потом в другую.

Я не технофоб, не технофил и уж точно не техновизионер (этого и без меня хватает). Но мне нравится осмысленность.

Вот, например, Платон. Незадолго до его рождения Греция начала становиться грамотной: впервые в истории человечества не просто появилось фонетическое письмо, но и система грамматических школ, плюс доступный папирус из египетских колоний.

Все знание можно записать! - говорили одни. И продать! - говорили другие. Спокойно, - сказал Платон. — Пишите, кому что надо, законы там, учебники, стихи, — но не надо называть это знанием.

И на этом спокойствии мы протянули 25 веков, протянем и еще немного.
👍139🙏5
Где у него кнопка

Через неделю мне предстоит выступать перед школьниками, и я решила немного обновить привычный формат презентации Quarto, добавив небольшие опросы. Прикрутить, так сказать, кнопку к слайдам, чтобы стать популярнее в кругу творческой молодежи 🐽

1) Чат GPT дал дельный совет: создать вопросы на сервисе https://www.slido.com/ и встроить их в презентацию как кусок html. Все получилось бы, если бы Slido работал без VPN. Не могу же я просить школьников подключаться по VPN, да и в Zoom так работать не получится.

2) Хороший пакет для вопросов — {webexercises}. Недавно я начала использовать его для создания онлайн-упражнений по латыни. Но, как выяснилось, {webexercises} не поддерживает формат презентаций revealjs.

3) Из блога «Наука и данные» я узнала о {surveydown} — пакете для онлайн-опросов. Такой опрос представляет собой, по сути, приложение Shiny; благодаря подробной инструкции создать его оказалось не так сложно. Но, увы, в отличие от других приложений Shiny, встроить такую штуку в презентацию или даже на сайт — например, при помощи {shinylive}, см. пример от Е.Н. Матерова —не получится. Во всяком случае, не влезая под капот функций и ничего капитально не переделывая. Но берем на заметку: пригодится для проверочных и лабораторных.

4) Пакет {checkdown} прекрасно встает в слайды, но возникли проблемы с оформлением: кнопкам не присвоены классы, пришлось повозиться с css, чтобы из кнопки на рис. 1 сделать кнопку на рис. 2 и увеличить кружочек под radio-input. Вариант оставить некрасивую кнопку я как-то не рассматривала 💅

5) Уже решив, что проблема решена, я обратила внимание на расширение для Quarto под говорящим названием quiz (вот тут список расширений). Как это работает: устанавливаешь плагин (на странице для каждого из них есть код, который надо запустить в терминале). Потом прописываешь его в yml. И все, наслаждаешься. Всех дел на пять минут. На радостях я переделала вообще все. Итоговый вид кнопки на рис. 3.

Мораль: не повторяйте моих ошибок, используйте плагины. Как сказал Гесиод,

Тот — наилучший меж всеми, кто всякое дело способен
Сам обсудить и заране предвидит, что выйдет из дела.
Чести достоин и тот, кто хорошим советам внимает.
Кто же не смыслит и сам ничего и чужого совета
К сердцу не хочет принять, — совсем человек бесполезный.


upd. старшие товарищи подсказывают, что есть вот такая коллекция расширений Quarto, там много красивого и полезного в хозяйстве: https://m.canouil.dev/quarto-extensions/#category=reveal.js

#quarto #extensions #revealjs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍3😁2
RAntiquity
Где у него кнопка Через неделю мне предстоит выступать перед школьниками, и я решила немного обновить привычный формат презентации Quarto, добавив небольшие опросы. Прикрутить, так сказать, кнопку к слайдам, чтобы стать популярнее в кругу творческой молодежи…
Но король плагинов и безусловный фаворит — это, друзья, плагин confetti. Я теперь его везде буду добавлять, чтобы жить веселее. Вот, кстати, первый опыт, та самая презентация для школьников: на любом слайде нажмите букву c и поделитесь ощущениями 🎊
🎉9🔥2😁2👍1
«Цифровая среда»: Иван Бегтин расскажет об инструментах для работы с данными в гуманитарных науках

22 января
состоится первое в этом году заседание «Цифровой среды» – научно-методического семинара Института цифровых гуманитарных исследований (DHRI) СФУ о Digital Humanities.

Один из самых интересных практиков Open Data, директор АНО «Информационная культура», создатель международного проекта Dateno и автор популярного телеграм-канала Иван Бегтин выступит с докладом «Дата-инженерия в цифровой гуманитаристике».

🔜 Присоединяйтесь к онлайн-семинару ровно через неделю.

Дата: 22 января
Начало: 14.00 (мск)/ 18.00 (крск)
🔗 Зарегистрироваться и добавить в календарь: здесь

#цифроваясреда #смотреть #слушать #данные #opendata
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
Скимминг с {tidyllm}

…на случай, когда тг-бот капризничает


library(tidyllm)
Sys.setenv(OPENAI_API_KEY = "sk-00000000")

conversation <- llm_message("Please summarize the key points from the provided PDF document.",
.pdf = "my.pdf") |>
chat(openai(.model = "gpt-4o"))

conversation |> get_reply(1) |> cat()


Источник. #llm
6
Forwarded from Vox mediaevistae
Нишевый контент: многие занятия по digital humanities церемониально начинаются с упоминания Роберто Бузы, иезуита, который в 1949 году начал работать над Index Thomisticus. Иногда показывают его улыбающуюся фотографию в старости, ту, что привязана к википедии. А я сегодня набрела на посвященный ему тамблер, а там посмотрите, какой он прекрасный и юный. Сличает с распечаткой факсимиле свитков Мертвого моря.
👍87😁1
RAntiquity
▶️ Публикуем четвертую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (НИУ ВШЭ). Историки литературы давно поняли, что для построения подлинной истории литературы им нужны колоссальные массивы данных. Но лишь в последние…
Неожиданно мой икеевский торшер настигла слава: лекция Алексея Вдовина для нашего курса “Критическое введение в DH” (2024) попала на БП в рубрику “Ученые по субботам”. https://t.iss.one/prbezposhady/25875 Девочки, спасибо, продакшн старался.
28🔥4🙏3🤔2
Цифра, которую мы потеряли, или мне временно не до вас #oldies #segamega
😍253
Хотела написать сегодня скучный пост про неравенство треугольника и его роль в мировой стилометрии, но по случаю прихода новых подписчиков немного повангую. Геометрия никому не интересна, а футурология интересна всем.

Вот уже некоторое время я думаю об построении такого воркфлоу в R, который позволил бы филологу решать задачи от распознавания текста до его анализа, разметки и публикации с использованием LLM. Чтобы на входе, например, картинка, а на выходе — html.

Многие детали пока не ясны, но уже сейчас очевидно, что задача это вполне выполнимая, причем ее выполнение требует все меньше специальных навыков. У меня где-то лежит учебник по МО с объяснением, как использовать опорные векторы для оптического распознавания символов, но понятно, что сегодня никто не будет мучиться с SVM для решения такой задачи (рукописи — отдельная тема, но я ей и не занимаюсь). Основное ограничение пока — деньги, VPN, санкции и т.п. Но вот китайцы уже взялись за дело, так что, думаю, эти ограничения не навсегда.

Что тогда? Курсы программирования для гуманитариев выйдут из моды быстрее, чем туфли системы Мэри Джейн (это касается и моего курса, да), вернется спрос на людей, которые понимают, что со всем этим распознанным богатством делать. И тут нам главное не повторить судьбу икеевской акулы — всем внезапно стало надо, спекулянты ломят ценник, авито забит подделками, а оригинальный продукт всё, снят с производства.

Поэтому, не дожидаясь будущего, предлагаю немедленно переходить к изучению греческого и латыни 🦈
Please open Telegram to view this post
VIEW IN TELEGRAM
22🌚3
Дорогие друзья!

🏛️В грядущий понедельник приглашаем вас погрузиться в мир античных текстов на лекции «Вычислить Платона: Что могут сказать количественные методы о подлинности диалогов корпуса?»

📜От некоторых античных авторов до наших дней сохранились лишь фрагменты, а другим, наоборот, традиция приписывает слишком много произведений. Таков случай Платона, о подлинности некоторых диалогов которого до сих пор идут споры. Зачем кому-то понадобились эти подделки? Как исследователи выявляют подложные тексты и как в этом помогают компьютерные методы?

🗝️Обо всем этом поговорим 27 января в 18:10 с кандидатом филологических наук, доцентом Школы философии и культурологии НИУ ВШЭ и создателем греко-латинского клуба Antibarbari Ольгой Валерьевной Алиевой.

⬆️Регистрация по ссылке: https://shkola-yunogo-filologa-vs.timepad.ru/event/3205638/
Please open Telegram to view this post
VIEW IN TELEGRAM
20
Forwarded from THALATTA ΘΑΛΑΣΣΑ
наконец-то опубликовали текст секретного древнегреческого дневника парижского эллиниста девятнадцатого века!!! с трепетом ожидала этого события, от души поздравляю команду проекта LAGOOS и бегу читать, как Хазе ходил в библиотеку, на лекции и по гостям
🔥103
Сколько кошек было у Колетт?

🔘🔘🔘

В 1989 году Этьен Брюне опубликовал статью, где решил пересчитать животных во французской литературе 19-20 веков. Это стало возможно благодаря созданию Цифрового тезауруса французского языка (TLFi), который на тот момент насчитывал 2 500 текстов (по современным меркам, конечно, не очень много).

В качестве центрального автора Брюне выбрал Колетт, полагая, что её любовь к животным находит отражение и в её текстах. При помощи программы STELLA (которая визуализирует расчёты) Брюне анализирует частоту встречаемости животных в пяти произведениях Колетт, сравнивая их с текстами других французских авторов (среди них — Бовуар, Камю, Пруст и Селин):

Мы предлагаем проверить, любит ли Колетт кошек или животных вообще [...] Вряд ли Колетт питала любовь к измерениям и подсчетам. Считать монетки это ещё куда ни шло. Но считать слова вместо того, чтобы их взвешивать! Считать животных вместо того, чтобы их гладить! Без сомнения, этот безумный проект никогда не приходил Колетт в голову — даже в те беспокойные вечера, когда счет овец, как говорят, помогал ей уснуть. Но чтобы успокоить Колетт и избавить её призрак от кошмара цифр, мы не покажем вам процесс их приготовления [la cuisine des chiffres ne sera pas montrée]. Достаточно знать, что эти кривые получаются в результате перекрестного умножения, квадратных корней и многих других ингредиентов, одни названия которых могут испортить вам аппетит, хотя компьютер переварит их без проблем.

В ходе цифровой кулинарии выясняется, что чаще всего Колетт пишет про кошек (chat / chatte) — что особенно, по мнению Брюне, выделяет её на фоне других авторов, которые либо не особенно обращаются к животным в своих текстах, либо используют их в символическом значении. Или как пишет Брюне в заключении:

В этом случае статистика лишь подтверждает ощущение очевидного. Это, конечно же, не является открытием, и мы добились лишь относительного прогресса в доказательстве, если не правильности [количественного] метода, то хотя бы того, что он не является ошибочным.

А кошек у Колетт насчитали 198 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
14🥰4🔥2👍1