RAntiquity
Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…
Из особенных достижений за этот модуль, я считаю, вот. #цифровые_этюды #pca
❤9🎉4😱2🥰1
Осваиваю веселенький пакет FastTextR (снова неутомимый Эмиль Хвитфельдт!), позволяющий работать с предобученными эмбеддингами. Хочется, глядя на это, сказать голосом Любшина:
🔥11
Кто-то должен был набраться смелости и задать наконец чату GPT самые острые вопросы современности.
В общем, развернуть безголовый сервер на приставке не получится. Даже если пройти финального босса 👻
1. Ограничения Xbox One:
Операционная система: Xbox One работает на базе Windows 10 Xbox Edition — специальной версии ОС с ограниченной функциональностью, которая не поддерживает установку стороннего ПО, включая RStudio Server.
Аппаратные ограничения: Xbox One не имеет GPU, совместимого с CUDA (требуется для ускорения нейросетей), а его процессор и память недостаточно производительны для серьёзных ML-задач.
В общем, развернуть безголовый сервер на приставке не получится. Даже если пройти финального босса 👻
😁10😭8
В рубрике BEST DH TRAINING MATERIALS ищите вашу locusclassicus ☺️ https://dhawards.org/dhawards2024/voting/
Конкуренция серьезная, но хорошая новость в том, что можно голосовать в разных номинациях за разные проекты.
P.S. Расшары друзьям и знакомым кролика приветствуются! Правила конкурса это допускают
Конкуренция серьезная, но хорошая новость в том, что можно голосовать в разных номинациях за разные проекты.
P.S. Расшары друзьям и знакомым кролика приветствуются! Правила конкурса это допускают
🔥13❤4
Как проверить латинский текст на опечатки и ошибки распознавания с пакетами {
Это решение подойдет для быстрой “очистки” после OCR. Код позволяет выбрать замену слова или скипнуть исправление в интерактивном режиме.
https://teletype.in/@locusclassicus/BBSaUFXR-1S
hunspell} и {spelling}Это решение подойдет для быстрой “очистки” после OCR. Код позволяет выбрать замену слова или скипнуть исправление в интерактивном режиме.
https://teletype.in/@locusclassicus/BBSaUFXR-1S
Teletype
Проверка латинской орфографии в R c пакетами hunspell и spelling
Убедитесь, что у вас установлены нужные словари Hunspell.
🔥10❤4
Коллега прислала ссылку на CFP для цифровых философов, которых научная общественность продолжает искать днем с огнем. Я об этом, что могла, уже сказала и развивать не планирую, но вдруг кто-то думал в похожем направлении. Дедлайн в конце мая.
Regarding philosophy, however, there appears to be a striking under representation in the digital humanities sector so far. While there is some research done about philosophical aspects of digitalisation and even about methodological advantages of digital technology for philosophy, it is still rare in comparison with similar research in other disciplines.
This Collection aims to publish new philosophical views on digital knowledge infrastructures, particularly on the philosophical implications of the use of digital technology in research and education, e.g., machine-learning systems, linked open data applications, online archives, open access publication platforms, text analysis software, and perhaps even discipline-specific social media platforms like Phil-People. In addition, we want to emphasise the question how philosophy itself can make good use of this technology.
Nature
Philosophy [in:of:for:and] digital knowledge infrastructures
This Collection will bring together philosophical contributions concerning digital knowledge infrastructure, broadly construed.
❤4👍2🔥2
Forwarded from Antibarbari HSE (Olga Alieva)
Дорогие друзья, в ближайшую пятницу и субботу (28-29 марта) ищите антиварваров и их друзей в РГГУ на «Миусских античных посиделках», посвященных цифровым методам в изучении античности.
Программа и заказ пропусков по ссылке.
Программа и заказ пропусков по ссылке.
Telegram
Институт восточных культур и античности (ИВКА РГГУ)
#конференции #ивка
Дорогие друзья,
С радостью сообщаем вам, что 28–29 марта у нас состоится традиционная конференция «Миусские античные посиделки»–XV!
Тема нынешних посиделок — «цифровая античность».
Если вам нужно оформить пропуск, то пишите, пожалуйста…
Дорогие друзья,
С радостью сообщаем вам, что 28–29 марта у нас состоится традиционная конференция «Миусские античные посиделки»–XV!
Тема нынешних посиделок — «цифровая античность».
Если вам нужно оформить пропуск, то пишите, пожалуйста…
❤9
Раньше были какие-то понятные преподавательские страхи. Забыть про собственную пару, не подготовиться и не знать, что делать со студентами полтора часа. Или, толком не проснувшись (по ночам мы же пишем статьи), примчаться с каким-то очевидным изъяном во внешнем виде. Ну всякое такое, скучища. Все это было и все это не страшно.
Предлагаю новый страх. Промахнуться мимо окошка в телеграме и случайно запостить в один из своих пабликов вопрос, предназначенный Chat AI Bot. И тогда весь мир узнает, что…
А что он узнает, кстати? Какие запросы реально могут смутить, если станут публичными?
Пишите в комментариях. Если написать, то не сбудется (тьфу-тьфу-тьфу). Гарантия 100% 🔮
Предлагаю новый страх. Промахнуться мимо окошка в телеграме и случайно запостить в один из своих пабликов вопрос, предназначенный Chat AI Bot. И тогда весь мир узнает, что…
А что он узнает, кстати? Какие запросы реально могут смутить, если станут публичными?
Пишите в комментариях. Если написать, то не сбудется (тьфу-тьфу-тьфу). Гарантия 100% 🔮
❤20😁16
Forwarded from античные лолы и кеки
завтра иду рассказывать классикам на конфе в рггу, какой есть прикольный и простой цифровой инструмент для поиска аллюзий в латинских текстах
тем временем классики: еще в девяностых начали жаловаться, как компухтеры загубили комментаторскую работу
тем временем классики: еще в девяностых начали жаловаться, как компухтеры загубили комментаторскую работу
😁12👍4
Antibarbari HSE
Дорогие друзья, в ближайшую пятницу и субботу (28-29 марта) ищите антиварваров и их друзей в РГГУ на «Миусских античных посиделках», посвященных цифровым методам в изучении античности. Программа и заказ пропусков по ссылке.
Слет антиварваров в РГГУ завтра на “Миусских античных посиделках”.
Совпадение? Не думаю.
p.s. программу прикрепляла выше
Совпадение? Не думаю.
p.s. программу прикрепляла выше
😈5👍2
Как написал сегодня по совсем другому поводу канал @atticist, “из колхозной молодежи панковал один лишь я”. https://t.iss.one/parakharatteintonomisma/2097
Telegram
παραχαράττειν τὸ νόμισμα
Ольга Валерьевна @rantiquity Алиева на античных посиделках в РГГУ с прекрасным докладом про применение филогенетических методов изучения признаков ластоногих к платоновскому корпусу.
❤🔥13👏8❤6
Последнее время приходится довольно много сканировать и распознавать, так что пришлось придумать небольшую хитрость, чтобы
✔️ разрезать разворот на два изображения
✔️ сшить pdf заново, но уже постранично
Всех дел на пару минут. После этого файл можно отдавать tesseract’у или нейросетям.
Хитрость на языке R доступна в виде gist’a, надеюсь будет полезна не только мне.
Всех дел на пару минут. После этого файл можно отдавать tesseract’у или нейросетям.
Хитрость на языке R доступна в виде gist’a, надеюсь будет полезна не только мне.
Please open Telegram to view this post
VIEW IN TELEGRAM
Gist
Split the spreads and rebind the PDF
Split the spreads and rebind the PDF. GitHub Gist: instantly share code, notes, and snippets.
❤🔥10🔥9❤3
RAntiquity
Последнее время приходится довольно много сканировать и распознавать, так что пришлось придумать небольшую хитрость, чтобы ✔️ разрезать разворот на два изображения ✔️ сшить pdf заново, но уже постранично Всех дел на пару минут. После этого файл можно отдавать…
Коллеги в комментариях в предыдущему посту написали, что неплохо бы и бинаризацию сделать для #ocr Попробовала, делюсь кодом и результатом.
❤15
🎉 Коллеги показали очень смешной и бесполезный пакет для R, называется {celebrate}
Чтобы эта штуковина сработала, на маке придется сделать
Насколько поняла, работает только с юниксоидами.
После этого делаете что-то такое:
И вуаля🎵 🎵 🎵
Можно установить произвольный уровень значимости:
Единственная функция этого пакета — дополнить вывод сводки модели подходящими звуковыми эффектами, в зависимости от того, достигли ли вы магического уровня значимости p < 0.05 хотя бы для одной переменной (не считая интерцепта — ведь нам всё же стоит сохранять хоть какую-то разумность …).
devtools::install_github("bbolker/bbmisc/celebrate")
library(celebrate)Чтобы эта штуковина сработала, на маке придется сделать
brew install sox
Насколько поняла, работает только с юниксоидами.
После этого делаете что-то такое:
m1 <- lm(speed~dist,cars)
m2 <- lm(Income~Population,data.frame(state.x77))
summary(m1)
summary(m2)
И вуаля
Можно установить произвольный уровень значимости:
options(celebrate.alpha = <value>)
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
bbmisc/celebrate at master · bbolker/bbmisc
miscellaneous talks and small projects. Contribute to bbolker/bbmisc development by creating an account on GitHub.
🔥11❤9🎉3
Отличный баг. Походы Цезаря в Хорватию и Португалию 🥲 Вот что бывает, если не очень внимательно отнестись к выбору подложки. (отсюда)
😁8
А никто не знает случайно, куда делась подложка у Digital Atlas of the Roman Empire (DARE)?
https://dh.gu.se/tiles/imperium/%7Bz%7D/%7Bx%7D/%7By%7D.png больше не работает или отключена
https://dh.gu.se/tiles/imperium/%7Bz%7D/%7Bx%7D/%7By%7D.png больше не работает или отключена
🤔3
Как я уже писала, подложки Gothenburg Research Infrastructure in Digital Humanities недоступны (c VPN или без), и та же история с Consortium of Ancient World Mappers и с Open Historical Maps. Что там случилось, не знаю, еще летом первый из этих провайдеров работал.
Поэтому разбираюсь, как работать с историческими растрами. Видимо, будет серия заметок гипомнематического (т.е. несколько сумбурного) характера #maps
🔹 скачиваем карту с Wikimedia Commons или из другого источника
🔹 устанавливаем QGIS https://qgis.org/ (нужно ок. 3гб, это бесплатно)
🔹 связываем изображение (например, историческую карту в формате .jpg или .tif) с координатами на поверхности Земли, это называется georeference (если вам повезет, вы найдете уже georeferenced версию, но об этом в другой раз)
Для этого:
🔹 Меню Layer —> Georeferencer, добавляем изображение, определяем 4-8 "контрольные точки" (GCP – Ground Control Points), т.е. вручную задаем их координаты. Потом нажимаем кнопку Start Georeferencing, в рабочей директории появится геопривязанный файл. Вот тут неплохое видео о том, как это делается.
🔹 После этого можно использовать растр вместе с leaflet, он будет масштабироваться и т.п.
(продолжение следует)
Поэтому разбираюсь, как работать с историческими растрами. Видимо, будет серия заметок гипомнематического (т.е. несколько сумбурного) характера #maps
Для этого:
library(leaflet)
library(terra)
gallia <- rast("gallia_georef.tif")
# проверка CRS
crs(gallia)
leaflet() |>
addTiles() |>
addRasterImage(gallia, opacity = 0.5, project = FALSE)
(продолжение следует)
Please open Telegram to view this post
VIEW IN TELEGRAM
qgis.org
Spatial without Compromise · QGIS Web Site
❤8👍3
#maps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2🍓2❤1