Системный Блокъ
11K subscribers
270 photos
2 videos
1 file
955 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
Соцсети древних римлян, VR-прогулки по Помпеям и чтение сгоревших папирусов с помощью МРТ и нейросетей: подборка о цифровых методах в антиковедении

Исследователи античности гордятся тем, что использование статистических методов в гуманитарных науках началось именно с классической филологии — это произошло не позже конца XIX века. С появлением компьютеров применять количественные методы и цифровые модели стало легче, и сегодня в арсенал цифровых античников входят и геоинформатика, и сетевой анализ, и цифровые 3D-модели. Рассказываем, как соединяются классическая древность и ультрасовременные технологии:

3D‑модели и VR в Помпеях 🌋
Шведские учёные использовали 3D‑моделирование, очки виртуальной реальности, ГИС и трекинг взгляда, чтобы увидеть, какие детали интерьера привлекали внимание посетителей воссозданной в виртуальном пространстве виллы римского аристократа в Помпеях, а еще — как на восприятие влиял свет

МРТ и нейросети для чтения папирусов 📜
Из Помпей переместимся в соседний Геркуланум — здесь находится Вилла папирусов, самое большое в мире собрание античных свитков. Рассказываем, как ученые с XVIII века работают над тем, чтобы прочитать обгоревшие свитки рукописей, можно ли узнать, что написано в свитке, не разворачивая его, зачем папирусам делают компьютерную томографию и МРТ и как расшифровка рукописей превратилась в международное соревнование

Поиск межтекстовых перекличек в римской литературе 🔄
Приложение Tesserae помогает искать заимствования, цитаты и переклички в текстах античных авторов — это полезный инструмент для филологов‑классиков. Самый простой результат работы с Tesserae — это выявление новых текстовых параллелей, которые до этого не были отмечены комментаторами. Например, при тестировании Tesserae команда нашла потенциальную аллюзию к «Энеиде» Вергилия в поэме Лукана «Фарсалия».

ORBIS и транспортная сеть Римской империи
🌍
С помощью сетевого анализа и картографии можно просчитать маршруты между разными точками Pax Romana, оценить статус городов и даже понять, почему Карфаген должен был пасть

Просопография и социальная сеть древних римлян 🤝
Базы вроде Romans1by1 и инструменты визуализации помогают изучать не только факты, но и социальные связи римлян, связывая горожан, чиновников и аристократов в единую сеть

Определение авторства и древние греки 🕵️‍♀️
Компьютерный анализ может помочь не только с поиском заимствований, но и с датировкой текстов и установлением авторства. Рассказываем, насколько эффективна стилометрия, если речь идет о древнегреческих текстах. Вы узнаете, может ли Дельта Берроуза отличить греческих ораторов друг от друга, какие метрики входят в топ-3 по эффективности для античных произведений и с какими авторами возникает больше всего проблем

Что волнует исследователей Платона и при чем тут танцы 💃
Классики исследуют тексты, папирусы и руины древних вилл — а кто исследует их самих? Цифровая платоноведка Ольга Алиева рассказывает, как построить тематическую модель журнала и с ее помощью отследить, что больше всего волнует платоноведов в России, когда произошел всплеск популярности Аристотеля и откуда в платоноведческих текстах танцы

🏛 «Системный Блокъ» @sysblok
17🔥167👍5🥰2
Вера Инбер и Марфа Крюкова: продолжаем исследование школьной программы

«Системный Блокъ» изучил, как в школьном литературном каноне представлены женщины-писательницы. Оказалось, что за последние 170 лет в каноне появлялись имена 36 женщин, которые написали в общей сложности всего 2% произведений, предложенных для изучения.

Некоторые писательницы задерживались в программе дольше остальных. Вы наверняка уже вспомнили Ахматову и Цветаеву, чьи произведения систематически изучаются в школе с начала 1990-х годов. В карточках рассказываем еще о восьми женщинах, оставивших заметный след в школьном литературном каноне, и об их произведениях, которые чаще всего упоминались в школьных программах.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
35🔥11❤‍🔥7👍3😢1
Быстрый старт: как говорить с нейросетью

«Системный Блокъ» продолжает спецпроект «ИИ-лайфхаки для вашей профессии» и представляет гайд по быстрому старту — инструкцию, которая поможет зарегистрироваться в популярных нейросетях и написать осмысленные запросы, если вы никогда не взаимодествовали с нейросетями или понимаете, что они не всегда выдают вам подходящие ответы.

Кратко: что внутри?

Мы пошагово разбираем:
— как завести аккаунт в ChatGPT и DeepSeek — от ввода почты до первого вопроса;
— что такое промпт и как сформулировать его так, чтобы нейросеть поняла вас с первого раза;
— какие функции вообще есть у нейросетей.

Вы узнаете:

— с какими задачами могут помочь нейросети;
— как прикреплять документы и изображения для анализа;
— как разные режимы поиска помогают сделать выдачу нейросети точнее.

Загрузите в ChatGPT научную статью и попросите: «Выдели ключевые тезисы» — нейросеть проанализирует текст. А чтобы найти свежие данные по этой теме, задайте соответствующий запрос в DeepSeek с включенным Search-режимом.


Подробные инструкции с наглядными примерами уже ждут вас в разделе «Быстрый старт»

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2311👍11🆒3
Сосны, Волга, данные и пеньчарты: «Системный Блокъ» провел мастерскую дата-журналистики на Летней школе

Команда «Системного Блока» вернулась с Летней школы (это волонтёрский образовательный проект, которые ежегодно проходит в лесу на берегу Волги недалеко от Дубны).

Как и в прошлом году, мы делали на ЛШ мастерскую @datajourschool, посвященную дата-журналистике. 25 участников — лингвисты, журналисты, аналитики данных — две недели изучали, как спланировать дата-исследование, где взять данные, как с ними работать и как делать из них красивые и понятные визуализации. И применяли все это на собственных проектах — исследованиях, партнерами которых выступили:
— благотворительная организация «Ночлежка» @nochlezhka,
— научно-популярный журнал «Кот Шредингера» @kot_sh,
— издательство ОГИ @izdatelstvoogi,
— медиа о культуре российских регионов «В лесах» @vlesah,
— цифровой корпус почтовых открыток «Пишу тебе» @pishuteberu

Но мы не только учились. Под чутким творческим руководством дата-художницы Нади Андриановой выпускники мастерской прошлого года сделали выставку дата-арта, где данные о летнешкольниках были представлены в виде пеньчартов или фигур с картин Малевича.

Участники уехали домой, но мастерская не закончилась: работа над проектами продолжается.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
35🔥16👍5👨‍💻3
Музыка на «костях»: как рентгеновские снимки заменили винил

Что общего у Элвиса Пресли и перелома ключицы? В СССР ответ на этот вопрос был неожиданным, но точным: его пластинки печатали на рентгеновских снимках. Рассказываем, когда и зачем энтузиасты создавали рентген-пластинки, какие исполнители на них оказались, и как проект  BONE MUSIC работает с этим феноменом.

💿 Что это за пластинки?

Любительские записи музыки на рентгеновских снимках появились в конце 1940-х годов. Одной из причин, конечно, был повсеместный дефицит материалов, поскольку винил для пластинок было найти непросто. Тогд использованную пленку из больниц и поликлиник стали выкупать и использовать для самодельных записей. Родиной такого рентгениздата, кстати, считается Санкт-Петербург (тогда — Ленинград).

🕺🏻 Запрет, мода, память

Вторая причина популярности музыкальных рентген-снимков — советская цензура. Официально продавать пластинки с иностранной (джаз, рок-н-ролл), эмигрантской и блатной музыкой было запрещено. Но меломаны и сторонники контркультуры находили способы распространить ее, несмотря на возможное наказание вплоть до уголовной ответственности. Так рентген-пластинки стали не только способом распространения музыки, но и символом подпольной культуры, которая противостояла официальной идеологии.

Сошел на нет этот способ записи к концу 1960-х – по мере распространения кассетных магнитофонов.

🩻 BONE MUSIC

Один из наиболее крупных проектов, направленных на сохранение памяти о рентген-пластинках, — BONE MUSIC, инициатива The Bureau of Lost Culture — лондонского объединения, которое собирает артефакты контркультуры ХХ века. 

Создатели проекта, музыкант и продюсер Стивен Коутс и фотограф Пол Хэтфилд, ищут рентген-снимки в странах бывшего коммунистического лагеря, оцифровывают их, проводят исследования и выставки. Это позволяет не только сохранить уникальные арт-объекты, но и сделать их доступными для широкой аудитории.

Сегодня сайте цифрового проекта Bone Music размещены фотографии музыкальных рентген-снимков, аудио, отчеты и другие материалы. Можно найти записи Эллы Фитцджеральд, Элвиса Пресли, Петра Лещенко (русского эстрадного певца, оказавшегося после Первой мировой войны румынским подданным, но имевшего международный успех в 1920–1940-е годы), услышать одну из первых версий знаменитой Mambo Italiano или образцы русского шансона («Через море, скованное льдами...», «Расскажу я вам этот случай...»).

Подробнее о том, как появилась идея проекта и как он развивался, узнаете из полной версии статьи.

Время чтения: 4,5 минуты

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2313👍10🤔1😈1
ИИ для исследователей: как нейросети помогают в науке

Что, если ИИ сможет быстрее вас находить нужные статьи, систематизировать данные и даже подсказывать новые направления для исследований? В новом разделе спецпроекта «ИИ-лайфхаки для вашей профессии» мы собрали практические инструменты, которые экономят часы рутинной работы ученым.

Кратко: о чем раздел?

ИИ ускоряет работу исследователей на всех этапах: от формулировки темы и поиска литературы до анализа данных и подготовки публикаций. Если вам предстоит писать курсовые и дипломные работы, готовиться к конференциям и проводить собственные исследования, вам наверняка пригодятся многие ИИ-инстурменты, которые могут с этим помочь.

Вы узнаете:
— как с помощью Elicit выбрать тему и найти research gaps;
— чем полезны Litmaps, Connectedpapers и Zotero для поиска и систематизации литературы;
— как собрать собственную базу знаний с Meetcody.ai и Typeset.io;
— зачем использовать Perplexity и Consensus для чтения и анализа научных источников;
— как нейросети помогают оформлять библиографию и даже писать код для анализа данных.

Все инструменты — с примерами запросов, скриншотами и пошаговыми сценариями. Подробнее читайте в разделе «ИИ для исследователей».

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
32❤‍🔥15👍13🔥7🥰3
Как SQL помогает изучать дореволюционное кредитование

Как работало банковское кредитование в Российской империи? Кто получал деньги от крупнейших банков? Как Москва превращалась в финансовый центр и втягивала в свою орбиту всю страну?

В начале XX века к не было банковского приложения, чтобы взять кредит. Зато были бумажные векселя, личные связи и бухгалтерские книги, написанные от руки. Оцифровав почти 2000 вексельных сделок одного из крупнейших банков империи, рассказываем, как работала эта система.

📜 Что и как мы исследовали?

Главным инструментом коммерческого кредитования в начале XX века были векселя — долговые расписки, которые компании выдавали друг другу при покупке товаров с отсрочкой платежа. Чтобы разобраться в сложной системе кредитования и увидеть механизмы ее работы, мы изучили архивные данные Московского отделения ПМКБ (Санкт-Петербургского международного коммерческого банка). Мы проанализировали вексельную книгу за 1900 год, сделали квартальную выборку и вручную оцифровали 1994 записи банковских сотрудников на сумму 2,47 млн руб.

💰 Кто пользовался банками?

Главными клиентами банков оказались торговые дома (29% от общего объема векселей), за ними – нефтяные компании (23,8%), а замкнули тройку лидеров металлургические и машиностроительные предприятия (15,7%). Иначе говоря: в топе были представлены три ключевых сектора экономики того времени.

📍 Куда шли денежные потоки?

Более половины всех проданных в банк векселей (52%) были выписаны или предназначались к платежу за пределами Москвы. Среди других городов, где была высокая концентрация сделок с векселями, выделяются Санкт-Петербург, Нижний Новгород, Харьков и Выкса.

Подробнее о том, как между собой были связаны клиенты банка, почему для анализа географии нам пришлось преобразовывать данные и о каких суммах кредитных сделок идет речь, узнаете из полной версии статьи.

Время чтения: 7,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍13🔥9👏3🏆3
Новая DeepSeek, интерактивная симуляция миров от Google и Grok-2 в открытом доступе

Рассказываем, что произошло в мире ИИ за последнее время.

Новая DeepSeek-V3.1

Компания DeepSeek представила обновление своей большой языковой модели DeepSeek-V3.

Разработчики фокусировались на развитии агентных возможностей — способности модели автономно выполнять задачи на компьютере. О важности агентов в развитии ИИ мы писали в предыдущем дайджесте.

Архитектура модели осталась прежней, но теперь нет разделения на «рассуждающую» и «быструю» версии — DeepSeek-V3.1 объединяет оба режима. В режиме рассуждений она показывает те же результаты в тестах по математике и программированию, что и предыдущая версия, но генерирует более лаконичные промежуточные размышления. Другими словами, разработчики ускорили модель без потери качества.

Стоимость доступа к API незначительно выросла, однако DeepSeek-V3.1 по-прежнему остаётся самой дешевой из сопоставимых моделей. Веса модели опубликованы в открытом доступе под лицензией, разрешающей коммерческое использование. Попробовать модель можно через официальный сайт и мобильное приложение. Подробнее о DeepSeek и работе с ним мы рассказывали ранее.

Почему это важно?

LLM от DeepSeek популярна как среди энтузиастов, так и среди широкой аудитории. Подробная техническая статья о DeepSeek-R1 открыла open-source сообществу простой и надёжный метод обучения рассуждающих моделей, аналогичных закрытой o1 от OpenAI, что значительно сократило разрыв между проприетарными и открытыми LLM.

Данные, генерируемые моделями DeepSeek, активно используются для обучения других моделей. По слухам, ими пользуются не только независимые разработчики и небольшие компании, но и крупная французская ИИ-компания Mistral.


1/3

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥97👍3👏1
Grok-2 выложили в открытый доступ

Лаборатория xAI Илона Маска выложила в открытый доступ веса и код LLM Grok-2.5, выпущенной в прошлом году.

Grok-2.5 построен на архитектуре Mixture-of-Experts: во время генерации, в зависимости от запроса пользователя, используется лишь часть параметров. Всего в модели 270 млрд параметров, из которых активны 62 млрд. Для сравнения, у сопоставимой по размеру open-source модели Qwen3 при работе задействуется почти втрое меньше параметров, что сильно сокращает время отклика.

По качеству Grok-2.5 сопоставима с флагманскими моделями прошлого года. Модель доступна для коммерческого использования, однако её нельзя применять для улучшения других языковых моделей — например, нельзя обучать на данных, сгенерированных Grok-2.5.

Почему это важно?

Grok-2.5 не является лидирующей LLM с открытыми весами по соотношению размер/качество, однако сам факт публикации в открытый доступ флагманской (хотя и не самой новой) модели от одной из самых больших ИИ-лабораторий примечателен. Для сравнения: OpenAI так и не выложила веса GPT-3, вышедшей в 2021 году, несмотря на большое количество запросов со стороны сообщества. Маск также пообещал выложить Grok-3 в открытый доступ через 6 месяцев.


2/3

🤖 «Системный Блокъ» @sysblok
🔥9👏5🥰41👍1
Genie 3 генерирует интерактивные миры

Лаборатория Google DeepMind представила третье поколение модели Genie. Это семейство относится к так называемым «моделям мира» (world models) — системам, которые симулируют физику реального или игрового пространства.

Genie 3 по текстовому описанию создаёт виртуальную сцену, в которой можно свободно перемещаться в реальном времени (24 кадра в секунду, разрешение 720p) с помощью клавиатуры. Сцена сохраняет целостность несколько минут благодаря «визуальной памяти» модели примерно на минуту: например, если пользователь окрасит часть стены, уйдёт, а затем вернётся, стена останется окрашенной.

Помимо обычного управления доступны «события по запросу» (promptable world events). Во время сессии можно менять мир командами вроде «сделай дождь», «добавь лодку на озеро» или «сделай ночь» — при этом изменения происходят без перезапуска сцены.

Genie 3 способна порождать самые разные окружения и физические явления: физику жидкости, света, природные локации (лес, озеро, волны), городские сцены и стилизованные игровые миры.

Предыдущие версии были менее стабильны во времени, поддерживали только короткие симуляции (до 20 секунд) и имели ограниченную интерактивность.

Почему это важно?

У «моделей мира» множество применений:

1. Генерация обучающих данных для роботов и автономных систем. Например, можно создать сотни часов симуляций приготовления еды и использовать их для обучения робота, или сгенерировать редкие дорожные ситуации для тренировки беспилотных автомобилей.

2. Использование в связке с языковыми моделями, которым сложно рассуждать о физике. LLM может преобразовать вопрос пользователя в запрос к модели мира, получить симуляцию и извлечь из неё ответ.

Замена сложных физических расчётов. Иногда точное вычисление по формулам слишком трудоёмко, а достаточно точная симуляция позволяет получить результат быстрее и дешевле.


3/3

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18🥰5👏4👍1
Как ИИ помогает учителям: 3 рабочих способа сэкономить время

1 сентября — день, когда нагрузка учителей снова взлетает на максимум. А могут ли облегчить их жизнь современные языковые модели? В рамках нового спецпроекта «ИИ-лайфхаки для вашей профессии» педагоги делятся реальными кейсами использования нейросетей в работе. Мы собрали более 10 задач с готовыми промптами, которые могут облегчить работу учителя: от составления опросников до создания заданий… для развития эмоционального интеллекта школьников!

1. Объясняем сложные темы просто 

Если ученикам сложно даются фразеологизмы, ИИ поможет создать понятные объяснения с конкретными примерами.

Промпт: Представь, что ты учитель русского языка и ты составляешь упражнение, чтобы объяснить шестиклассникам значение фразеологизма ПРОВАЛИТЬСЯ СКВОЗЬ ЗЕМЛЮ. Чтобы дети поняли особенности употребления фразеологизма, составь текст из 3-5 предложений, который бы демонстрировал ситуацию, описывающую этот фразеологизм. Включи в одно и то же предложение синоним к фразеологизму и сам фразеологизм.


2. Превращаем профориентацию в увлекательную игру

Когда традиционные методы профориентации не вызывают интереса у подростков, искусственный интеллект помогает создать нестандартные форматы занятий.

Промпт: Представь, что ты методист, которому нужно подготовить 2-часовое занятие по профориентации для подростков 12-15 лет. Тема: «странные и редкие профессии». Придумай план этого занятия.


3. Литературный детектив: классик vs нейросеть

Ученикам дают два отрывка: отрывок из классического произведения и версию, дописанную нейросетью. Задача — найти подделку.

Нейросети часто выдают себя многословными описаниями и избыточными конструкциями. Сравнивая авторские тексты с вариантами нейросети, школьники учатся распознавать языковые шаблоны и замечать логические нестыковки.

Познакомьтесь со страницей «ИИ для учителей» и проверьте себя: сможете ли вы отличить авторский текст от сгенерированного?

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤‍🔥99👍3
«90% мировой культуры строится на воспроизведении паттернов»: интервью с Игорем Пильщиковым

Игорь Пильщиков — сооснователь Русской виртуальной библиотеки (rvb.ru), ФЭБ «Русская литература и фольклор» (feb-web.ru) и системы СПСЛ (cpcl.info), профессор славистики в Калифорнийском университете в Лос-Анджелесе, доктор филологических наук. «Системный Блокъ» поговорил с ним о моделировании в литературоведении, масштабировании исследований с помощью компьютера, сложностях с поэтическим метром у больших языковых моделей, проблемах переноса биологических терминов в филологию и о том, как Шекспир справлялся с дедлайнами и недостатком трезвых актеров.

Подсчеты в литературоведении

Прежде чем мы начинаем что-то считать в текстах, нужно понять, что именно мы подсчитываем и какие единицы измерения используем. Поэтому надо убедиться, что в процессе разметки текстов мы определили все важные для нашего исследования признаки и придумали, как их подсчитывать. В этом плане филология скорее похожа на биологию, а не на идеально точную математическую науку.

Что не так с этой аналогией

Увы, в вопросах точности литературоведение все-таки уступает естественным наукам. В биологии мы разделяем живые существа на роды, виды и особи. А особь разделяем уже на разные ее члены. А что у нас есть в литературе? Вроде бы у нас есть роды, которые разделяются на жанры, которые представлены произведениями, а в произведении есть какие-то части… но на самом деле мы не всегда можем дать жанру (да и поджанру) четкое определение, так что сложности начинаются уже на этом этапе. А если мы подключим к анализу текста языковую модель, она столкнется с несколькими неочевидными препятствиями.

Чему пока не научились LLM

ChatGPT и почему-то совершенно не умеет писать метрическую поэзию. Он никак не способен ни на каком количестве текстов усмотреть, что такое метр и рифмовка. Нейросеть Claude 3.5 Sonnet тоже с трудом справилась с онегинской строфой и тут же забыла принцип её построения.

С художественными текстами могут возникнуть и другие сложности, связанные, например, с оригинальностью текста.

Стоит автору написать с помощью ИИ фрагменты собственного романа, поднимается скандал. Не говоря уж о целом романе.

Что же получается? Если коротенький стишок, составленный с помощью искусственного интеллекта, приписать себе нельзя, а огромный перевод можно, то проблема не в природе текста, а в нашей интерпретации этой природы.


О природе текста и других особенностях искусственного и естественного интеллектов, а также о специфике применения нейросетей в разных науках, читайте в полной версии интервью.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1710🔥7🤔3