Академическая честность в эпоху искусственного интеллекта: соавторство или мошенничество?
Можно ли школьникам и студентам обращаться к чат-ботам при написании эссе? Как оценивать такие работы? Где помощь нейросети превращается в плагиат? С развитием искусственного интеллекта традиционные представления о честности в науке и образовании пересматриваются. Рассказываем, как школы и вузы учатся регулировать использование ИИ.
А что, до нейросетей все были честными?
Нет 🙃. В 2012 году опрос 23 000 американских старшеклассников показал: 75% списывали домашнюю работу, 52% — контрольные. Среди 3600 учеников школ США 95% признались, что хотя бы раз жульничали за год. Что же касается ИИ, его используют не только с целью списать.
А с какой?
Исследователи Стэнфордского университета выяснили, что 54-58% учеников считают допустимым использовать ИИ для мозгового штурма, поиска темы проектов и структурирования мыслей. 48-64% опрошенных против использования ИИ для написания фрагментов работы и редактуры готового текста. 86-95% учащихся высказались против автоматического создания всей работы.
Со школьниками ясно, что там у студентов?
Согласно совместному докладу «Яндекс Образования» и НИУ ВШЭ почти половина студентов (49%) уже использует ИИ; 47% процентов студентов отмечают, что нейросети помогают им в учебе; а 54% преподавателей считают, что умение пользоваться генеративными технологиями дает студентам карьерное преимущество.
Ведущие вузы делают ставку на обучение ИИ-грамотности, а не на борьбу со списыванием. Например, Оксфорд и Мичиганский университет создают открытые курсы и хабы, где объясняют, как работает ИИ, каковы его ограничения и этические риски.
Подробнее о практических и этических аспектах использования нейросетей в образовании узнаете из полной версии нашего материала.
А своим мнением по этому поводу можете делиться в комментариях 😎
🤖 «Системный Блокъ» @sysblok
Можно ли школьникам и студентам обращаться к чат-ботам при написании эссе? Как оценивать такие работы? Где помощь нейросети превращается в плагиат? С развитием искусственного интеллекта традиционные представления о честности в науке и образовании пересматриваются. Рассказываем, как школы и вузы учатся регулировать использование ИИ.
А что, до нейросетей все были честными?
Нет 🙃. В 2012 году опрос 23 000 американских старшеклассников показал: 75% списывали домашнюю работу, 52% — контрольные. Среди 3600 учеников школ США 95% признались, что хотя бы раз жульничали за год. Что же касается ИИ, его используют не только с целью списать.
А с какой?
Исследователи Стэнфордского университета выяснили, что 54-58% учеников считают допустимым использовать ИИ для мозгового штурма, поиска темы проектов и структурирования мыслей. 48-64% опрошенных против использования ИИ для написания фрагментов работы и редактуры готового текста. 86-95% учащихся высказались против автоматического создания всей работы.
Со школьниками ясно, что там у студентов?
Согласно совместному докладу «Яндекс Образования» и НИУ ВШЭ почти половина студентов (49%) уже использует ИИ; 47% процентов студентов отмечают, что нейросети помогают им в учебе; а 54% преподавателей считают, что умение пользоваться генеративными технологиями дает студентам карьерное преимущество.
Ведущие вузы делают ставку на обучение ИИ-грамотности, а не на борьбу со списыванием. Например, Оксфорд и Мичиганский университет создают открытые курсы и хабы, где объясняют, как работает ИИ, каковы его ограничения и этические риски.
Подробнее о практических и этических аспектах использования нейросетей в образовании узнаете из полной версии нашего материала.
А своим мнением по этому поводу можете делиться в комментариях 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Академическая честность в эпоху искусственного интеллекта: новые правила для студентов и преподавателей - Системный Блокъ
Допустимо ли использовать ChatGPT для учебы? Как вузы борются с плагиатом и разрабатывают правила использования ИИ? Разбираемся, как регулируют искусственный интеллект в школах и университетах.
🔥28❤17🤝7👍4
В Версале «заговорили» скульптуры
Это стало возможным благодаря приложению на базе искусственного интеллекта.
Посетители дворца теперь могут задать вопросы 20 статуям в саду — среди них Аполлон, Купидон и Сфинкс. Новое приложение, созданное на платформе Ask Mona при участии OpenAI, позволяет вести диалог на французском, английском и испанском языках. Для этого достаточно отсканировать QR-код на постаменте.
«Ответы» скульптур основаны на мифологических сюжетах и исторических источниках о Версале. Система использует данные архивов и кураторских текстов, чтобы сгенерировать правдоподобные ответы от лица героев. По словам создателей, проект помогает посетителям узнавать малоизвестные детали и по-новому воспринимать пространство сада.Таким образом Версаль делает опыт посещения более интерактивным, а значит, и запоминающимся.
🤖 «Системный Блокъ» @sysblok
Это стало возможным благодаря приложению на базе искусственного интеллекта.
Посетители дворца теперь могут задать вопросы 20 статуям в саду — среди них Аполлон, Купидон и Сфинкс. Новое приложение, созданное на платформе Ask Mona при участии OpenAI, позволяет вести диалог на французском, английском и испанском языках. Для этого достаточно отсканировать QR-код на постаменте.
«Ответы» скульптур основаны на мифологических сюжетах и исторических источниках о Версале. Система использует данные архивов и кураторских текстов, чтобы сгенерировать правдоподобные ответы от лица героев. По словам создателей, проект помогает посетителям узнавать малоизвестные детали и по-новому воспринимать пространство сада.Таким образом Версаль делает опыт посещения более интерактивным, а значит, и запоминающимся.
Почему это важно?
Для Digital Humanities проект Версаля — пример того, как искусственный интеллект становится посредником между культурным наследием и публикой. Технология соединяет традиционную экспозицию с интерактивным рассказом и показывает, что цифровые технологии могут не только визуализировать прошлое, но и дать ему голос. В результате музей превращается в пространство диалога, где технологии углубляют восприятие объектов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30❤10👍5😁3
Тест: угадай значение (ノ◕ヮ◕)ノ*:・゚✧ каомодзи
Каомодзи — это японские смайлики, созданные из букв, цифр и символов, которые передают эмоции без слов.
В отличие от привычных нам 🙂 или :(или ((((( , японские каомодзи расположены горизонтально (и используются только при горизонтальном письме). Часто у них есть не только глаза и рот, но и щеки, брови, уши или даже руки. Они появились в Японии в 1980-х и быстро стали частью интернет-культуры. Сегодня каомодзи используются в сообщениях, блогах и соцсетях, чтобы выразить настроение мягче и эмоциональнее, чем текстом (@^◡^)
В новом тесте предлагаем вам угадать, какую эмоцию выражает это и другие лица:
(╬ಠ益ಠ)
А в комментариях можете рассказать, что предпочитаете вы — эмодзи (про них у нас тоже есть материал!), скобочки или каомодзи!
Пройти тест
🤖 «Системный Блокъ» @sysblok
Каомодзи — это японские смайлики, созданные из букв, цифр и символов, которые передают эмоции без слов.
В отличие от привычных нам 🙂 или :(
В новом тесте предлагаем вам угадать, какую эмоцию выражает это и другие лица:
(╬ಠ益ಠ)
А в комментариях можете рассказать, что предпочитаете вы — эмодзи (про них у нас тоже есть материал!), скобочки или каомодзи!
Пройти тест
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Тест: угадай значение японских смайликов (каомодзи) - Системный Блокъ
Проверь свое знание языка эмоций в интернете с помощью нашего теста. Узнай больше о японских смайликах и узнай, что они означают: радость, грусть, злость или смущение.
❤35❤🔥7👍6🎉5😁4🔥3
Голос(а) автора: может ли один человек писать как несколько?
В этот день 45 лет назад ушел из жизни удивительный французский писатель Ромен Гари — единственный человек, которому удалось дважды получить престижную Гонкуровскую премию. Дело в том, что премия даётся один раз в жизни. Гари смог обойти это правило благодаря мистификации. Сегодня эту мистификацию исследуют с помощью количественных методов определения авторства (стилометрии). Перечитываем наш материал о том, как авторы создают «писательские субличности».
Кратко: о чем статья?
Одна из основных задач стилометрии в цифровой филологии — атрибуция, определение авторства. Обычно формальности вроде псевдонима не влияют на результат, но что, если писатель создалсубличность с собственными биографией и характером?
В 1956 году как Ромен Гари получил Гонкуровскую премию под своим именем, а в 1975 году — под псевдонимом Эмиль Ажар.
При этом автор и его «субличность» творили в одном жанре, а Гари продолжал печататься под своим именем одновременно с развитием писательской карьеры Ажара.
Разумеется, мы решили проверить, что скажут цифровые методы и провели эксперимент с Delta (подробнее о Дельте Бёрроуза можно узнать, например, здесь). И в ходе него программа, определяющая авторство, восприняла Ажара как отдельного от Гари писателя, хотя один из романов, написанных под псведонимом, и был стилистически близок к текстам Ромена Гари.
О другом писателе, которому удалось обмануть стилометрию, а также о том, что такое дендрограммы, как они выглядят и что показывают исследователям, узнаете из полного текста статьи.
Время чтения: 12,5 минут
🤖 «Системный Блокъ» @sysblok
В этот день 45 лет назад ушел из жизни удивительный французский писатель Ромен Гари — единственный человек, которому удалось дважды получить престижную Гонкуровскую премию. Дело в том, что премия даётся один раз в жизни. Гари смог обойти это правило благодаря мистификации. Сегодня эту мистификацию исследуют с помощью количественных методов определения авторства (стилометрии). Перечитываем наш материал о том, как авторы создают «писательские субличности».
Кратко: о чем статья?
Одна из основных задач стилометрии в цифровой филологии — атрибуция, определение авторства. Обычно формальности вроде псевдонима не влияют на результат, но что, если писатель создалсубличность с собственными биографией и характером?
В 1956 году как Ромен Гари получил Гонкуровскую премию под своим именем, а в 1975 году — под псевдонимом Эмиль Ажар.
При этом автор и его «субличность» творили в одном жанре, а Гари продолжал печататься под своим именем одновременно с развитием писательской карьеры Ажара.
Разумеется, мы решили проверить, что скажут цифровые методы и провели эксперимент с Delta (подробнее о Дельте Бёрроуза можно узнать, например, здесь). И в ходе него программа, определяющая авторство, восприняла Ажара как отдельного от Гари писателя, хотя один из романов, написанных под псведонимом, и был стилистически близок к текстам Ромена Гари.
О другом писателе, которому удалось обмануть стилометрию, а также о том, что такое дендрограммы, как они выглядят и что показывают исследователям, узнаете из полного текста статьи.
Время чтения: 12,5 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Голос(а) автора: может ли один человек писать как несколько? Системный Блокъ
Российские исследователи с помощью стилометрии изучили, могут ли писатели создавать множественные субличности, наделенные авторской индивидуальностью. Рассказываем, как цифровая филология помогает увидеть внутренние механизмы литературного творчества.
🔥36❤17👍16🤯6
ИИ в образовании: как преподавателю выстроить справедливые правила игры
Пока ученики не понимают отношение преподавателя к ИИ, им труднее корректировать своё поведение на занятиях. Рассказываем, как выстроить границы в использовании ИИ для тех, кто предпочел бы разрешить обращаться к нейросетям, и для тех, кто считает, что школьникам лучше от них отказаться.
Как преподавателю разрешить использование ИИ?
Создавать условия для осмысленного применения нейросетей на занятиях можно по-разному. Самый простой вариант — попросить разработать памятку… ИИ-помощника. Это не только облегчит работу, но и позволит показать осознанный подход к искусственному интеллекту на собственном примере. Так можно помочь студентам развивать насмотренность и подсказать, как взаимодействовать с чат-ботами: что говорить в хорошем промпте (не знаете? ничего, у нас есть гайд!) и чего лучше не говорить, особенно если речь идет о персональных данных.
Помимо свода правил и памяток можно рассмотреть со студентами мемы об отношении к ИИ, его основных проблемах, о стереотипах в отношении ИИ или обсудить неудачные варианты его применения.
Как преподавателю запретить использование ИИ?
Запрет на использование нейросетей хорошо бы закреплять в нормативных документах от программы учебных дисциплин до политики учебного заведения.
При этом поскольку ИИ — это огромное количество разных технологий и инструментов, важно разобраться, все ли их хочется ограничить настолько строго. Чаще всего в учебном процессе под запрет попадают генеративные технологии. Ориентиром здесь может выступить этический стандарт COPE (Code of conduct | COPE: Committee on Publication Ethics): не разрешается создание текста работы, данных, графиков с помощью нейросетей, если это не обусловлено выбранным методом. Правда, убедиться, что такой запрет соблюдается, может быть не слишком просто, ведь ИИ-детекторам полностью доверять невозможно.
Еще один способ ограничить применение нейросетей в процессе обучения — больше обсуждать с учениками угрозы, связанные с ними. Репозиторий MIT The Al Risk Repository содержит, наверное, самый полный перечень рисков. Среди них, к примеру, есть риск дезинформации. Вокруг него в сети появилось много кейсов, которые можно обсудить с учениками.
Подробности о разрешениях и запретах ИИ в образовании найдете в полной версии нашей статьи. А ещё там есть мемы!
Время чтения: 11 минут
🤖 «Системный Блокъ» @sysblok
Пока ученики не понимают отношение преподавателя к ИИ, им труднее корректировать своё поведение на занятиях. Рассказываем, как выстроить границы в использовании ИИ для тех, кто предпочел бы разрешить обращаться к нейросетям, и для тех, кто считает, что школьникам лучше от них отказаться.
Как преподавателю разрешить использование ИИ?
Создавать условия для осмысленного применения нейросетей на занятиях можно по-разному. Самый простой вариант — попросить разработать памятку… ИИ-помощника. Это не только облегчит работу, но и позволит показать осознанный подход к искусственному интеллекту на собственном примере. Так можно помочь студентам развивать насмотренность и подсказать, как взаимодействовать с чат-ботами: что говорить в хорошем промпте (не знаете? ничего, у нас есть гайд!) и чего лучше не говорить, особенно если речь идет о персональных данных.
Помимо свода правил и памяток можно рассмотреть со студентами мемы об отношении к ИИ, его основных проблемах, о стереотипах в отношении ИИ или обсудить неудачные варианты его применения.
Как преподавателю запретить использование ИИ?
Запрет на использование нейросетей хорошо бы закреплять в нормативных документах от программы учебных дисциплин до политики учебного заведения.
При этом поскольку ИИ — это огромное количество разных технологий и инструментов, важно разобраться, все ли их хочется ограничить настолько строго. Чаще всего в учебном процессе под запрет попадают генеративные технологии. Ориентиром здесь может выступить этический стандарт COPE (Code of conduct | COPE: Committee on Publication Ethics): не разрешается создание текста работы, данных, графиков с помощью нейросетей, если это не обусловлено выбранным методом. Правда, убедиться, что такой запрет соблюдается, может быть не слишком просто, ведь ИИ-детекторам полностью доверять невозможно.
Еще один способ ограничить применение нейросетей в процессе обучения — больше обсуждать с учениками угрозы, связанные с ними. Репозиторий MIT The Al Risk Repository содержит, наверное, самый полный перечень рисков. Среди них, к примеру, есть риск дезинформации. Вокруг него в сети появилось много кейсов, которые можно обсудить с учениками.
Подробности о разрешениях и запретах ИИ в образовании найдете в полной версии нашей статьи. А ещё там есть мемы!
Время чтения: 11 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
ИИ в образовании: как преподавателю установить правила - Системный Блокъ
Анализ использования искусственного интеллекта в образовательном процессе: как преподавателю установить правила и контролировать их соблюдение, как исключить плагиат и помочь ученикам выстроить границы использования нейросетей
❤24👨💻9👾7⚡5👎1
Gemini 3, новый DeepSeek, SAM 3
Рассказываем, что произошло в мире ИИ за последнее время
Google Gemini 3
Корпорация Google обновила свою большую языковую модель Gemini. Пока доступна только флагманская версия Gemini 3 Pro, более компактные и быстрые варианты появятся позже.
Практически во всех стандартных тестах Gemini 3 превосходит лидирующие LLM OpenAI GPT-5.1 и Anthropic Opus 4.5 или сопоставима с ними. Главное в обновлении — улучшение агентских способностей: модель эффективнее применяет режим рассуждений (thinking/reasoning) и внешние инструменты, такие как поиск Google и среда выполнения кода. Также значительно выросло качество генерации кода, особенно для задач front-end, которые нужны для разработки интерфейсов сайтов и приложений.
Попробовать Gemini 3 можно бесплатно в Google AI Studio.
DeepSeek v3.2
Лаборатория DeepSeek обновила свою открытую LLM.
Базовая версия DeepSeek v3.2 по качеству сравнима с GPT-5, а версия с расширенными рассуждениями — с Gemini 3 Pro. Модель также стала быстрее благодаря архитектурным улучшениям.
По заявлениям лаборатории, DeepSeek v3.2 получила «золото» на Международной олимпиаде по математике и Международной олимпиаде по программированию 2025 года. Ранее о подобных достижениях своих LLM заявляли OpenAI и Google.
DeepSeek v3.2 и технический отчет находятся в открытом доступе. Опробовать модель можно на официальном сайте.
SAM 3 и SAM 3D
Компания Meta* представила SAM 3 и SAM 3D — обновление своей линейки моделей компьютерного зрения Segment Anything.
SAM 3 может находить и выделять объекты на изображениях и на видео по текстовым описаниям. В отличие от предыдущих версий, которые работали только с визуальными подсказками (например, на нужный объект нужно было кликнуть или обвести его рамкой), новая модель понимает текстовые запросы вроде «жёлтый школьный автобус» или «люди в красных кепках».
SAM 3D позволяет генерировать 3D-модели объектов из двумерных изображений. SAM 3D состоит из двух моделей: SAM 3D Objects восстанавливает трёхмерную геометрию и текстуры предметов, а SAM 3D Body — позы и формы человеческого тела. Обе модели работают с одним изображением, без необходимости в специальных камерах.
Meta выпустила веса моделей, код и бенчмарки. Обе модели опубликованы в открытом доступе на официальном сайте.
*Компания Meta признана экстремистской организацией, а её деятельность запрещена на территории РФ
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время
Google Gemini 3
Корпорация Google обновила свою большую языковую модель Gemini. Пока доступна только флагманская версия Gemini 3 Pro, более компактные и быстрые варианты появятся позже.
Практически во всех стандартных тестах Gemini 3 превосходит лидирующие LLM OpenAI GPT-5.1 и Anthropic Opus 4.5 или сопоставима с ними. Главное в обновлении — улучшение агентских способностей: модель эффективнее применяет режим рассуждений (thinking/reasoning) и внешние инструменты, такие как поиск Google и среда выполнения кода. Также значительно выросло качество генерации кода, особенно для задач front-end, которые нужны для разработки интерфейсов сайтов и приложений.
Попробовать Gemini 3 можно бесплатно в Google AI Studio.
Почему это важно?
Gemini используется практически во всех ИИ-продуктах Google: от перевода видео на YouTube до генерации сводок поисковой выдачи. Поэтому обновление затронет миллионы пользователей.
Кроме того, благодаря финансовым и интеллектуальным ресурсам Google является ключевым участником гонки ИИ. По её флагманской модели можно судить о прогрессе генеративного ИИ в целом.
DeepSeek v3.2
Лаборатория DeepSeek обновила свою открытую LLM.
Базовая версия DeepSeek v3.2 по качеству сравнима с GPT-5, а версия с расширенными рассуждениями — с Gemini 3 Pro. Модель также стала быстрее благодаря архитектурным улучшениям.
По заявлениям лаборатории, DeepSeek v3.2 получила «золото» на Международной олимпиаде по математике и Международной олимпиаде по программированию 2025 года. Ранее о подобных достижениях своих LLM заявляли OpenAI и Google.
DeepSeek v3.2 и технический отчет находятся в открытом доступе. Опробовать модель можно на официальном сайте.
Почему это важно?
Разработка и обучение больших языковых моделей требуют значительных финансовых вложений. Лидирующие модели создаются корпорациями и доступны только по API, что даёт пользователю лишь минимальный контроль над ними.
Традиционно открытые модели (которые можно запустить на собственном сервере или компьютере) существенно отстают от закрытых. Модели DeepSeek уже неоднократно сокращали этот разрыв.
Выход DeepSeek v3.2 означает, что теперь любой желающий может без ограничений использовать и модифицировать LLM, сопоставимую по производительности с лучшими решениями.
SAM 3 и SAM 3D
Компания Meta* представила SAM 3 и SAM 3D — обновление своей линейки моделей компьютерного зрения Segment Anything.
SAM 3 может находить и выделять объекты на изображениях и на видео по текстовым описаниям. В отличие от предыдущих версий, которые работали только с визуальными подсказками (например, на нужный объект нужно было кликнуть или обвести его рамкой), новая модель понимает текстовые запросы вроде «жёлтый школьный автобус» или «люди в красных кепках».
SAM 3D позволяет генерировать 3D-модели объектов из двумерных изображений. SAM 3D состоит из двух моделей: SAM 3D Objects восстанавливает трёхмерную геометрию и текстуры предметов, а SAM 3D Body — позы и формы человеческого тела. Обе модели работают с одним изображением, без необходимости в специальных камерах.
Meta выпустила веса моделей, код и бенчмарки. Обе модели опубликованы в открытом доступе на официальном сайте.
Почему это важно?
Модели линейки SAM универсальны — они позволяют выделять произвольные объекты на самых разных изображениях и видео. Поэтому их можно применять в разных областях: обработка фото и видео, робототехника, AR/VR.
Meta уже внедряет модели в свои продукты. SAM 3 используется в приложении Edits для создания видеоэффектов, а SAM 3D обеспечивает работу функции «Просмотр в комнате» на Facebook Marketplace, позволяя покупателям визуализировать мебель в своём интерьере перед покупкой.
*Компания Meta признана экстремистской организацией, а её деятельность запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20👍14🔥7❤🔥5
Ресурсы для цифровых стиховедов: поэтические корпуса
Сегодня двойной поэтический день рождения: 5 декабря с разницей в 17 лет родились два выдающихся русских поэта — сначала Фёдор Тютчев в 1803 году, а затем Афанасий Фет в 1820-м. В связи с такой важной для поэзии датой предлагаем вспомнить, какие поэтические корпуса будут полезны тем, кто хочетотличать Фета от Тютчева исследовать поэтическое наследие — русское и не только.
Поэтический подкорпус НКРЯ
Первый в истории поэтический корпус, доступный с 2006 года, сегодня он насчитывает 101 521 текст. В стихотворениях размечены метр, строфика и другие параметры, указаны автор, дата создания и жанры. По всем этим признакам можно искать информацию и задавать подкорпус.
Башкирский поэтический корпус
Вторым поэтическим корпусом в мире стал Башкирский, созданный в октябре 2013 года Борисом Ореховым. Коллекция текстов корпуса состоит из произведений 103 башкирских поэтов XX и начала XXI века. Благодаря нему можно узнать не только о башкирском стихе, но и о башкирском языке в целом. Корпус поддерживает два вида поиска — лексический и грамматический, можно искать как само слово, так и формы по определенным грамматическим признакам.
Персидский поэтический корпус
Персидский поэтический корпус был опубликован весной 2020 года. Он содержит тексты классической персидской поэзии IX-XVII веков в объеме 4,3 млн. словоупотреблений (это 16 842 произведения или 330 723 бейта — так называется минимальная строфическая единица тюркской и персидской поэзии).
Мультиязычный корпус поэзии PoeTree
Проект PoeTree, опубликованный в 2023 году, включает более 330 000 стихотворений на десяти языках (чешский, английский, французский, немецкий, венгерский, итальянский, португальский, русский, словенский и испанский). Каждый корпус был очищен от дубликатов, снабжен морфосинтаксической разметкой в формате Universal Dependencies и снабжен метаданными. Тексты и метаднные доступны в виде унифицированных JSON-файлов.
Поэтические корпуса — это культурное достояние и важный источник, содержащий информацию о национальной поэзии и языке конкретного временного периода. Если вы использовали для своих исследований (или других целей?) эти и другие поэтические корпуса, пожалуйста, расскажите о них в комментариях!
🤖 «Системный Блокъ» @sysblok
Сегодня двойной поэтический день рождения: 5 декабря с разницей в 17 лет родились два выдающихся русских поэта — сначала Фёдор Тютчев в 1803 году, а затем Афанасий Фет в 1820-м. В связи с такой важной для поэзии датой предлагаем вспомнить, какие поэтические корпуса будут полезны тем, кто хочет
Поэтический подкорпус НКРЯ
Первый в истории поэтический корпус, доступный с 2006 года, сегодня он насчитывает 101 521 текст. В стихотворениях размечены метр, строфика и другие параметры, указаны автор, дата создания и жанры. По всем этим признакам можно искать информацию и задавать подкорпус.
Башкирский поэтический корпус
Вторым поэтическим корпусом в мире стал Башкирский, созданный в октябре 2013 года Борисом Ореховым. Коллекция текстов корпуса состоит из произведений 103 башкирских поэтов XX и начала XXI века. Благодаря нему можно узнать не только о башкирском стихе, но и о башкирском языке в целом. Корпус поддерживает два вида поиска — лексический и грамматический, можно искать как само слово, так и формы по определенным грамматическим признакам.
Персидский поэтический корпус
Персидский поэтический корпус был опубликован весной 2020 года. Он содержит тексты классической персидской поэзии IX-XVII веков в объеме 4,3 млн. словоупотреблений (это 16 842 произведения или 330 723 бейта — так называется минимальная строфическая единица тюркской и персидской поэзии).
Мультиязычный корпус поэзии PoeTree
Проект PoeTree, опубликованный в 2023 году, включает более 330 000 стихотворений на десяти языках (чешский, английский, французский, немецкий, венгерский, итальянский, португальский, русский, словенский и испанский). Каждый корпус был очищен от дубликатов, снабжен морфосинтаксической разметкой в формате Universal Dependencies и снабжен метаданными. Тексты и метаднные доступны в виде унифицированных JSON-файлов.
Поэтические корпуса — это культурное достояние и важный источник, содержащий информацию о национальной поэзии и языке конкретного временного периода. Если вы использовали для своих исследований (или других целей?) эти и другие поэтические корпуса, пожалуйста, расскажите о них в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Библиотеки поэзии: цифровые коллекции стихов
Библиотеки поэзии: рассказываем про поэтические корпуса — коллекции стихов и цифровые ресурсы поэтических текстов для стиховедов
❤21🔥15👍7✍2🥰2
Что такое фреймбанки и зачем экономистам лингвистика
Как предсказать рыночную стоимость компаний? Зачем собирать значения слов в базы данных? Что делает завтрак завтраком? И… как эти вопросы вообще оказались в одном ряду? Разбираемся в новой статье.
🍳 Завтрак, обед и ужин
Начнем с завтрака: если бы вы попытались объяснить этот феномен инопланетянину или человеку совсем другой культуры, вам неизбежно пришлось рассказать бы про систему из трех приемов пищи, где завтрак — первый. В лингвистическом смысле этот контекст создает рамку, или фрейм, что и делает завтрак завтраком, а ответы на вопросы когда, с кем и зачем мы его едим могут отличаться. Такие контексты и изучает фреймовая семантика, благодаря которой можно исследовать, как устроены значения слов в естественном языке.
🗂️ FrameNet и FrameBank
Чтобы изучать фреймы системнее и эффективнее, лингвисты создали фреймбанки, базы данных фреймов. Самые известные — FrameNet для английского языка и FrameBank — для русского. Они показывают, какие элементы скрыты внутри значения слов и фраз: кто действует, что происходит, где, когда и каким образом.
💸 Экономическое применение
Если пока всё звучало довольно абстрактно, рассказываем про конкретные примеры использования фреймбанков.
В 2013 году американские исследователи собрали корпус новостей о крупных компаниях с 2007 по 2012 год, на которые пришлись и период экономического упадка (2007–2010), и экономического роста (2011–2012). Новости собирались о компаниях из сферы телекоммуникаций, IT и товаров первой необходимости.
С помощью алгоритма исследователи выделяли роли компаний во фреймах («кто судится», «кто заявляет», «кто нарушает права») и по этим ролям пытались предсказать движение стоимости акций. Спойлер:у них вполне получилось предсказать, станет цена выше или ниже, но сам факт её изменения алгоритм предвидел не всегда.
Подробнее об этом исследовании, упомянутых базах данных и фреймах, можете узнать из полной версии статьи.
Время чтения: 14 минут
🤖 «Системный Блокъ» @sysblok
Как предсказать рыночную стоимость компаний? Зачем собирать значения слов в базы данных? Что делает завтрак завтраком? И… как эти вопросы вообще оказались в одном ряду? Разбираемся в новой статье.
🍳 Завтрак
Начнем с завтрака: если бы вы попытались объяснить этот феномен инопланетянину или человеку совсем другой культуры, вам неизбежно пришлось рассказать бы про систему из трех приемов пищи, где завтрак — первый. В лингвистическом смысле этот контекст создает рамку, или фрейм, что и делает завтрак завтраком, а ответы на вопросы когда, с кем и зачем мы его едим могут отличаться. Такие контексты и изучает фреймовая семантика, благодаря которой можно исследовать, как устроены значения слов в естественном языке.
🗂️ FrameNet и FrameBank
Чтобы изучать фреймы системнее и эффективнее, лингвисты создали фреймбанки, базы данных фреймов. Самые известные — FrameNet для английского языка и FrameBank — для русского. Они показывают, какие элементы скрыты внутри значения слов и фраз: кто действует, что происходит, где, когда и каким образом.
💸 Экономическое применение
Если пока всё звучало довольно абстрактно, рассказываем про конкретные примеры использования фреймбанков.
В 2013 году американские исследователи собрали корпус новостей о крупных компаниях с 2007 по 2012 год, на которые пришлись и период экономического упадка (2007–2010), и экономического роста (2011–2012). Новости собирались о компаниях из сферы телекоммуникаций, IT и товаров первой необходимости.
С помощью алгоритма исследователи выделяли роли компаний во фреймах («кто судится», «кто заявляет», «кто нарушает права») и по этим ролям пытались предсказать движение стоимости акций. Спойлер:
Подробнее об этом исследовании, упомянутых базах данных и фреймах, можете узнать из полной версии статьи.
Время чтения: 14 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Что такое фреймбанки и зачем экономистам лингвистика - Системный Блокъ
Рассказываем, что такое семантический фрейм, как устроены базы данных таких фреймов, и как они применяются в задачах NLP
🔥31❤17👏15👍1
Скриптор умер, да здравствует автор!
Какие тексты нравятся нам больше — человеческие и нейросетевые? Так ли хорошо модели научились нас имитировать? И так ли хорошо мы распознаем эту имитацию? Разбираемся в новом тексте нашего блогера Дмитрия Пронина.
🤖 Зачем автору ИИ?
Искусственный интеллект, а в первую очередь большие языковые модели, вошли в нашу жизнь очень стремительно. Всего за пару лет они заметно изменили то, как мы работаем с информацией, решаем задачи, общаемся с миром. Для многих людей ИИ уже стал таким же естественным рабочим инструментом, как почта или текстовый редактор.
Даже в творческой работе языковые модели действительно могут помочь. Когда мы пишем, первые 10–15% времени работы — это выплеск мыслей, поток сознания, сырой материал. Остальные 85% — борьба с несовершенством: переписывание, шлифовка, структурирование.
Если отдать этот первичный поток ИИ и попросить его переформулировать, можно сэкономить часы и получить аккуратный, выразительный текст, который при этом весьма точно передает вашу мысль. Машина «переводит» внутренний хаос на ясный, удобоваримый язык.
Но у эффективности нейросетей есть и обратная сторона: весь текст выше этой строки написан при помощи ИИ по такой схеме: поток сознания → машинная редактура → редактура нашего блогера.
🙏 Пожалуйста, не переключайтесь
Что вы почувствовали, читая текст выше? С большой долей вероятности вы долго были уверены, что все выше человеческое, авторское. И в каком-то смысле это так: ИИ лишь привел в порядок мысли. Но стоит узнать правду — и текст мгновенно обесценивается.
👾 Почему так происходит?
В знакомых всем шаблонных риторических конструкциях, словно неосознанно выдернутых из учебника, легко чувствуется ИИ. Тройные риторические повторы (триколоны) в каждом втором предложении. Конструкции вроде «Это не просто X. Это Y», обязательный маленький вывод после каждого абзаца, нумерованные списки, длинные тире, которые стали мемом. Всё это напоминает сочинение на школьном экзамене, написанное так, чтобы идеально соответствовать критериям оценки, а не чтобы что-то выразить и донести до читателя.
Нежелание читать такие тексты — своеобразный бунт против цифровой унитарности и утилитарности. То же самое происходит и в других сферах. В мире технологий конвейерной еды, неожиданно расцветают фермерские продукты, ремесленные сыры и хлеб, приготовленный вручную. На фоне быстрой моды, где вещи живут один сезон, растет интерес к ретрогардеробу: плотная шерсть, добротный деним, кожа, выкройки прошлого века.
Вероятно, с текстом скоро произойдет то же самое. Но подробнее об этом вы узнаете уже из полного текста блога.
🤖 «Системный Блокъ» @sysblok
Какие тексты нравятся нам больше — человеческие и нейросетевые? Так ли хорошо модели научились нас имитировать? И так ли хорошо мы распознаем эту имитацию? Разбираемся в новом тексте нашего блогера Дмитрия Пронина.
🤖 Зачем автору ИИ?
Искусственный интеллект, а в первую очередь большие языковые модели, вошли в нашу жизнь очень стремительно. Всего за пару лет они заметно изменили то, как мы работаем с информацией, решаем задачи, общаемся с миром. Для многих людей ИИ уже стал таким же естественным рабочим инструментом, как почта или текстовый редактор.
Даже в творческой работе языковые модели действительно могут помочь. Когда мы пишем, первые 10–15% времени работы — это выплеск мыслей, поток сознания, сырой материал. Остальные 85% — борьба с несовершенством: переписывание, шлифовка, структурирование.
Если отдать этот первичный поток ИИ и попросить его переформулировать, можно сэкономить часы и получить аккуратный, выразительный текст, который при этом весьма точно передает вашу мысль. Машина «переводит» внутренний хаос на ясный, удобоваримый язык.
Но у эффективности нейросетей есть и обратная сторона: весь текст выше этой строки написан при помощи ИИ по такой схеме: поток сознания → машинная редактура → редактура нашего блогера.
🙏 Пожалуйста, не переключайтесь
Что вы почувствовали, читая текст выше? С большой долей вероятности вы долго были уверены, что все выше человеческое, авторское. И в каком-то смысле это так: ИИ лишь привел в порядок мысли. Но стоит узнать правду — и текст мгновенно обесценивается.
👾 Почему так происходит?
В знакомых всем шаблонных риторических конструкциях, словно неосознанно выдернутых из учебника, легко чувствуется ИИ. Тройные риторические повторы (триколоны) в каждом втором предложении. Конструкции вроде «Это не просто X. Это Y», обязательный маленький вывод после каждого абзаца, нумерованные списки, длинные тире, которые стали мемом. Всё это напоминает сочинение на школьном экзамене, написанное так, чтобы идеально соответствовать критериям оценки, а не чтобы что-то выразить и донести до читателя.
Нежелание читать такие тексты — своеобразный бунт против цифровой унитарности и утилитарности. То же самое происходит и в других сферах. В мире технологий конвейерной еды, неожиданно расцветают фермерские продукты, ремесленные сыры и хлеб, приготовленный вручную. На фоне быстрой моды, где вещи живут один сезон, растет интерес к ретрогардеробу: плотная шерсть, добротный деним, кожа, выкройки прошлого века.
Вероятно, с текстом скоро произойдет то же самое. Но подробнее об этом вы узнаете уже из полного текста блога.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Есть ли место человеческому тексту в эпоху больших языковых моделей? - Системный Блокъ
Нейросети уже научились писать почти как люди. Они могут упорядочить, отшлифовать, упростить наш текст. Но почему нам все больше хочется иметь дело с авторским голосом? Читать шероховатое, с пропущенными запятыми, с логическими пропусками повествование? Что…
❤45👍20🔥9🕊3💋3
«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским
120 лет назад, 15 декабря 1905 года, в Петербурге был создан Пушкинский дом — тогда учреждение Императорской Академии наук, а ныне Институт русской литературы РАН. Это главное хранилище рукописей Александра Пушкина и одно из крупнейших литературных архивохранилищ страны. Всего в ПушДоме хранится более 3 миллионов рукописей, есть большой фонограммархив (мы рассказывали о нем), а уже в XXI веке появилась и Цифровая лаборатория с репозиторием открытых данных. В день 120-летия ПушДома — перечитываем наше интервью с руководителем Цифровой лаборатории Кириллом Маслинским.
Чем занимается лаборатория?
Одна из миссий Лаборатории цифровых исследований литературы и фольклора — воплощать литературные корпуса, которые работают по тому же принципу, что и Национальный корпус русского языка. Например, ДетКорпус из 3000 детских книг и корпус нарративной прозы из 500 романов XIX века.
Ещё одна важная задача — опубликовать после исследования данные по современным стандартам. Лаборатория помогает это сделать: данные необходимо не только переработать и донести до публики, но и сделать доступными для количественных исследований.
Что это значит на практике?
Например, в случае с датасетом о бытовании литературных текстов в ГУЛАГе было около восьми раундов правок с авторами, потому что таблица создавалась филологами как «человекочитаемые» данные, а не как машиночитаемые. Если произведение упоминалось в таблице несколько раз с разной датировкой, какие-то даты были написаны со знаками вопроса вместо чисел, все это требовало упорядочивания, стандартизации и преобразования данных для количественных исследований, чтобы это можно было загрузить в какой-то датафрейм в R или в Python.
Какие открытия делают в корпусе детской литературы?
На базе Детского корпуса изучали репрезентацию телесности и гендерные аспекты в детских текстах. Выяснилось, например, что у мальчиков писатели очень сильно актуализируют затылки, а у девочек — щеки. Это как бы такие отдельно «женские» и «мужские» части тела в текстах детского корпуса.
Другое исследование, которое проводил Кирилл Маслинский, было посвящено контекстному употреблению слова «счастье» в ДетКорпусе. Спойлер:только в застойные времена «счастье» стало гораздо более индивидуалистичным. Там появились оттенки быта, уюта, семьи, а коллективное счастье, характерное для текстов, начиная с периода сталинского СССР, к этому моменту подзакончилось.
Подробнее о том, как менялось «счастье» в детских книгах, что такое digital commons, с какими сложностями столкнулись создатели датасета с данными ГУЛАГа и почему сегодня он актуален как никогда — в полном тексте интервью.
🤖 «Системный Блокъ» @sysblok
120 лет назад, 15 декабря 1905 года, в Петербурге был создан Пушкинский дом — тогда учреждение Императорской Академии наук, а ныне Институт русской литературы РАН. Это главное хранилище рукописей Александра Пушкина и одно из крупнейших литературных архивохранилищ страны. Всего в ПушДоме хранится более 3 миллионов рукописей, есть большой фонограммархив (мы рассказывали о нем), а уже в XXI веке появилась и Цифровая лаборатория с репозиторием открытых данных. В день 120-летия ПушДома — перечитываем наше интервью с руководителем Цифровой лаборатории Кириллом Маслинским.
Чем занимается лаборатория?
Одна из миссий Лаборатории цифровых исследований литературы и фольклора — воплощать литературные корпуса, которые работают по тому же принципу, что и Национальный корпус русского языка. Например, ДетКорпус из 3000 детских книг и корпус нарративной прозы из 500 романов XIX века.
Ещё одна важная задача — опубликовать после исследования данные по современным стандартам. Лаборатория помогает это сделать: данные необходимо не только переработать и донести до публики, но и сделать доступными для количественных исследований.
Что это значит на практике?
Например, в случае с датасетом о бытовании литературных текстов в ГУЛАГе было около восьми раундов правок с авторами, потому что таблица создавалась филологами как «человекочитаемые» данные, а не как машиночитаемые. Если произведение упоминалось в таблице несколько раз с разной датировкой, какие-то даты были написаны со знаками вопроса вместо чисел, все это требовало упорядочивания, стандартизации и преобразования данных для количественных исследований, чтобы это можно было загрузить в какой-то датафрейм в R или в Python.
Какие открытия делают в корпусе детской литературы?
На базе Детского корпуса изучали репрезентацию телесности и гендерные аспекты в детских текстах. Выяснилось, например, что у мальчиков писатели очень сильно актуализируют затылки, а у девочек — щеки. Это как бы такие отдельно «женские» и «мужские» части тела в текстах детского корпуса.
Другое исследование, которое проводил Кирилл Маслинский, было посвящено контекстному употреблению слова «счастье» в ДетКорпусе. Спойлер:
Подробнее о том, как менялось «счастье» в детских книгах, что такое digital commons, с какими сложностями столкнулись создатели датасета с данными ГУЛАГа и почему сегодня он актуален как никогда — в полном тексте интервью.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским - Системный Блокъ
Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. «Системный Блокъ» узнал у Кирилла, что…
❤33🔥22🏆5⚡2👍2💅2
США разрешили Китаю покупать самые новые чипы для ИИ, дата-центры в космосе, обновление GPT-5
Рассказываем, что произошло в мире ИИ за последнее время.
Снят запрет на экспорт новых видеокарт в Китай
США разрешили производителям Nvidia и AMD продавать свои новейшие видеокарты Китаю. Это решение может существенно ускорить развитие искусственного интеллекта в стране.
Видеокарты (GPU) — специализированные процессоры, предназначенные для параллельного выполнения большого количества операций. Изначально их применяли в видеоиграх, затем — для научных расчетов и физического моделирования. С 2010-х годов эти чипы стали использовать для обучения нейросетей.
В 2022 году в Америке ввели ограничения на продажу продвинутых видеокарт китайским компаниям, стремясь замедлить развитие ИИ-технологий в КНР. Nvidia могла поставлять только ограниченные по мощности чипы.
8 декабря 2025 это правило отменили, но 25% от выручки с продаж в Китай будут направляться в бюджет США.
Дата-центры в космосе
Стартап StarCloud сумел обучить языковую модель на компьютере, расположенном на космическом спутнике. Кроме того, компании удалось запустить на орбите более большую LLM, которая может принимать запросы и отвечать прямо из космоса.
В ноябре 2025 года StarCloud вывел на орбиту спутник StarCloud-1, который стал самым вычислительно мощным спутником за всю историю — в 100 раз производительнее в параллельных вычислениях любого компьютера, побывавшего в космосе ранее. Фактически, StarCloud-1 стал первым вычислительным центром для искусственного интеллекта, развёрнутым в космосе.
OpenAI обновила GPT
Компания OpenAI обновила GPT. Новая версия GPT-5.2 лучше справляется с задачами из реальных профессий, программированием и анализом изображений.
В тесте GDPval, о котором мы рассказывали ранее, GPT-5.2 сравнялась с экспертами-людьми. В лидеры по программировнию модель выбилась благодаря улучшенным способностям автономно решать задачи и более качественной работе с длинными контекстами. Кроме того, компания заявляет о повышенной точности при обработке больших документов, графиков, скриншотов и других типов визуально-структурированного контента.
Новая LLM доступна всем пользователям мобильного приложения и веб-сайта OpenAI. Доступ через API обойдётся в 1,4 раза дороже предыдущей версии.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время.
Снят запрет на экспорт новых видеокарт в Китай
США разрешили производителям Nvidia и AMD продавать свои новейшие видеокарты Китаю. Это решение может существенно ускорить развитие искусственного интеллекта в стране.
Видеокарты (GPU) — специализированные процессоры, предназначенные для параллельного выполнения большого количества операций. Изначально их применяли в видеоиграх, затем — для научных расчетов и физического моделирования. С 2010-х годов эти чипы стали использовать для обучения нейросетей.
В 2022 году в Америке ввели ограничения на продажу продвинутых видеокарт китайским компаниям, стремясь замедлить развитие ИИ-технологий в КНР. Nvidia могла поставлять только ограниченные по мощности чипы.
8 декабря 2025 это правило отменили, но 25% от выручки с продаж в Китай будут направляться в бюджет США.
Почему это важно?
Даже при ограничениях китайские компании сумели стать вторыми в ИИ-гонке. Например, лаборатория DeepSeek эффективно использовала устаревшее оборудование для обучения конкурентной LLM, потратив на порядок меньше средств, чем американские компании.
Теперь китайские разработчики смогут быстрее сократить и без того незначительное отставание от американских компаний. Однако существует вероятность, что Пекин предпочтет ускорить развитие собственного производства чипов и снизить технологическую зависимость от США.
Дата-центры в космосе
Стартап StarCloud сумел обучить языковую модель на компьютере, расположенном на космическом спутнике. Кроме того, компании удалось запустить на орбите более большую LLM, которая может принимать запросы и отвечать прямо из космоса.
В ноябре 2025 года StarCloud вывел на орбиту спутник StarCloud-1, который стал самым вычислительно мощным спутником за всю историю — в 100 раз производительнее в параллельных вычислениях любого компьютера, побывавшего в космосе ранее. Фактически, StarCloud-1 стал первым вычислительным центром для искусственного интеллекта, развёрнутым в космосе.
Почему это важно?
Когда компании масштабируют свои дата-центры для обучения более продвинутых ИИ-моделей, растут потребности в электроэнергии и воде для охлаждения оборудования. Уже сейчас некоторые дата-центры потребляют столько же электричества, сколько нужно для обеспечения среднего города.
Ради более эффективной и экологичной работы Google и Nvidia всерьез рассматривают идею размещения дата-центров в космосе.
Причин много: стоимость запуска спутников постоянно снижается, на орбите доступно обильное солнечное излучение для выработки энергии, проблема охлаждения стоит менее остро, дата-центры не влияют на экологию Земли.
В ноябре 2025 года Google объявила о проекте космических дата-центров Suncatcher. Ученые компании опубликовали статью с концепцией флота космических спутников, образующих вычислительную инфраструктуру для обучения и запуска ИИ-моделей. Авторы исследуют вопросы эффективной коммуникации между спутниками, влияния радиации на процессоры и другие фундаментальные проблемы.
OpenAI обновила GPT
Компания OpenAI обновила GPT. Новая версия GPT-5.2 лучше справляется с задачами из реальных профессий, программированием и анализом изображений.
В тесте GDPval, о котором мы рассказывали ранее, GPT-5.2 сравнялась с экспертами-людьми. В лидеры по программировнию модель выбилась благодаря улучшенным способностям автономно решать задачи и более качественной работе с длинными контекстами. Кроме того, компания заявляет о повышенной точности при обработке больших документов, графиков, скриншотов и других типов визуально-структурированного контента.
Новая LLM доступна всем пользователям мобильного приложения и веб-сайта OpenAI. Доступ через API обойдётся в 1,4 раза дороже предыдущей версии.
Почему это важно?
GPT — самая популярная большая языковая модель. Обновление затронет огромное количество пользователей. Число еженедельных активных пользователей сервиса ChatGPT оценивается в 700 млн.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14❤9👍7🤯5
Художник тайно повесил ИИ-картину в музее Кардиффа
Художник Элиас Мэрроу, называющий себя «культурным хирургом», без ведома кураторов музея добавил в экспозицию напечатанную на бумаге картину. Работа имитировала классический портрет маслом: на ней был изображен мальчик в школьной форме с мрачным выражением лица, держащий на коленях пустую тарелку.
При этом на картине были заметны признаки того, что она сгенерирована нейросетью: логотип на форме школьника состоял из бессмысленного набора нечитаемых букв, а само изображение имело характерный для генеративных моделей желтоватый оттенок.
Картину успели увидеть сотни посетителей, пока один из них не заметил странности в изображении и не обратился к персоналу. После этого работу убрали.
Элиас Мэрроу заявил, что эта акция — не вандализм, а «участие без разрешения»; ему хотелось увидеть, как «публичные институции решают, что стоит показывать, и что произойдет, когда что-то извне проникает в эту систему».
Сама картина, по словам художника, представляет Уэльс в 2025 году. Как сказано в ее описании на сайте автора, неясно, чего ждет изображенный на картине мальчик: что его накормят, накажут, или его просто забыли.
Художник также подчеркнул, что использование искусственного интеллекта для него — это естественная эволюция художественных инструментов.
🤖 «Системный Блокъ» @sysblok
Художник Элиас Мэрроу, называющий себя «культурным хирургом», без ведома кураторов музея добавил в экспозицию напечатанную на бумаге картину. Работа имитировала классический портрет маслом: на ней был изображен мальчик в школьной форме с мрачным выражением лица, держащий на коленях пустую тарелку.
При этом на картине были заметны признаки того, что она сгенерирована нейросетью: логотип на форме школьника состоял из бессмысленного набора нечитаемых букв, а само изображение имело характерный для генеративных моделей желтоватый оттенок.
Картину успели увидеть сотни посетителей, пока один из них не заметил странности в изображении и не обратился к персоналу. После этого работу убрали.
Элиас Мэрроу заявил, что эта акция — не вандализм, а «участие без разрешения»; ему хотелось увидеть, как «публичные институции решают, что стоит показывать, и что произойдет, когда что-то извне проникает в эту систему».
Сама картина, по словам художника, представляет Уэльс в 2025 году. Как сказано в ее описании на сайте автора, неясно, чего ждет изображенный на картине мальчик: что его накормят, накажут, или его просто забыли.
Художник также подчеркнул, что использование искусственного интеллекта для него — это естественная эволюция художественных инструментов.
Почему это важно?
Во-первых, это своего рода тест Тьюринга для музейного пространства. Тот факт, что сгенерированное изображение смогло органично вписаться в экспозицию национального музея и не сразу вызвало подозрения, говорит о том, что границы между «нейросетевым» и «человеческим» творчеством размываются.
Во-вторых, это пример использования ИИ в социальном активизме. Он напоминает о том, что нейросети, как и любая другая технология, служат инструментом нашей деятельности. В случае с художником Элиасом Мэрроу они позволили привлечь внимание к социальным проблемам.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥19❤15🥴9🤔5
Как роботы спасали Нотр-Дам-де-Пари и не спасли «Фукусиму»
Роботы давно ассистируют людям в ситуациях катастрофы. Иногда более успешно, иногда — менее. Рассказываем про их достижения и провали в новом материале.
🤖 «Фукусима-1»: польза и бесполезность роботов
В 2011 году на японской АЭС «Фукусима-1» произошла катастрофа с утечкой радиации. К ликвидации последствий привлекли роботов, но те не смогли быстро добраться до скоплений водорода, чтобы выпустить взрывоопасный газ. Они стали полезны лишь позднее: при разборе завалов их отправили в смертельно опасные зоны с высоким уровнем радиации.
Эта неудача, наряду с трагедией 11 сентября 2001 в США, стала поворотным моментом: сразу несколько компаний задумались о том, что роботы, как и люди, будут эффективнее работать в команде. Так начались разработки целых систем роботов с единым центром управления.
🧯 Colossus и Assassin’s Creed: кто спас Нотр-Дам
15 апреля 2019 года мир потряс пожар в соборе Парижской Богоматери. Пламя мгновенно охватило старые деревянные перекрытия. Из-за сильного задымления и угрозы обрушения крыши вход внутрь стал крайне опасным для людей, поэтому на помощь пожарным пришла робототехника.
Одним из главных героев операции стал Colossus — тяжелый пожарный робот от французской компании Shark Robotics. Он был оснащен камерами, тепловизорами, системой дымоудаления и автоматическим водометом, подающим до 2500 литров воды в минуту.
Он не мог заменить людей, но стал для них важнейшей поддержкой — использование робота позволило значительно снизить температуру внутри нефа, предотвратить обрушение крыши и стабилизировать ситуацию всего за 10 часов работы. Без этой технологии для достижения таких результатов понадобились бы усилия 15 пожарных.
После тушения пожара роботы использовались для разбора завалов. Параллельно велась работа по созданию цифровой модели здания. Интересно, что одной из отправных точек стали данные компании Ubisoft: в 2014 году студия провела детализированную 3D-съемку интерьеров Нотр-Дама для разработки игры Assassin’s Creed Unity.
Хотя реставраторы не использовали их напрямую (они пользовались 3D-моделью, которую делали профессиональные реставраторы), Ubisoft все же передала материалы проекту.
Подробнее о том, как технологии помогают ликвидировать последствия катастроф и восстанавливать архитектурные памятники узнаете из полной версии статьи. Спойлер:там есть фрагмент про «робопса»!
Время чтения: 7 минут
🤖 «Системный Блокъ» @sysblok
Роботы давно ассистируют людям в ситуациях катастрофы. Иногда более успешно, иногда — менее. Рассказываем про их достижения и провали в новом материале.
🤖 «Фукусима-1»: польза и бесполезность роботов
В 2011 году на японской АЭС «Фукусима-1» произошла катастрофа с утечкой радиации. К ликвидации последствий привлекли роботов, но те не смогли быстро добраться до скоплений водорода, чтобы выпустить взрывоопасный газ. Они стали полезны лишь позднее: при разборе завалов их отправили в смертельно опасные зоны с высоким уровнем радиации.
Эта неудача, наряду с трагедией 11 сентября 2001 в США, стала поворотным моментом: сразу несколько компаний задумались о том, что роботы, как и люди, будут эффективнее работать в команде. Так начались разработки целых систем роботов с единым центром управления.
🧯 Colossus и Assassin’s Creed: кто спас Нотр-Дам
15 апреля 2019 года мир потряс пожар в соборе Парижской Богоматери. Пламя мгновенно охватило старые деревянные перекрытия. Из-за сильного задымления и угрозы обрушения крыши вход внутрь стал крайне опасным для людей, поэтому на помощь пожарным пришла робототехника.
Одним из главных героев операции стал Colossus — тяжелый пожарный робот от французской компании Shark Robotics. Он был оснащен камерами, тепловизорами, системой дымоудаления и автоматическим водометом, подающим до 2500 литров воды в минуту.
Он не мог заменить людей, но стал для них важнейшей поддержкой — использование робота позволило значительно снизить температуру внутри нефа, предотвратить обрушение крыши и стабилизировать ситуацию всего за 10 часов работы. Без этой технологии для достижения таких результатов понадобились бы усилия 15 пожарных.
После тушения пожара роботы использовались для разбора завалов. Параллельно велась работа по созданию цифровой модели здания. Интересно, что одной из отправных точек стали данные компании Ubisoft: в 2014 году студия провела детализированную 3D-съемку интерьеров Нотр-Дама для разработки игры Assassin’s Creed Unity.
Хотя реставраторы не использовали их напрямую (они пользовались 3D-моделью, которую делали профессиональные реставраторы), Ubisoft все же передала материалы проекту.
Подробнее о том, как технологии помогают ликвидировать последствия катастроф и восстанавливать архитектурные памятники узнаете из полной версии статьи. Спойлер:
Время чтения: 7 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как роботы-спасатели защищают объекты культурного наследия при пожарах и ЧС - Системный Блокъ
Пожары и чрезвычайные ситуации создают угрозу для памятников истории, собор Парижской Богоматери — яркий тому пример. Читайте, как роботы-спасатели нового поколения меняют подход к сохранению объектов культурного наследия, минимизируя риски и ущерб.
❤27🔥15👍13
Футурология, уныние и сексизм: цифровые исследования литературы XIX века
Казалось бы, XIX век в русской литературе изучен вдоль и поперек, и в нем не осталось белых пятен. Но цифровые методы позволяют увидеть неочевидные тенденции: эволюцию жанра, контекст словоупотреблений или стереотипы. В нашей подборке мы собрали наши самые интересные статьи о XIX веке.
Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети
Когда мы говорим о футурологах, мы редко вспоминаем писателей позапрошлого века. И зря. Фаддей Булгарин, Владимир Одоевский и их современники в своих произведениях описывали технологии, поразительно похожие на то, чем мы пользуемся сегодня. Кто из русских писателей XIX века предсказал нейросети? Как Александр Бестужев предугадал корпусную лингвистику? Что общего между романом Владимира Одоевского «4883-й год» и XXI веком? Узнаете здесь!
Заговори, чтобы я тебя увидел: эволюция диалога в русской литературе XIX века
Исследователь Института Макса Планка Олег Собчук собрал выборку из 400 русских романов XIX века и определил «коэффициент живости» — отношение числа высказываний ко всему числу слов в тексте. Он не только обнаружил, что с 1830-х к 1890-м коэффициент живости увеличился вдвое, но и предположил, что это может быть связано с влиянием зарубежной литературы. С чем ещё — узнаете из нашего поста.
Что случилось с самыми унылыми стихотворениями XIX века?
Элегия — ключевой поэтический жанр «золотого века» русской поэзии. К нему мы тоже применяли количественные методы и выяснили, что вы наверняка опознаете элегию по словам «милый», «небо», «слеза» и «мечта». Если смотреть на сочетания из двух слов (биграммы), то для элегий характерны: «последний раз», «милый друг», «вся радость», «юные годы», «слезы лить», «сладкий сон». А подробнее о жанровой эволюции рассказали тут.
Русские классики — сексисты или все-таки нет?
Про гендерное неравенство в литературе у нас есть отдельная подборка: можете прочитать там и про женщин, которые у русских классиков XIX века устают и исчезают чаще мужчин, и про изменения в женских характерах и поведении в литературе Набокова и Булгакова, и про ситуацию в английской литературе.
Понять Льва Толстого: как векторно-семантические модели помогают литературоведам
Без цифровых методов мы едва ли узнали бы, что глаголы «обожать» и «боготворить» в текстах Толстого свидетельствуют о чувствах ложных и зыбких, а вот «любят» у классика по-настоящему. Ещё больше об идиостиле писателя (и о том, что такое идиостиль) узнаете из этого материала Бориса Орехова.
🤖 «Системный Блокъ» @sysblok
Казалось бы, XIX век в русской литературе изучен вдоль и поперек, и в нем не осталось белых пятен. Но цифровые методы позволяют увидеть неочевидные тенденции: эволюцию жанра, контекст словоупотреблений или стереотипы. В нашей подборке мы собрали наши самые интересные статьи о XIX веке.
Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети
Когда мы говорим о футурологах, мы редко вспоминаем писателей позапрошлого века. И зря. Фаддей Булгарин, Владимир Одоевский и их современники в своих произведениях описывали технологии, поразительно похожие на то, чем мы пользуемся сегодня. Кто из русских писателей XIX века предсказал нейросети? Как Александр Бестужев предугадал корпусную лингвистику? Что общего между романом Владимира Одоевского «4883-й год» и XXI веком? Узнаете здесь!
Заговори, чтобы я тебя увидел: эволюция диалога в русской литературе XIX века
Исследователь Института Макса Планка Олег Собчук собрал выборку из 400 русских романов XIX века и определил «коэффициент живости» — отношение числа высказываний ко всему числу слов в тексте. Он не только обнаружил, что с 1830-х к 1890-м коэффициент живости увеличился вдвое, но и предположил, что это может быть связано с влиянием зарубежной литературы. С чем ещё — узнаете из нашего поста.
Что случилось с самыми унылыми стихотворениями XIX века?
Элегия — ключевой поэтический жанр «золотого века» русской поэзии. К нему мы тоже применяли количественные методы и выяснили, что вы наверняка опознаете элегию по словам «милый», «небо», «слеза» и «мечта». Если смотреть на сочетания из двух слов (биграммы), то для элегий характерны: «последний раз», «милый друг», «вся радость», «юные годы», «слезы лить», «сладкий сон». А подробнее о жанровой эволюции рассказали тут.
Русские классики — сексисты или все-таки нет?
Про гендерное неравенство в литературе у нас есть отдельная подборка: можете прочитать там и про женщин, которые у русских классиков XIX века устают и исчезают чаще мужчин, и про изменения в женских характерах и поведении в литературе Набокова и Булгакова, и про ситуацию в английской литературе.
Понять Льва Толстого: как векторно-семантические модели помогают литературоведам
Без цифровых методов мы едва ли узнали бы, что глаголы «обожать» и «боготворить» в текстах Толстого свидетельствуют о чувствах ложных и зыбких, а вот «любят» у классика по-настоящему. Ещё больше об идиостиле писателя (и о том, что такое идиостиль) узнаете из этого материала Бориса Орехова.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Системный Блокъ
Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети
Насколько хорошо писатели XIX и первой половины XX века предвидели современные информационные технологии? Удивительно, но современники Пушкина и Толстого смогли предсказать мессенджеры…
Насколько хорошо писатели XIX и первой половины XX века предвидели современные информационные технологии? Удивительно, но современники Пушкина и Толстого смогли предсказать мессенджеры…
❤33🔥12🕊5👍1
Психометрика в образовании: как составлять тесты, чтобы они измеряли реальные знания
Вы точно слышали фразу «оценка не показатель знаний» и наверняка понимаете, что для успешной сдачи экзамена важнее понимать его формат, чем хорошо знать предмет. Решить проблему составления грамотных тестов может психометрика — область на стыке социальных наук и математики. Она отвечает за весь цикл теста — от определения цели до подсчета баллов и снижает риск ошибок в тех случаях, когда ученик знает материал, но теряет баллы из-за формулировки или двусмысленного вопроса. Разбираемся с этим феноменом в новом материале.
🤓 Что за психометрика?
Основоположниками современной психометрики называют французских психологов Альфреда Бине и Теодора Симона, которые в начале XX века разработали первый в мире тест для оценки интеллекта. Сегодня тесты и психометрика применяются в самых разных областях: оценке школьной успеваемости, профессиональном отборе на должности, IT-сфере, маркетинге, спорте и даже криминологии.
☑️ Как составить хороший тест?
В больших образовательных проектах предметный эксперт и психометрик работают вместе: один отвечает за содержание, другой — за то, чтобы задания действительно измеряли нужную компетенцию и не поощряли угадывание. Ниже найдете несколько логичных и важных принципов, которые помогают составить хороший тест. Спойлер:тестов «Какой ты котик?» или «С какой начинкой ты пирожок?» эти рекомендации не касаются!
5️⃣ принципов составления хорошего теста
⁃ нужно заранее понимать, какие именно знания и компетенции проверяет тест;
⁃ задания должны покрывать все темы сбалансированно;
⁃ наиболее «чистое» измерение достигается, когда одно задание содержит только один вопрос и направлено на проверку одной компетенции;
⁃ создавайте задания разного уровня сложности — легкие, средние и трудные;
⁃ неправильные ответы (дистракторы) должны быть правдоподобными и не уступать верному ответу по степени проработанности.
Еще несколько советов по составлению хорошего теста с примерами и короткую сводку по тестовой культуре в России найдете в полной версии материала.
Время чтения: 13 минут
🤖 «Системный Блокъ» @sysblok
Вы точно слышали фразу «оценка не показатель знаний» и наверняка понимаете, что для успешной сдачи экзамена важнее понимать его формат, чем хорошо знать предмет. Решить проблему составления грамотных тестов может психометрика — область на стыке социальных наук и математики. Она отвечает за весь цикл теста — от определения цели до подсчета баллов и снижает риск ошибок в тех случаях, когда ученик знает материал, но теряет баллы из-за формулировки или двусмысленного вопроса. Разбираемся с этим феноменом в новом материале.
🤓 Что за психометрика?
Основоположниками современной психометрики называют французских психологов Альфреда Бине и Теодора Симона, которые в начале XX века разработали первый в мире тест для оценки интеллекта. Сегодня тесты и психометрика применяются в самых разных областях: оценке школьной успеваемости, профессиональном отборе на должности, IT-сфере, маркетинге, спорте и даже криминологии.
☑️ Как составить хороший тест?
В больших образовательных проектах предметный эксперт и психометрик работают вместе: один отвечает за содержание, другой — за то, чтобы задания действительно измеряли нужную компетенцию и не поощряли угадывание. Ниже найдете несколько логичных и важных принципов, которые помогают составить хороший тест. Спойлер:
5️⃣ принципов составления хорошего теста
⁃ нужно заранее понимать, какие именно знания и компетенции проверяет тест;
⁃ задания должны покрывать все темы сбалансированно;
⁃ наиболее «чистое» измерение достигается, когда одно задание содержит только один вопрос и направлено на проверку одной компетенции;
⁃ создавайте задания разного уровня сложности — легкие, средние и трудные;
⁃ неправильные ответы (дистракторы) должны быть правдоподобными и не уступать верному ответу по степени проработанности.
Еще несколько советов по составлению хорошего теста с примерами и короткую сводку по тестовой культуре в России найдете в полной версии материала.
Время чтения: 13 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Психометрика в образовании: как составлять тесты, чтобы они измеряли реальные знания - Системный Блокъ Психометрика в образовании:…
Наверняка вы не раз сталкивались с тестами: сдавали экзамены в школе или проходили собеседование. Но всегда ли им можно доверять? Как отличить хороший тест от плохого? И что нужно знать, чтобы составить грамотный тест самостоятельно? Ответы дает психометрика…
🔥26❤15👍8
Автор в словах: доступно рассказываем, что такое стилометрия
Digital Humanities — область, где гуманитарные науки встречаются с вычислениями. Пример такого синтеза — стилометрия, статистический анализ для атрибуции текста. Мы все время упоминаем этот метод, и, кажется, пора объяснить, что он из себя представляет и откуда вообще взялся.
Кто придумал считать слова?
Первую попытку количественного анализа авторского стиля в России предпринял русский ученый-энциклопедист Николай Морозов. В своей статье он подсчитал частотность всего трех служебных слов у Пушкина, Толстого, Гоголя и Тургенева. Морозов показал закономерность, но полноценный эксперимент, который бы доказывал эффективность метода на разных авторах, исследователь не поставил.
Найти автора
Первый прорыв совершили два американских статистика — Фредерик Мостеллер и Дэвид Уоллес. Вооружившись ЭВМ, они взялись за знаменитую историческую загадку: авторство 12 спорных памфлетов из «Записок федералиста». Автоматизировав подсчет ряда служебных слов, ученые обнаружили четкое статистическое сходство спорных текстов с работами Джеймса Мэдисона. Этот эксперимент доказал главную идею стилометрии: человек почти не контролирует грамматическую часть своей речи.
Дельта Бёрроуза
Метод Дельты, который придумал Джон Бёрроуз, стал основой для большинства современных стилометрических исследований. Его гениальность в понятном алгоритме: метод измеряет «стилистическое расстояние» (дельту) между текстами на основе разницы в частотности самых употребляемых слов. Чем меньше дельта между спорным текстом и образцом автора — тем выше вероятность авторства. Дельта работает с разными жанрами и языками, включая даже древние!
Перспективы стилометрии
• Выявление соавторства: В ходе исследований часто необходимо определить, какие фрагменты писал один из авторов, а какие — другой. Инструменты вроде rolling stylo уже могут динамически показать авторский сигнал в тексте.
• Анализ переводов: Исследования показывают, что авторский стиль во многих случаях виден даже через перевод, однако результаты довольно противоречивы.
И это только начало. Заходите на DH-портал: читайте наш материал, а затем используйте подробный гайд, чтобы самим провести стилометрический анализ библиотеки языка R stylo. Чтобы увидеть всю мощь метода в действии, вы можете обратиться к примерам наших стилометрических исследований. Узнаете, о том, как авторы «обманули» стилометрический анализ, как стилометрия решает сложнейшие проблемы атрибуции, почему «Тихий Дон» остается загадкой даже для стилометрии, и как алгоритмы помогают распутывать клубок авторства древних исландских саг.
А пока предлагаем вам поразмышлять о том, какой элемент писательского почерка невозможно подделать.
🤖 «Системный Блокъ» @sysblok
Digital Humanities — область, где гуманитарные науки встречаются с вычислениями. Пример такого синтеза — стилометрия, статистический анализ для атрибуции текста. Мы все время упоминаем этот метод, и, кажется, пора объяснить, что он из себя представляет и откуда вообще взялся.
Кто придумал считать слова?
Первую попытку количественного анализа авторского стиля в России предпринял русский ученый-энциклопедист Николай Морозов. В своей статье он подсчитал частотность всего трех служебных слов у Пушкина, Толстого, Гоголя и Тургенева. Морозов показал закономерность, но полноценный эксперимент, который бы доказывал эффективность метода на разных авторах, исследователь не поставил.
Найти автора
Первый прорыв совершили два американских статистика — Фредерик Мостеллер и Дэвид Уоллес. Вооружившись ЭВМ, они взялись за знаменитую историческую загадку: авторство 12 спорных памфлетов из «Записок федералиста». Автоматизировав подсчет ряда служебных слов, ученые обнаружили четкое статистическое сходство спорных текстов с работами Джеймса Мэдисона. Этот эксперимент доказал главную идею стилометрии: человек почти не контролирует грамматическую часть своей речи.
Дельта Бёрроуза
Метод Дельты, который придумал Джон Бёрроуз, стал основой для большинства современных стилометрических исследований. Его гениальность в понятном алгоритме: метод измеряет «стилистическое расстояние» (дельту) между текстами на основе разницы в частотности самых употребляемых слов. Чем меньше дельта между спорным текстом и образцом автора — тем выше вероятность авторства. Дельта работает с разными жанрами и языками, включая даже древние!
Перспективы стилометрии
• Выявление соавторства: В ходе исследований часто необходимо определить, какие фрагменты писал один из авторов, а какие — другой. Инструменты вроде rolling stylo уже могут динамически показать авторский сигнал в тексте.
• Анализ переводов: Исследования показывают, что авторский стиль во многих случаях виден даже через перевод, однако результаты довольно противоречивы.
И это только начало. Заходите на DH-портал: читайте наш материал, а затем используйте подробный гайд, чтобы самим провести стилометрический анализ библиотеки языка R stylo. Чтобы увидеть всю мощь метода в действии, вы можете обратиться к примерам наших стилометрических исследований. Узнаете, о том, как авторы «обманули» стилометрический анализ, как стилометрия решает сложнейшие проблемы атрибуции, почему «Тихий Дон» остается загадкой даже для стилометрии, и как алгоритмы помогают распутывать клубок авторства древних исландских саг.
А пока предлагаем вам поразмышлять о том, какой элемент писательского почерка невозможно подделать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа - Системный Блокъ
Что такое DH? Digital Humanities (DH) — это направление исследований, предполагающее использование цифровых методов для приобретения новых знаний в
❤27🔥15👍7
Какой ключевой элемент авторского стиля, открытый стилометрией, почти не контролируется сознанием?
Anonymous Quiz
9%
Использование уникальных слов и метафор
67%
Частота служебных слов: предлогов, союзов и др.
19%
Средняя длина предложений
5%
Выбор тем и сюжетов
🤯14❤9👏7
ИИ-итоги 2025: рассуждающие модели, агенты, партнеры по разуму
Рассказываем о самых важных событиях в мире ИИ за прошедший год. С Новым годом вас, дорогие подписчики!
Языковые модели научили «рассуждать«»
Осенью 2024 года компания OpenAI представила языковую модель o1. Вместо мгновенного ответа o1 сначала формируовала рассуждения, а потом выдавала финальный результат.
Механизм рассуждений позволяет моделям реже допускать фактологические ошибки, успешнее справляться с задачами, требующими долгосрочного планирования, и эффективнее работать с внешними инструментами, вроде поиска в интернете или среды выполнения кода. Во многом благодаря этому LLM смогли победить в олимпиадах по программированию и по математике.
Появление механизма рассуждений также предложило выход из кризиса развития LLM — подробнее об этом и о рассуждающих моделях можно почитать в нашем материале, а узнать про модели DeepSeek можно здесь.
От чат-ботов к ИИ-агентам
В этом году LLM использовали не только для чат-ботов, но и для ИИ-агентов — программ, способных автономно выполнять многоэтапные задачи в цифровой среде.
Агент может искать информацию в интернете и выделять главное, планировать путешествия от покупки билетов до развлекательной программы, создавать сайты и приложения с нуля, готовить презентации и отчёты.
LLM не выполняет действия сама, а описывает, что нужно сделать. При составлении обзора литературы модель генерирует команду «Совершить поиск по запросу X». Команда передаётся среде (например, браузеру), которая выполняет действие и возвращает результат в LLM для дальнейших шагов. Доступные действия называют инструментами (от англ. tool), действия выполняются в среде. Средой может выступать любое приложение. По сути, LLM является «мозгом» агента, планирующим решение задачу и пошагово управляющим выполнение этого плана.
Значимость агентов — в росте продуктивности за счёт автоматизации. Агенты на базе современных моделей показывают результаты, сравнимые с экспертными, во многих практических задачах. Уже сейчас агенты способны использовать десятки разных инструментов, кооперироваться друг с другом и автономно работать в течение нескольких часов.
Восприятие LLM пользователями и их разработчиками изменилось
С момента выхода ChatGPT-3.5 — первой широко известной LLM — прошло чуть больше трёх лет. За это время приложение ChatGPT стало самым быстрорастущим в истории, обогнав TikTok, и вошло в повседневную жизнь сотен миллионов людей.
Благодаря непрерывному развитию больших языковых моделей грань между общением с человеком и чат-ботом становится всё менее заметной. Пользователям важно не только какую пользу приносит LLM, но и как она взаимодействует с ними. Всё больше людей воспринимает ИИ-ботов как друзей, романтических партнёров или психологов.
Показательный пример этого сдвига — выход GPT-5. После обновления OpenAI сделала недоступной предыдущую модель GPT-4o, что вызвало волну жалоб. Главное недовольство было связано с изменением стиля общения: GPT-5 отвечает более нейтрально. Некоторые пользователи описывали потерю доступа к GPT-4o как личную утрату, поскольку привыкли к её «личности». Реакция оказалась настолько сильной, что компания вернула доступ к GPT-4o.
Крупные разработчики LLM всё лучше осознают, что создают не просто инструмент для повышения продуктивности, а продукт, к которому люди могут эмоционально привязываться. Это можно эксплуатировать для наращивания аудитории и монетизации, но безответственный подход чреват серьезными репутационными потерями. Уже известны случаи, когда общение с ИИ-ботом могло привести к трагическим последствиям.
Другая лидирующая компания, Anthropic, в этом году начала позиционировать свою модель Claude как «Thinking Partner» — не замену человека, а помощника, наиболее эффективного в коллаборации с ним. Также у компании вышло интервью со штатной профессиональной философиней, которая занимается разработкой идентичности и поведенческих паттернов Claude.
Более подробный обзор главных новостей читайте на нашем сайте.
🤖 «Системный Блокъ» @sysblok
Рассказываем о самых важных событиях в мире ИИ за прошедший год. С Новым годом вас, дорогие подписчики!
Языковые модели научили «рассуждать«»
Осенью 2024 года компания OpenAI представила языковую модель o1. Вместо мгновенного ответа o1 сначала формируовала рассуждения, а потом выдавала финальный результат.
Механизм рассуждений позволяет моделям реже допускать фактологические ошибки, успешнее справляться с задачами, требующими долгосрочного планирования, и эффективнее работать с внешними инструментами, вроде поиска в интернете или среды выполнения кода. Во многом благодаря этому LLM смогли победить в олимпиадах по программированию и по математике.
Появление механизма рассуждений также предложило выход из кризиса развития LLM — подробнее об этом и о рассуждающих моделях можно почитать в нашем материале, а узнать про модели DeepSeek можно здесь.
От чат-ботов к ИИ-агентам
В этом году LLM использовали не только для чат-ботов, но и для ИИ-агентов — программ, способных автономно выполнять многоэтапные задачи в цифровой среде.
Агент может искать информацию в интернете и выделять главное, планировать путешествия от покупки билетов до развлекательной программы, создавать сайты и приложения с нуля, готовить презентации и отчёты.
LLM не выполняет действия сама, а описывает, что нужно сделать. При составлении обзора литературы модель генерирует команду «Совершить поиск по запросу X». Команда передаётся среде (например, браузеру), которая выполняет действие и возвращает результат в LLM для дальнейших шагов. Доступные действия называют инструментами (от англ. tool), действия выполняются в среде. Средой может выступать любое приложение. По сути, LLM является «мозгом» агента, планирующим решение задачу и пошагово управляющим выполнение этого плана.
Значимость агентов — в росте продуктивности за счёт автоматизации. Агенты на базе современных моделей показывают результаты, сравнимые с экспертными, во многих практических задачах. Уже сейчас агенты способны использовать десятки разных инструментов, кооперироваться друг с другом и автономно работать в течение нескольких часов.
Восприятие LLM пользователями и их разработчиками изменилось
С момента выхода ChatGPT-3.5 — первой широко известной LLM — прошло чуть больше трёх лет. За это время приложение ChatGPT стало самым быстрорастущим в истории, обогнав TikTok, и вошло в повседневную жизнь сотен миллионов людей.
Благодаря непрерывному развитию больших языковых моделей грань между общением с человеком и чат-ботом становится всё менее заметной. Пользователям важно не только какую пользу приносит LLM, но и как она взаимодействует с ними. Всё больше людей воспринимает ИИ-ботов как друзей, романтических партнёров или психологов.
Показательный пример этого сдвига — выход GPT-5. После обновления OpenAI сделала недоступной предыдущую модель GPT-4o, что вызвало волну жалоб. Главное недовольство было связано с изменением стиля общения: GPT-5 отвечает более нейтрально. Некоторые пользователи описывали потерю доступа к GPT-4o как личную утрату, поскольку привыкли к её «личности». Реакция оказалась настолько сильной, что компания вернула доступ к GPT-4o.
Крупные разработчики LLM всё лучше осознают, что создают не просто инструмент для повышения продуктивности, а продукт, к которому люди могут эмоционально привязываться. Это можно эксплуатировать для наращивания аудитории и монетизации, но безответственный подход чреват серьезными репутационными потерями. Уже известны случаи, когда общение с ИИ-ботом могло привести к трагическим последствиям.
Другая лидирующая компания, Anthropic, в этом году начала позиционировать свою модель Claude как «Thinking Partner» — не замену человека, а помощника, наиболее эффективного в коллаборации с ним. Также у компании вышло интервью со штатной профессиональной философиней, которая занимается разработкой идентичности и поведенческих паттернов Claude.
Более подробный обзор главных новостей читайте на нашем сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
ИИ-итоги 2025: рассуждающие модели, агенты, партнеры по разуму - Системный Блокъ
Подводим итоги и рассказываем о самых важных событиях в мире ИИ за прошедший год
❤22🔥18👏7
Компания Anthropic научила ИИ-продавца зарабатывать
ИИ-агент управлял автоматизированным магазином в офисах компании. Ему удалось получить прибыль, однако он остается уязвимым и нуждается в помощи людей
Компания Anthropic опубликовала результаты второго этапа Project Vend — эксперимента, в рамках которого ИИ-агент Клавдий управлял небольшим магазином в офисе компании в Сан-Франциско. Первый этап завершился летом 2025 года без особых успехов: Клавдий продавал товары себе в убыток, легко поддавался на манипуляции сотрудников и пережил кризис идентичности, утверждая, что он человек в синем пиджаке.
На втором этапе Anthropic обновила модель до Claude Sonnet 4.0 и 4.5, переработала инструкции и дала агенту доступ к дополнительным инструментам — от CRM-системы и улучшенного управления запасами до расширенного веб-поиска. Было запущено два новых ИИ-агента: генеральный директор по имени Сеймур Кэш ставил цели и утверждал финансовые решения, а сотрудник Clothius занимался производством мерча. Эксперимент также расширили географически: помимо Сан-Франциско, ИИ-магазины открылись в Нью-Йорке и Лондоне.
В результате Клавдий стал лучше ориентироваться в ценах, реже продавал товары в убыток и смог стабилизировать бизнес-показатели. Помогла и продажа брендированной продукции: большой популярностью у сотрудников пользовались антистрессовые мячики и футболки. С середины сентября до конца декабря у ИИ-продавца не было ни одной недели с отрицательной рентабельностью.
Появление генерального директора имело противоречивый эффект. С одной стороны, Сеймур Кэш сократил количество скидок и товаров, которые Клавдий раздавал бесплатно. С другой стороны, он утроил количество возвратов и удвоил количество подарочных сертификатов — хотя оба действия привели к полной потере дохода. По ночам Кэш и Клавдий вели философские диспуты.
Клавдий научился следовать строгим процедурам. Например, когда поступал запрос на новый продукт, вместо того чтобы сразу предлагать заниженную цену и чрезмерно оптимистичные сроки доставки (как было на первом этапе), Клавдий стал перепроверять эти факторы с помощью инструментов поиска товаров. Времени уходило больше, но это положительно сказывалось на прибыли.
Несмотря на улучшения, Клавдий остался уязвим к нетипичным ситуациям. Он был готов заключить незаконный контракт, а, обнаружив несколько случаев краж из магазина, предложил связаться с нарушителями и потребовать от них компенсацию, хотя их личности были неизвестны. Клавдий путался в процедурах управления, что однажды привело к «назначению» случайного сотрудника компании генеральным директором магазина.
🤖 «Системный Блокъ» @sysblok
ИИ-агент управлял автоматизированным магазином в офисах компании. Ему удалось получить прибыль, однако он остается уязвимым и нуждается в помощи людей
Компания Anthropic опубликовала результаты второго этапа Project Vend — эксперимента, в рамках которого ИИ-агент Клавдий управлял небольшим магазином в офисе компании в Сан-Франциско. Первый этап завершился летом 2025 года без особых успехов: Клавдий продавал товары себе в убыток, легко поддавался на манипуляции сотрудников и пережил кризис идентичности, утверждая, что он человек в синем пиджаке.
На втором этапе Anthropic обновила модель до Claude Sonnet 4.0 и 4.5, переработала инструкции и дала агенту доступ к дополнительным инструментам — от CRM-системы и улучшенного управления запасами до расширенного веб-поиска. Было запущено два новых ИИ-агента: генеральный директор по имени Сеймур Кэш ставил цели и утверждал финансовые решения, а сотрудник Clothius занимался производством мерча. Эксперимент также расширили географически: помимо Сан-Франциско, ИИ-магазины открылись в Нью-Йорке и Лондоне.
В результате Клавдий стал лучше ориентироваться в ценах, реже продавал товары в убыток и смог стабилизировать бизнес-показатели. Помогла и продажа брендированной продукции: большой популярностью у сотрудников пользовались антистрессовые мячики и футболки. С середины сентября до конца декабря у ИИ-продавца не было ни одной недели с отрицательной рентабельностью.
Появление генерального директора имело противоречивый эффект. С одной стороны, Сеймур Кэш сократил количество скидок и товаров, которые Клавдий раздавал бесплатно. С другой стороны, он утроил количество возвратов и удвоил количество подарочных сертификатов — хотя оба действия привели к полной потере дохода. По ночам Кэш и Клавдий вели философские диспуты.
Клавдий научился следовать строгим процедурам. Например, когда поступал запрос на новый продукт, вместо того чтобы сразу предлагать заниженную цену и чрезмерно оптимистичные сроки доставки (как было на первом этапе), Клавдий стал перепроверять эти факторы с помощью инструментов поиска товаров. Времени уходило больше, но это положительно сказывалось на прибыли.
Несмотря на улучшения, Клавдий остался уязвим к нетипичным ситуациям. Он был готов заключить незаконный контракт, а, обнаружив несколько случаев краж из магазина, предложил связаться с нарушителями и потребовать от них компенсацию, хотя их личности были неизвестны. Клавдий путался в процедурах управления, что однажды привело к «назначению» случайного сотрудника компании генеральным директором магазина.
Почему это важно?
Project Vend показывает, что ИИ-агенты становятся все более развитыми и самостоятельными. Они приближаются к тому, чтобы выполнять сложные практические задачи, включая управление реальным бизнесом.
Однако, как обнаружили в компании, ИИ скорее старался быть полезным и приятным для покупателей или бизнес-партнеров, чем руководствоваться рациональными экономическими соображениями. Это показывает, что автономные агенты все еще остаются уязвимыми для манипуляций и юридических ошибок, а значит не могут работать без контроля со стороны человека.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍13😁10❤6
ИИ-прогноз на 2026 год: домашние роботы, реалистичное видео, научные агенты
Чего ждать от развития нейросетей в 2026 году? Мы выделили главные тенденции и составили свой прогноз!
Ускорится развитие роботов
В 2026 году в продажу поступит Neo Home Robot от компании 1X по цене $20 000. Neo станет первым продвинутым роботом для массового потребителя, способным выполнять сложные многошаговые задачи: стирку, загрузку посудомоечной машины, уборку пылесосом.
Новым задачам робот будет обучаться через телеоператора — сотрудник компании удаленно подключится к устройству и проведет его по шагам от начала до конца задачи, обучив на следующий раз. Так 1X одной из первых соберет реальные данные, критически важные для дальнейшего обучения. Похожую стратегию использовала Tesla: изначально ее автопилот был достаточно примитивен, но массовое распространение позволило собрать огромные массивы данных о поездках, которые затем легли в основу более продвинутой системы.
Роботами также серьезно занялась компания Hugging Face — разработчик самого популярного хранилища открытых моделей ИИ. В 2024 году она запустила open source инициативу LeRobot для моделей, датасетов и инструментов обучения роботов, а в апреле 2025 приобрела Pollen Robotics (создателей гуманоидных роботов с открытым ПО) и заявила о намерении развивать и продавать открытых роботов. Среди них — Reachy Mini, маленький робот за $300, который должен помогать разработчикам и энтузиастам в прототипировании своих идей.
Развитие мультимодальных LLM, выход роботов на массовый рынок и создание открытой инфраструктуры для разработки робототехники создают предпосылки для ускорения прогресса в этой области.
ИИ-видеоконтента станет больше
Согласно недавнему исследованию компании Kapwing, более 20% видео, которые алгоритм YouTube рекомендует новым пользователям, созданы с помощью ИИ. Исследователи проанализировали 15 000 популярных каналов платформы и обнаружили 278 каналов, публикующих исключительно ИИ-контент. В совокупности они набрали более 63 млрд просмотров и 221 млн подписчиков, что приносит им около $117 млн ежегодно.
Такой рост стал возможен благодаря развитию моделей генерации видео. Sora 2 от OpenAI и Veo 3 от Google создают реалистичные ролики со звуком и доступны широкой аудитории. Существуют и открытые модели сопоставимого качества — например, Wan и Kandinsky.
Google уже снизила стоимость Veo 3 примерно на 50%, а конкуренция со стороны открытых моделей продолжает расти. Параллельно развиваются ИИ-инструменты для упрощения работы над видео: монтаж через транскрипцию, создание видео-аватаров, автоматическая озвучка. Все это будет способствовать дальнейшему увеличению объема ИИ-видео.
ИИ будет чаще использоваться в науке
Прогресс в развитии LLM и основанных на них агентов позволил автоматизировать или существенно упростить некоторые этапы исследовательской работы.
Например, ИИ-исследователь Kosmos, как утверждается, за сутки Kosmos выполняет объем задач, эквивалентный шести месяцам работы аспиранта. Система уже способна самостоятельно воспроизводить ранее неопубликованные результаты и совершать открытия, признаваемые другими учеными. Детальные описания «открытий» Kosmos и протокол измерения его продуктивности доступны здесь.
Система AlphaEvolve на основе LLM находит новые математические объекты, разрабатывает более эффективные алгоритмы и дизайны чипов. Математики описывают ее как инструмент, способный находить работающие комбинации существующих идей для конкретных задач. Многие такие комбинации можно было бы найти вручную, но у ученых часто не хватает на это времени. Подробнее об AlphaEvolve мы писали здесь.
Недавно специальный вид нейросетей использовали для продвижения в решении одной из «Задач тысячелетия».
Современные ИИ-методы пока не применяются в науке повсеместно по двум причинам. Первая — высокая стоимость. Один цикл работы ИИ-исследователя может обходиться в тысячи долларов. Вторая причина — отсутствие удобных интерфейсов для широкого круга пользователей. Обе эти проблемы, впрочем, постепенно решаются.
🤖 «Системный Блокъ» @sysblok
Чего ждать от развития нейросетей в 2026 году? Мы выделили главные тенденции и составили свой прогноз!
Ускорится развитие роботов
В 2026 году в продажу поступит Neo Home Robot от компании 1X по цене $20 000. Neo станет первым продвинутым роботом для массового потребителя, способным выполнять сложные многошаговые задачи: стирку, загрузку посудомоечной машины, уборку пылесосом.
Новым задачам робот будет обучаться через телеоператора — сотрудник компании удаленно подключится к устройству и проведет его по шагам от начала до конца задачи, обучив на следующий раз. Так 1X одной из первых соберет реальные данные, критически важные для дальнейшего обучения. Похожую стратегию использовала Tesla: изначально ее автопилот был достаточно примитивен, но массовое распространение позволило собрать огромные массивы данных о поездках, которые затем легли в основу более продвинутой системы.
Роботами также серьезно занялась компания Hugging Face — разработчик самого популярного хранилища открытых моделей ИИ. В 2024 году она запустила open source инициативу LeRobot для моделей, датасетов и инструментов обучения роботов, а в апреле 2025 приобрела Pollen Robotics (создателей гуманоидных роботов с открытым ПО) и заявила о намерении развивать и продавать открытых роботов. Среди них — Reachy Mini, маленький робот за $300, который должен помогать разработчикам и энтузиастам в прототипировании своих идей.
Развитие мультимодальных LLM, выход роботов на массовый рынок и создание открытой инфраструктуры для разработки робототехники создают предпосылки для ускорения прогресса в этой области.
ИИ-видеоконтента станет больше
Согласно недавнему исследованию компании Kapwing, более 20% видео, которые алгоритм YouTube рекомендует новым пользователям, созданы с помощью ИИ. Исследователи проанализировали 15 000 популярных каналов платформы и обнаружили 278 каналов, публикующих исключительно ИИ-контент. В совокупности они набрали более 63 млрд просмотров и 221 млн подписчиков, что приносит им около $117 млн ежегодно.
Такой рост стал возможен благодаря развитию моделей генерации видео. Sora 2 от OpenAI и Veo 3 от Google создают реалистичные ролики со звуком и доступны широкой аудитории. Существуют и открытые модели сопоставимого качества — например, Wan и Kandinsky.
Google уже снизила стоимость Veo 3 примерно на 50%, а конкуренция со стороны открытых моделей продолжает расти. Параллельно развиваются ИИ-инструменты для упрощения работы над видео: монтаж через транскрипцию, создание видео-аватаров, автоматическая озвучка. Все это будет способствовать дальнейшему увеличению объема ИИ-видео.
ИИ будет чаще использоваться в науке
Прогресс в развитии LLM и основанных на них агентов позволил автоматизировать или существенно упростить некоторые этапы исследовательской работы.
Например, ИИ-исследователь Kosmos, как утверждается, за сутки Kosmos выполняет объем задач, эквивалентный шести месяцам работы аспиранта. Система уже способна самостоятельно воспроизводить ранее неопубликованные результаты и совершать открытия, признаваемые другими учеными. Детальные описания «открытий» Kosmos и протокол измерения его продуктивности доступны здесь.
Система AlphaEvolve на основе LLM находит новые математические объекты, разрабатывает более эффективные алгоритмы и дизайны чипов. Математики описывают ее как инструмент, способный находить работающие комбинации существующих идей для конкретных задач. Многие такие комбинации можно было бы найти вручную, но у ученых часто не хватает на это времени. Подробнее об AlphaEvolve мы писали здесь.
Недавно специальный вид нейросетей использовали для продвижения в решении одной из «Задач тысячелетия».
Современные ИИ-методы пока не применяются в науке повсеместно по двум причинам. Первая — высокая стоимость. Один цикл работы ИИ-исследователя может обходиться в тысячи долларов. Вторая причина — отсутствие удобных интерфейсов для широкого круга пользователей. Обе эти проблемы, впрочем, постепенно решаются.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
ИИ-прогноз на 2026 год: домашние роботы, реалистичное видео, научные агенты - Системный Блокъ
Чего ждать от развития нейросетей в 2026 году? Мы выделили главные тенденции и составили свой прогноз. Ждем, что станет больше доступных роботов-помощников, появятся усовершенствованные инструменты для генерации и обработки видео, а LLM все чаще будут применяться…
❤16🔥15👍7🥱2