Grok-2 выложили в открытый доступ
Лаборатория xAI Илона Маска выложила в открытый доступ веса и код LLM Grok-2.5, выпущенной в прошлом году.
Grok-2.5 построен на архитектуре Mixture-of-Experts: во время генерации, в зависимости от запроса пользователя, используется лишь часть параметров. Всего в модели 270 млрд параметров, из которых активны 62 млрд. Для сравнения, у сопоставимой по размеру open-source модели Qwen3 при работе задействуется почти втрое меньше параметров, что сильно сокращает время отклика.
По качеству Grok-2.5 сопоставима с флагманскими моделями прошлого года. Модель доступна для коммерческого использования, однако её нельзя применять для улучшения других языковых моделей — например, нельзя обучать на данных, сгенерированных Grok-2.5.
2/3
🤖 «Системный Блокъ» @sysblok
Лаборатория xAI Илона Маска выложила в открытый доступ веса и код LLM Grok-2.5, выпущенной в прошлом году.
Grok-2.5 построен на архитектуре Mixture-of-Experts: во время генерации, в зависимости от запроса пользователя, используется лишь часть параметров. Всего в модели 270 млрд параметров, из которых активны 62 млрд. Для сравнения, у сопоставимой по размеру open-source модели Qwen3 при работе задействуется почти втрое меньше параметров, что сильно сокращает время отклика.
По качеству Grok-2.5 сопоставима с флагманскими моделями прошлого года. Модель доступна для коммерческого использования, однако её нельзя применять для улучшения других языковых моделей — например, нельзя обучать на данных, сгенерированных Grok-2.5.
Почему это важно?
Grok-2.5 не является лидирующей LLM с открытыми весами по соотношению размер/качество, однако сам факт публикации в открытый доступ флагманской (хотя и не самой новой) модели от одной из самых больших ИИ-лабораторий примечателен. Для сравнения: OpenAI так и не выложила веса GPT-3, вышедшей в 2021 году, несмотря на большое количество запросов со стороны сообщества. Маск также пообещал выложить Grok-3 в открытый доступ через 6 месяцев.
2/3
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👏5🥰4❤1👍1
Genie 3 генерирует интерактивные миры
Лаборатория Google DeepMind представила третье поколение модели Genie. Это семейство относится к так называемым «моделям мира» (world models) — системам, которые симулируют физику реального или игрового пространства.
Genie 3 по текстовому описанию создаёт виртуальную сцену, в которой можно свободно перемещаться в реальном времени (24 кадра в секунду, разрешение 720p) с помощью клавиатуры. Сцена сохраняет целостность несколько минут благодаря «визуальной памяти» модели примерно на минуту: например, если пользователь окрасит часть стены, уйдёт, а затем вернётся, стена останется окрашенной.
Помимо обычного управления доступны «события по запросу» (promptable world events). Во время сессии можно менять мир командами вроде «сделай дождь», «добавь лодку на озеро» или «сделай ночь» — при этом изменения происходят без перезапуска сцены.
Genie 3 способна порождать самые разные окружения и физические явления: физику жидкости, света, природные локации (лес, озеро, волны), городские сцены и стилизованные игровые миры.
Предыдущие версии были менее стабильны во времени, поддерживали только короткие симуляции (до 20 секунд) и имели ограниченную интерактивность.
3/3
🤖 «Системный Блокъ» @sysblok
Лаборатория Google DeepMind представила третье поколение модели Genie. Это семейство относится к так называемым «моделям мира» (world models) — системам, которые симулируют физику реального или игрового пространства.
Genie 3 по текстовому описанию создаёт виртуальную сцену, в которой можно свободно перемещаться в реальном времени (24 кадра в секунду, разрешение 720p) с помощью клавиатуры. Сцена сохраняет целостность несколько минут благодаря «визуальной памяти» модели примерно на минуту: например, если пользователь окрасит часть стены, уйдёт, а затем вернётся, стена останется окрашенной.
Помимо обычного управления доступны «события по запросу» (promptable world events). Во время сессии можно менять мир командами вроде «сделай дождь», «добавь лодку на озеро» или «сделай ночь» — при этом изменения происходят без перезапуска сцены.
Genie 3 способна порождать самые разные окружения и физические явления: физику жидкости, света, природные локации (лес, озеро, волны), городские сцены и стилизованные игровые миры.
Предыдущие версии были менее стабильны во времени, поддерживали только короткие симуляции (до 20 секунд) и имели ограниченную интерактивность.
Почему это важно?
У «моделей мира» множество применений:
1. Генерация обучающих данных для роботов и автономных систем. Например, можно создать сотни часов симуляций приготовления еды и использовать их для обучения робота, или сгенерировать редкие дорожные ситуации для тренировки беспилотных автомобилей.
2. Использование в связке с языковыми моделями, которым сложно рассуждать о физике. LLM может преобразовать вопрос пользователя в запрос к модели мира, получить симуляцию и извлечь из неё ответ.
Замена сложных физических расчётов. Иногда точное вычисление по формулам слишком трудоёмко, а достаточно точная симуляция позволяет получить результат быстрее и дешевле.
3/3
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🥰5👏4👍1
Как ИИ помогает учителям: 3 рабочих способа сэкономить время
1 сентября — день, когда нагрузка учителей снова взлетает на максимум. А могут ли облегчить их жизнь современные языковые модели? В рамках нового спецпроекта «ИИ-лайфхаки для вашей профессии» педагоги делятся реальными кейсами использования нейросетей в работе. Мы собрали более 10 задач с готовыми промптами, которые могут облегчить работу учителя: от составления опросников до создания заданий… для развития эмоционального интеллекта школьников!
1. Объясняем сложные темы просто
Если ученикам сложно даются фразеологизмы, ИИ поможет создать понятные объяснения с конкретными примерами.
2. Превращаем профориентацию в увлекательную игру
Когда традиционные методы профориентации не вызывают интереса у подростков, искусственный интеллект помогает создать нестандартные форматы занятий.
3. Литературный детектив: классик vs нейросеть
Ученикам дают два отрывка: отрывок из классического произведения и версию, дописанную нейросетью. Задача — найти подделку.
Нейросети часто выдают себя многословными описаниями и избыточными конструкциями. Сравнивая авторские тексты с вариантами нейросети, школьники учатся распознавать языковые шаблоны и замечать логические нестыковки.
Познакомьтесь со страницей «ИИ для учителей» и проверьте себя: сможете ли вы отличить авторский текст от сгенерированного?
🤖 «Системный Блокъ» @sysblok
1 сентября — день, когда нагрузка учителей снова взлетает на максимум. А могут ли облегчить их жизнь современные языковые модели? В рамках нового спецпроекта «ИИ-лайфхаки для вашей профессии» педагоги делятся реальными кейсами использования нейросетей в работе. Мы собрали более 10 задач с готовыми промптами, которые могут облегчить работу учителя: от составления опросников до создания заданий… для развития эмоционального интеллекта школьников!
1. Объясняем сложные темы просто
Если ученикам сложно даются фразеологизмы, ИИ поможет создать понятные объяснения с конкретными примерами.
Промпт: Представь, что ты учитель русского языка и ты составляешь упражнение, чтобы объяснить шестиклассникам значение фразеологизма ПРОВАЛИТЬСЯ СКВОЗЬ ЗЕМЛЮ. Чтобы дети поняли особенности употребления фразеологизма, составь текст из 3-5 предложений, который бы демонстрировал ситуацию, описывающую этот фразеологизм. Включи в одно и то же предложение синоним к фразеологизму и сам фразеологизм.
2. Превращаем профориентацию в увлекательную игру
Когда традиционные методы профориентации не вызывают интереса у подростков, искусственный интеллект помогает создать нестандартные форматы занятий.
Промпт: Представь, что ты методист, которому нужно подготовить 2-часовое занятие по профориентации для подростков 12-15 лет. Тема: «странные и редкие профессии». Придумай план этого занятия.
3. Литературный детектив: классик vs нейросеть
Ученикам дают два отрывка: отрывок из классического произведения и версию, дописанную нейросетью. Задача — найти подделку.
Нейросети часто выдают себя многословными описаниями и избыточными конструкциями. Сравнивая авторские тексты с вариантами нейросети, школьники учатся распознавать языковые шаблоны и замечать логические нестыковки.
Познакомьтесь со страницей «ИИ для учителей» и проверьте себя: сможете ли вы отличить авторский текст от сгенерированного?
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как использовать ИИ для работы — гид по нейросетям
ИИ-лайфхаки для вашей работы: узнайте, как применять искусственный интеллект для работы, исследований и автоматизации рутинных задач.
🔥23❤12❤🔥10👍3🤡1
«90% мировой культуры строится на воспроизведении паттернов»: интервью с Игорем Пильщиковым
Игорь Пильщиков — сооснователь Русской виртуальной библиотеки (rvb.ru), ФЭБ «Русская литература и фольклор» (feb-web.ru) и системы СПСЛ (cpcl.info), профессор славистики в Калифорнийском университете в Лос-Анджелесе, доктор филологических наук. «Системный Блокъ» поговорил с ним о моделировании в литературоведении, масштабировании исследований с помощью компьютера, сложностях с поэтическим метром у больших языковых моделей, проблемах переноса биологических терминов в филологию и о том, как Шекспир справлялся с дедлайнами и недостатком трезвых актеров.
Подсчеты в литературоведении
Прежде чем мы начинаем что-то считать в текстах, нужно понять, что именно мы подсчитываем и какие единицы измерения используем. Поэтому надо убедиться, что в процессе разметки текстов мы определили все важные для нашего исследования признаки и придумали, как их подсчитывать. В этом плане филология скорее похожа на биологию, а не на идеально точную математическую науку.
Что не так с этой аналогией
Увы, в вопросах точности литературоведение все-таки уступает естественным наукам. В биологии мы разделяем живые существа на роды, виды и особи. А особь разделяем уже на разные ее члены. А что у нас есть в литературе? Вроде бы у нас есть роды, которые разделяются на жанры, которые представлены произведениями, а в произведении есть какие-то части… но на самом деле мы не всегда можем дать жанру (да и поджанру) четкое определение, так что сложности начинаются уже на этом этапе. А если мы подключим к анализу текста языковую модель, она столкнется с несколькими неочевидными препятствиями.
Чему пока не научились LLM
ChatGPT и почему-то совершенно не умеет писать метрическую поэзию. Он никак не способен ни на каком количестве текстов усмотреть, что такое метр и рифмовка. Нейросеть Claude 3.5 Sonnet тоже с трудом справилась с онегинской строфой и тут же забыла принцип её построения.
С художественными текстами могут возникнуть и другие сложности, связанные, например, с оригинальностью текста.
О природе текста и других особенностях искусственного и естественного интеллектов, а также о специфике применения нейросетей в разных науках, читайте в полной версии интервью.
🤖 «Системный Блокъ» @sysblok
Игорь Пильщиков — сооснователь Русской виртуальной библиотеки (rvb.ru), ФЭБ «Русская литература и фольклор» (feb-web.ru) и системы СПСЛ (cpcl.info), профессор славистики в Калифорнийском университете в Лос-Анджелесе, доктор филологических наук. «Системный Блокъ» поговорил с ним о моделировании в литературоведении, масштабировании исследований с помощью компьютера, сложностях с поэтическим метром у больших языковых моделей, проблемах переноса биологических терминов в филологию и о том, как Шекспир справлялся с дедлайнами и недостатком трезвых актеров.
Подсчеты в литературоведении
Прежде чем мы начинаем что-то считать в текстах, нужно понять, что именно мы подсчитываем и какие единицы измерения используем. Поэтому надо убедиться, что в процессе разметки текстов мы определили все важные для нашего исследования признаки и придумали, как их подсчитывать. В этом плане филология скорее похожа на биологию, а не на идеально точную математическую науку.
Что не так с этой аналогией
Увы, в вопросах точности литературоведение все-таки уступает естественным наукам. В биологии мы разделяем живые существа на роды, виды и особи. А особь разделяем уже на разные ее члены. А что у нас есть в литературе? Вроде бы у нас есть роды, которые разделяются на жанры, которые представлены произведениями, а в произведении есть какие-то части… но на самом деле мы не всегда можем дать жанру (да и поджанру) четкое определение, так что сложности начинаются уже на этом этапе. А если мы подключим к анализу текста языковую модель, она столкнется с несколькими неочевидными препятствиями.
Чему пока не научились LLM
ChatGPT и почему-то совершенно не умеет писать метрическую поэзию. Он никак не способен ни на каком количестве текстов усмотреть, что такое метр и рифмовка. Нейросеть Claude 3.5 Sonnet тоже с трудом справилась с онегинской строфой и тут же забыла принцип её построения.
С художественными текстами могут возникнуть и другие сложности, связанные, например, с оригинальностью текста.
Стоит автору написать с помощью ИИ фрагменты собственного романа, поднимается скандал. Не говоря уж о целом романе.
Что же получается? Если коротенький стишок, составленный с помощью искусственного интеллекта, приписать себе нельзя, а огромный перевод можно, то проблема не в природе текста, а в нашей интерпретации этой природы.
О природе текста и других особенностях искусственного и естественного интеллектов, а также о специфике применения нейросетей в разных науках, читайте в полной версии интервью.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
«90% мировой культуры строится на воспроизведении паттернов»: интервью с Игорем Пильщиковым - Системный Блокъ
Почему количественные методы в литературоведении не отменяют интуицию, а лишь дополняют ее? Так ли далека работа с искусственным интеллектом от деятельности ремесленной мастерской? Какова роль неоднозначности языка в филологических исследованиях и в коммуникации…
👍27❤17🔥11🤔3
Anthropic заплатит правообладателям книг, лучший генератор изображений от Google и полностью открытая LLM из Швейцарии
Рассказываем, что произошло в мире ИИ за последнее время.
Anthropic заплатит за нарушение авторских прав
Anthropic, одна из ведущих ИИ компаний, согласилась выплатить 1,5 млрд долларов правообладателям книг по коллективному иску авторов.
Компания использовала около 500 000 книг с пиратских ресурсов для обучения языковых моделей Claude. В пересчете это около 3000 долларов за каждое произведение. По словам адвоката истцов, сумма может стать крупнейшей в истории дел, связанных с нарушением авторских прав. Правда, финального решения от судьи ещё нет.
Google выпустила лучший генератор изображений
Google сделала общедоступной модель для генерации и редактирования изображений Gemini 2.5 Flash Image. По оценкам пользователей платформы LMArena, она признана лучшей среди аналогов.
Модель умеет, например, стилизовать изображения, генерировать их по эскизам и строить изометрические проекции объектов с фотографий.
Главное улучшение — точность редактирования. Еще одна новая возможность — работа с несколькими входными изображениями. Можно, например, загрузить фото пустого интерьера и снимки мебели, и попросить модель «обставить» комнату.
Gemini 2.5 Flash Image доступна для всех через Google AI Studio.
Швейцария представила полностью открытую LLM
В рамках Swiss AI Initiative исследователи из разных научных учреждений Швейцарии разработали языковую модель Apetus. Вместе с ней опубликован подробный технический отчет о сборе обучающих данных, процессе обучения и тестирования, хотя обычно в открытом доступе появляются лишь сами веса модели и краткие описания.
Apetus выпущена в двух вариантах — на 8 и 70 млрд параметров. Ее ключевая особенность — поддержка 1811 языков, что делает модель особенно полезной для задач машинного перевода, включая малоресурсные языки. На основных тестах по английскому и другим распространенным языкам Apetus демонстрирует результаты, сопоставимые с аналогичными моделями такого же масштаба. Веса модели и отчет доступны здесь.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время.
Anthropic заплатит за нарушение авторских прав
Anthropic, одна из ведущих ИИ компаний, согласилась выплатить 1,5 млрд долларов правообладателям книг по коллективному иску авторов.
Компания использовала около 500 000 книг с пиратских ресурсов для обучения языковых моделей Claude. В пересчете это около 3000 долларов за каждое произведение. По словам адвоката истцов, сумма может стать крупнейшей в истории дел, связанных с нарушением авторских прав. Правда, финального решения от судьи ещё нет.
Почему это важно?
Для обучения конкурентоспособных ИИ-моделей нужно много чистых данных. При этом четких правовых рамок, регулирующих использование книг (и других охраняемых материалов) в обучении нейросетей, пока нет.
Когда правообладатели требовали полного запрета на применение книг при обучении LLM, американский суд признал это использование подпадающим под доктрину fair use. Но это не отменяет необходимости компенсации авторам, как мы объяснили здесь.
Этот прецедент может стать важным шагом в формировании правил использования контента для развития ИИ.
Google выпустила лучший генератор изображений
Google сделала общедоступной модель для генерации и редактирования изображений Gemini 2.5 Flash Image. По оценкам пользователей платформы LMArena, она признана лучшей среди аналогов.
Модель умеет, например, стилизовать изображения, генерировать их по эскизам и строить изометрические проекции объектов с фотографий.
Главное улучшение — точность редактирования. Еще одна новая возможность — работа с несколькими входными изображениями. Можно, например, загрузить фото пустого интерьера и снимки мебели, и попросить модель «обставить» комнату.
Gemini 2.5 Flash Image доступна для всех через Google AI Studio.
Почему это важно?
Технологии генерации и редактирования изображений с помощью ИИ стремительно развиваются и становятся более распространенными. Это меняет то, как мы воспринимаем визуальный контент и взаимодействуем с ним.
Крупные игроки рынка уже интегрируют такие инструменты в свои продукты: Adobe внедрила ИИ-редактирование в Photoshop и видеоредакторы, а производители смартфонов используют нейросети для улучшения качества снимков. Так, Google применяет нейросети для реализации 100-кратного зума в смартфонах Pixel — фактически это уже не фотография, а сгенерированное изображение.
Швейцария представила полностью открытую LLM
В рамках Swiss AI Initiative исследователи из разных научных учреждений Швейцарии разработали языковую модель Apetus. Вместе с ней опубликован подробный технический отчет о сборе обучающих данных, процессе обучения и тестирования, хотя обычно в открытом доступе появляются лишь сами веса модели и краткие описания.
Apetus выпущена в двух вариантах — на 8 и 70 млрд параметров. Ее ключевая особенность — поддержка 1811 языков, что делает модель особенно полезной для задач машинного перевода, включая малоресурсные языки. На основных тестах по английскому и другим распространенным языкам Apetus демонстрирует результаты, сопоставимые с аналогичными моделями такого же масштаба. Веса модели и отчет доступны здесь.
Почему это важно?
Создание LLM требует колоссальных инвестиций, поэтому их разработкой в основном занимаются частные компании, ориентированные на коммерческую выгоду. В результате академическое сообщество оказывается в стороне от передовых технологий.
Швейцария выделила для ИИ исследований 10 млн часов вычислений на суперкомпьютере Alps. Это позволило выпустить полностью открытую языковую модель. Такие инициативы расширяют доступ исследователей к передовым инструментам ИИ и снижают зависимость науки от корпоративных интересов. Помимо Швейцарии, крупные государственные инвестиции в ИИ сегодня делают США, Китай и Франция.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21❤19👍9😁1🤔1
Как писать промпты: инструкция для учителей
Большие языковые модели решают математические олимпиады на уровне чемпионов мира, предсказывают новые химические соединения, пишут код, расшифровывают рукописи, составляют отчеты и выполняют еще множество дел, которые раньше можно было поручить только человеку. А чем они могут помочь учителю? В нашем спецпроекте «ИИ-лайфхаки для вашей профессии» делимся рекомендациями по составлению промптов и определяем «рецепт» идеального запроса.
В хорошем промпте должны быть…
1. Роль, которую берет на себя ИИ (учитель начальных классов, методист и пр.);
2. Цель и задачи урока;
3. Возраст и особенности учеников в классе (наличие или отсутствие читательской грамотности, билингвальность, СДВГ и пр.);
4. Образовательные результаты через конкретные глаголы-инфинитивы и числа (например, «уметь перечислять не менее 6 профессий и не менее 3-х особенностей каждой из них»);
5. Желаемые форматы материалов: видео, картинки, таблицы.
И это — только половина тех формулировок, которые сделают ваш промпт качественнее, а результат выдачи нейросети — точнее. На странице спецпроекта «ИИ для учителей» вы найдете другие советы и лайфхаки. А в статьях «Первые шаги с DeepSeek» и «Знакомство с ChatGPT» мы рассказываем все, что нужно знать о том, как пользоваться двумя самыми популярными нейросетями.
🤖 «Системный Блокъ» @sysblok
Большие языковые модели решают математические олимпиады на уровне чемпионов мира, предсказывают новые химические соединения, пишут код, расшифровывают рукописи, составляют отчеты и выполняют еще множество дел, которые раньше можно было поручить только человеку. А чем они могут помочь учителю? В нашем спецпроекте «ИИ-лайфхаки для вашей профессии» делимся рекомендациями по составлению промптов и определяем «рецепт» идеального запроса.
Плохой промпт
Промпт: Придумай урок по профориентации для школьников.
Почему промпт не даст желаемого результата? В нем совершенно нет конкретики, и нейросеть выдаст вам шаблонный ответ.
Хороший промпт
Промпт: Ты — методист, которому нужно подготовить 2-часовое занятие по профориентации для подростков 12-15 лет. Тема: «Необычные и редкие профессии». Типы материалов: минимум текста, максимум схем, визуализации, картинок. На основе предоставленного материала есть несколько задач:
1. Определить черты профессий, о которых рассказывается в видео.
2. Определить ее перспективы и востребованность в других странах.
3. Каждый презентует по одной профессии.
Для составления заданий надо учесть, что у детей слабая читательская грамотность и занятия по профориентации их в целом не увлекают.
В хорошем промпте должны быть…
1. Роль, которую берет на себя ИИ (учитель начальных классов, методист и пр.);
2. Цель и задачи урока;
3. Возраст и особенности учеников в классе (наличие или отсутствие читательской грамотности, билингвальность, СДВГ и пр.);
4. Образовательные результаты через конкретные глаголы-инфинитивы и числа (например, «уметь перечислять не менее 6 профессий и не менее 3-х особенностей каждой из них»);
5. Желаемые форматы материалов: видео, картинки, таблицы.
И это — только половина тех формулировок, которые сделают ваш промпт качественнее, а результат выдачи нейросети — точнее. На странице спецпроекта «ИИ для учителей» вы найдете другие советы и лайфхаки. А в статьях «Первые шаги с DeepSeek» и «Знакомство с ChatGPT» мы рассказываем все, что нужно знать о том, как пользоваться двумя самыми популярными нейросетями.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как использовать ИИ для работы — гид по нейросетям
ИИ-лайфхаки для вашей работы: узнайте, как применять искусственный интеллект для работы, исследований и автоматизации рутинных задач.
❤🔥32🔥17👍15❤4😢1
Кино вне политики? Кто участвует в российских кинофестивалях
Рассказываем про спецпроект «Системного Блока», в котором мы изучили, как изменилась география участников российских кинофестивалей после 2022 года — и обнаружили много неожиданного. Данные, инсайды, комментарии экспертов — рассказываем, что на самом деле происходит на международных смотрах в России.
Какие фестивали мы исследовали?
Согласно данным министерства культуры РФ, в 2024 году в РФ насчитывалось 110 фестивалей, имеющих статус международных (перечень международных кинофестивалей формируется самим министерством). Правда, на деле многие из них скорее нишевые и локальные.
Поэтому для исследования мы выбрали пять: ММКФ (Московский Междунраодный кинофестиваль), «Зеркало» и три смотра, концентрирующихся на документальном кино, — «Докер», «Послание к человеку» и «Флаэртиана».
Что мы выяснили?
У всех пяти фестивалей государственное финансирование, так что в глазах зарубежных стран они в большей или меньшей степени могут ассоциироваться с действиями России на мировой арене. Однако большинство стран сохранили свое присутствие на фестивалях.
В среднем на пяти кинофестивалях ежегодно участвуют работы из 37 стран мира, помимо России. Германия в 2018–2024 гг. представила 47 фильмов (из них 16 за 2022-2024 гг.), Франция — 40 (21), Китай — 22 (14).
Получается, ничего не изменилось?
Это не совсем так. Сильнее всех пострадал ММКФ – 17 стран, включая США и Италию, отказались возвращаться на фестиваль с 2022 года. От участия во всех пяти фестивалях отказались Польша, Чехия и Латвия. При этом фильмы из Китая, Италии, Сербии и Аргентины за последние три года стали более заметными участниками российских фестивалей.
Узнать о ситуации с фестивалями подробнее можно, изучив наши инфографики, а также страницу спецпроекта, на которой можно найти не только результаты исследования, но и комментарии экспертов – Михаила Ратгауза, кинокритика и программного директора «Послания к человеку», и Сергея Сычева, кинокритика и кандидата филологических наук.
🤖 «Системный Блокъ» @sysblok
Рассказываем про спецпроект «Системного Блока», в котором мы изучили, как изменилась география участников российских кинофестивалей после 2022 года — и обнаружили много неожиданного. Данные, инсайды, комментарии экспертов — рассказываем, что на самом деле происходит на международных смотрах в России.
Какие фестивали мы исследовали?
Согласно данным министерства культуры РФ, в 2024 году в РФ насчитывалось 110 фестивалей, имеющих статус международных (перечень международных кинофестивалей формируется самим министерством). Правда, на деле многие из них скорее нишевые и локальные.
Поэтому для исследования мы выбрали пять: ММКФ (Московский Междунраодный кинофестиваль), «Зеркало» и три смотра, концентрирующихся на документальном кино, — «Докер», «Послание к человеку» и «Флаэртиана».
Что мы выяснили?
У всех пяти фестивалей государственное финансирование, так что в глазах зарубежных стран они в большей или меньшей степени могут ассоциироваться с действиями России на мировой арене. Однако большинство стран сохранили свое присутствие на фестивалях.
В среднем на пяти кинофестивалях ежегодно участвуют работы из 37 стран мира, помимо России. Германия в 2018–2024 гг. представила 47 фильмов (из них 16 за 2022-2024 гг.), Франция — 40 (21), Китай — 22 (14).
Получается, ничего не изменилось?
Это не совсем так. Сильнее всех пострадал ММКФ – 17 стран, включая США и Италию, отказались возвращаться на фестиваль с 2022 года. От участия во всех пяти фестивалях отказались Польша, Чехия и Латвия. При этом фильмы из Китая, Италии, Сербии и Аргентины за последние три года стали более заметными участниками российских фестивалей.
Узнать о ситуации с фестивалями подробнее можно, изучив наши инфографики, а также страницу спецпроекта, на которой можно найти не только результаты исследования, но и комментарии экспертов – Михаила Ратгауза, кинокритика и программного директора «Послания к человеку», и Сергея Сычева, кинокритика и кандидата филологических наук.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤36❤🔥10🔥7🤬1
Зачем учить нейросеть рассуждать?
Заметили, как ChatGPT теперь часто подолгу «думает» перед ответом? Это происходит потому, что теперь в его последнюю версию по умолчанию встроена рассуждающая модель, которой отправляются все сложные запросы. Рассуждающие модели — ответ на замедление прогресса LLM с 2023 по 2025. Сегодня ведущие LLM показывают в тестах очень близкие результаты, а разница между последними поколениями ощущается все меньше и меньше. Один из вариантов решения этой проблемы – научить модель «рассуждать». Ведь если попросить LLM в запросе «думать по шагам», это значительно повысит качество ответов. Рассказываем, как LLM обучают таким размышлениям.
Почему развитие замедлилось?
Практически все современные LLM основаны на архитектуре Transformer. Одно из её главных преимуществ — масштабируемость: если увеличить модель и данные, улучшится качество ответов. Правда, с определенного момента с ростом размера и данных начинает падать темп улучшения и наступает эффект diminishing returns (исчезающей выгоды). Другими словами, дальнейшее масштабирование модели Transformer становится скорее убыточным, поскольку затраты на вычисления не дают сопоставимого улучшения качества.
Что с этим делать?
Рассуждение — нетривиальный и долгий процесс, но он может стать вариантом решения этой проблемы. Собирать качественные рассуждения вручную (особенно в большом объеме) и автоматизировать этот процесс не так уж просто, поэтому в основном используют два метода. Первый — с помощью обучения на ответах модели, собранных благодаря Chain-of-Thought промтингу (о нем мы уже рассказывали здесь), второй — через обучение с подкреплением (вот тут о нем можно узнать подробнее). Второй способ сложнее, но именно он используется практически всеми разработчиками рассуждающих моделей.
Уже есть первые результаты?
Первую успешную рассуждающую модель выпустила компания OpenAI, она получила название o1. О деталях ее создания известно мало, и мы не знаем, как именно ее обучали рассуждать. Зато через несколько месяцев компания Deepseek смогла создать большую рассуждающую языковую модель DeepSeek R1 и выложила в открытый доступ как саму модель, так и статью, детально описывающую масштабируемый способ обучения рассуждению. Это позволило open-source разработчикам создавать свои собственные рассуждающие модели.
Больше о самих рассуждающих моделях, методах обучения, проблемах и перспективах развития, узнаете из полной версии нашего материала.
Время чтения: 14 минут
🤖 «Системный Блокъ» @sysblok
Заметили, как ChatGPT теперь часто подолгу «думает» перед ответом? Это происходит потому, что теперь в его последнюю версию по умолчанию встроена рассуждающая модель, которой отправляются все сложные запросы. Рассуждающие модели — ответ на замедление прогресса LLM с 2023 по 2025. Сегодня ведущие LLM показывают в тестах очень близкие результаты, а разница между последними поколениями ощущается все меньше и меньше. Один из вариантов решения этой проблемы – научить модель «рассуждать». Ведь если попросить LLM в запросе «думать по шагам», это значительно повысит качество ответов. Рассказываем, как LLM обучают таким размышлениям.
Почему развитие замедлилось?
Практически все современные LLM основаны на архитектуре Transformer. Одно из её главных преимуществ — масштабируемость: если увеличить модель и данные, улучшится качество ответов. Правда, с определенного момента с ростом размера и данных начинает падать темп улучшения и наступает эффект diminishing returns (исчезающей выгоды). Другими словами, дальнейшее масштабирование модели Transformer становится скорее убыточным, поскольку затраты на вычисления не дают сопоставимого улучшения качества.
Что с этим делать?
Рассуждение — нетривиальный и долгий процесс, но он может стать вариантом решения этой проблемы. Собирать качественные рассуждения вручную (особенно в большом объеме) и автоматизировать этот процесс не так уж просто, поэтому в основном используют два метода. Первый — с помощью обучения на ответах модели, собранных благодаря Chain-of-Thought промтингу (о нем мы уже рассказывали здесь), второй — через обучение с подкреплением (вот тут о нем можно узнать подробнее). Второй способ сложнее, но именно он используется практически всеми разработчиками рассуждающих моделей.
Уже есть первые результаты?
Первую успешную рассуждающую модель выпустила компания OpenAI, она получила название o1. О деталях ее создания известно мало, и мы не знаем, как именно ее обучали рассуждать. Зато через несколько месяцев компания Deepseek смогла создать большую рассуждающую языковую модель DeepSeek R1 и выложила в открытый доступ как саму модель, так и статью, детально описывающую масштабируемый способ обучения рассуждению. Это позволило open-source разработчикам создавать свои собственные рассуждающие модели.
Больше о самих рассуждающих моделях, методах обучения, проблемах и перспективах развития, узнаете из полной версии нашего материала.
Время чтения: 14 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Что такое рассуждающие языковые модели и как они работают
Объясняем, что такое рассуждающие LLM и как они преодолевают кризис масштабирования больших языковых моделей. А также рассказываем, как устроены методы обучения таких LLM.
🔥29❤20👍7
Код Средневековья: пять статей о цифровых методах в медиевистике
Сложно назвать историческую эпоху, о которой существует столько же стереотипов и заблуждений, как о Средневековье. Медиевисты делают все возможное, чтобы развенчать мифы о невежестве и антисанитарии и сделать наше представление об этом периоде более адекватным. «Системный Блокъ» собрал несколько материалов о том, как им в этом помогают цифровые методы.
👨🏻🎓 Вспоминайте иногда вашего студента: изучаем базу данных средневековых университетов
Начало учебного года — хороший повод узнать, как и чем жило средневековое и раннемодерное академическое сообщество. Рассказываем о совместном проекте немецких и швейцарских исследователей — базе данных Repertorium Academicum Germanicum (RAG), где собрана информация о студентах, выпускниках и обладателях ученых степеней на территории Священной Римской империи в XIII-XVI веках. Вы узнаете:
• зачем в средневековых университетах все записывали?
• как в это время обстояло дело с академической мобильностью?
• как восстановить в деталях карьеру отдельно взятого ученого?
🕵️ Стилометрия и древнескандинавская литература: определение авторства исландских саг
В этой статье разбираемся, как специалисты по древнескандинавской литературе применяют дельту Бёрроуза, чтобы разрешить спор об авторстве «Саги об Эгиле». Читайте:
• на какие группы по хронологии делятся исландские саги?
• чем можно объяснить стилистическое сходство между некоторыми сагами?
• какие эксперименты нужно провести с дельтой и исследуемыми текстами, чтобы снять все сомнения о личности автора?
👑 Что статистические отношения в лексике могут рассказать про средневековую власть?
Стилометрия и компьютерный анализ текстов хороши не только для определения авторства — еще они могут помочь с исследованием типов власти в средневековом обществе. В статье рассказываем о работе медиевистки Евгении Шелиной и о том, что скрывают корпуса французских грамот XIII века. Вы узнаете:
• что такое семантическое поле власти?
• чем власть духовенства отличается от власти светской аристократии и как это отражается в текстах?
• что интересного удалось узнать о фигуре французского короля?
🗺️ Скифия, Египет, Вавилон: как цифровые методы помогают в изучении средневековых карт
По сравнению с современными картографическими сервисами старинные средневековые карты выглядят загадочно и непонятно. В нашем материале читайте, как специальный пакет Veccompare для языка R помогает исследовать представления средневековых людей о мире вокруг. Вместе разбираемся:
• как узнать, что два картографа брали информацию из общего источника?
• почему некоторые топонимы на картах могут быть абсолютно уникальными?
• что получится, если сравнить карту с текстовым описанием той же территории?
📜 От разобщенности к войне: что показывает сетевой анализ византийских писем
Что письма могут рассказать ученым о политических связях византийцев? Можно ли по переписке отследить момент, за которым последовал государственный кризис? Рассказываем, как сетевой анализ и теория графов помогают изучать эпоху гражданских войн в Византии. В материале читайте:
• всегда ли представители византийской элиты, объединенные узами родства, имели одинаковые политические взгляды?
• как тесная связь человека с императором сказывалась на других его социальных взаимодействиях?
• как приход к власти Андроника III повлиял на динамику отношений между высокопоставленными византийскими чиновниками?
🤖 «Системный Блокъ» @sysblok
Сложно назвать историческую эпоху, о которой существует столько же стереотипов и заблуждений, как о Средневековье. Медиевисты делают все возможное, чтобы развенчать мифы о невежестве и антисанитарии и сделать наше представление об этом периоде более адекватным. «Системный Блокъ» собрал несколько материалов о том, как им в этом помогают цифровые методы.
👨🏻🎓 Вспоминайте иногда вашего студента: изучаем базу данных средневековых университетов
Начало учебного года — хороший повод узнать, как и чем жило средневековое и раннемодерное академическое сообщество. Рассказываем о совместном проекте немецких и швейцарских исследователей — базе данных Repertorium Academicum Germanicum (RAG), где собрана информация о студентах, выпускниках и обладателях ученых степеней на территории Священной Римской империи в XIII-XVI веках. Вы узнаете:
• зачем в средневековых университетах все записывали?
• как в это время обстояло дело с академической мобильностью?
• как восстановить в деталях карьеру отдельно взятого ученого?
🕵️ Стилометрия и древнескандинавская литература: определение авторства исландских саг
В этой статье разбираемся, как специалисты по древнескандинавской литературе применяют дельту Бёрроуза, чтобы разрешить спор об авторстве «Саги об Эгиле». Читайте:
• на какие группы по хронологии делятся исландские саги?
• чем можно объяснить стилистическое сходство между некоторыми сагами?
• какие эксперименты нужно провести с дельтой и исследуемыми текстами, чтобы снять все сомнения о личности автора?
👑 Что статистические отношения в лексике могут рассказать про средневековую власть?
Стилометрия и компьютерный анализ текстов хороши не только для определения авторства — еще они могут помочь с исследованием типов власти в средневековом обществе. В статье рассказываем о работе медиевистки Евгении Шелиной и о том, что скрывают корпуса французских грамот XIII века. Вы узнаете:
• что такое семантическое поле власти?
• чем власть духовенства отличается от власти светской аристократии и как это отражается в текстах?
• что интересного удалось узнать о фигуре французского короля?
🗺️ Скифия, Египет, Вавилон: как цифровые методы помогают в изучении средневековых карт
По сравнению с современными картографическими сервисами старинные средневековые карты выглядят загадочно и непонятно. В нашем материале читайте, как специальный пакет Veccompare для языка R помогает исследовать представления средневековых людей о мире вокруг. Вместе разбираемся:
• как узнать, что два картографа брали информацию из общего источника?
• почему некоторые топонимы на картах могут быть абсолютно уникальными?
• что получится, если сравнить карту с текстовым описанием той же территории?
📜 От разобщенности к войне: что показывает сетевой анализ византийских писем
Что письма могут рассказать ученым о политических связях византийцев? Можно ли по переписке отследить момент, за которым последовал государственный кризис? Рассказываем, как сетевой анализ и теория графов помогают изучать эпоху гражданских войн в Византии. В материале читайте:
• всегда ли представители византийской элиты, объединенные узами родства, имели одинаковые политические взгляды?
• как тесная связь человека с императором сказывалась на других его социальных взаимодействиях?
• как приход к власти Андроника III повлиял на динамику отношений между высокопоставленными византийскими чиновниками?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍12🥰9👏7❤3
Тест: От муми-троллей до «Четырех уроков у Ленина»
Кто из писательниц пропадал из школьной программы почти на 50 лет? Чьи сатирические рассказы трижды оказывались в школьном каноне? И, наконец, чье творчество стали изучать только в 1990-м году?
Предлагаем узнать (или вспомнить!) в нашем тесте, посвященном писательницам в школьном литературном каноне. Кстати, подробнее о них мы рассказывали в этом посте и в карточках.
Пройти тест!
🤖 «Системный Блокъ» @sysblok
Кто из писательниц пропадал из школьной программы почти на 50 лет? Чьи сатирические рассказы трижды оказывались в школьном каноне? И, наконец, чье творчество стали изучать только в 1990-м году?
Предлагаем узнать (или вспомнить!) в нашем тесте, посвященном писательницам в школьном литературном каноне. Кстати, подробнее о них мы рассказывали в этом посте и в карточках.
Пройти тест!
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Тест: женщины в списке чтения для школьников
Кто из женщин представлен в школьном каноне по литературе, кроме Ахматовой и Цветаевой? Может показаться, что больше никого там и нет. Это, конечно, не так. Но давайте проверим, каких писательниц, поэтесс и сказительниц в обязательном порядке читают в школах?
❤29🔥13🏆7👍6😢1
Нейросети помогают ученым исследовать уравнения, LLM побеждают в олимпиаде по программированию
Рассказываем, что произошло в мире ИИ за последнее время
Нейросети помогут решить задачу тысячелетия?
Лаборатория Google DeepMind вместе с учёными из США предложила метод на основе нейросетей, помогающий лучше понимать определенный вид математических задач. Это может помочь в решении одной из задач тысячелетия.
Изобретение позволяет находить особые решения дифференциальных уравнений, описывающих многие физические процессы. Например, уравнение Навье — Стокса (запомните его) описывает изменение скорости потока жидкости или газа во времени. Его решение — формула, выражающая скорость через параметр времени и характеристиками жидкости / газа.
Решений часто много, но часть из них приводит к физически невозможным показателям. Например, формула может предсказать бесконечную скорость потока. Поиск таких особых решений важен: он показывает границы применимости уравнения. Скажем, при тестировании крыла самолёта уравнение динамики потока воздуха может давать аномальные значения, и результаты эксперимента будут ненадежными.
DeepMind совместно с физиками и математиками разработали вычислительный метод для нахождения таких особых решений. Он использует нейросети и новый способ их обучения с высокой численной точностью. Метод уже протестировали на ряде уравнений и открыли новые группы особых решений.
Языковые модели от Google и OpenAI победили в олимпиаде по программированию
Сразу два лидера в области LLM заняли призовые места в ICPC — Международном студенческом командном чемпионате по программированию.
Обеим командам предоставили столько же времени, сколько и обычным участникам. Команда OpenAI заняла первое место, решив все 12 задач, Google — второе, решив десять.
OpenAI использовала три модели: GPT-5 и экспериментальную рассуждающую модель для генерации решений, и еще одну — для выбора финального решения из набора кандидатов. Ни одна из модель не обучалась специально для ICPC. GPT-5 решила 11 задач, а самую сложную — экспериментальная модель.
Google использовала модель Gemini 2.5 в режиме продвинутых рассуждений DeepThink. Примечательно, что на отдельных задачах она показала время лучше, чем у самых быстрых участников.
Обе модели справилась с задачей, которую не решила ни одна человеческая команда. Среди людей первое место заняла команда петербургская университета СПбГУ, решив 11 задач. Второе и третье места достались командам из Японии и Китая соответственно.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время
Нейросети помогут решить задачу тысячелетия?
Лаборатория Google DeepMind вместе с учёными из США предложила метод на основе нейросетей, помогающий лучше понимать определенный вид математических задач. Это может помочь в решении одной из задач тысячелетия.
Изобретение позволяет находить особые решения дифференциальных уравнений, описывающих многие физические процессы. Например, уравнение Навье — Стокса (запомните его) описывает изменение скорости потока жидкости или газа во времени. Его решение — формула, выражающая скорость через параметр времени и характеристиками жидкости / газа.
Решений часто много, но часть из них приводит к физически невозможным показателям. Например, формула может предсказать бесконечную скорость потока. Поиск таких особых решений важен: он показывает границы применимости уравнения. Скажем, при тестировании крыла самолёта уравнение динамики потока воздуха может давать аномальные значения, и результаты эксперимента будут ненадежными.
DeepMind совместно с физиками и математиками разработали вычислительный метод для нахождения таких особых решений. Он использует нейросети и новый способ их обучения с высокой численной точностью. Метод уже протестировали на ряде уравнений и открыли новые группы особых решений.
Почему это важно?
Доказательство отсутствия особых решений у некоторых уравнений — сложная задача. Например, доказательство гипотезы, что уравнение Навье — Стокса не имеет особых решений, входит в список из 7 задач тысячелетия с призом в 1 млн долларов. Пока решена только одна из этих задач — Григорием Перельманом.
Новый метод, представленный учеными, полуавтоматический — его можно применять к большому спектру уравнений с относительно небольшим участием человека. То есть сложность задачи частично удалось переложить на компьютер. Возможно, это поможет найти особые решения уравнения Навье — Стокса и опровергнуть гипотезу.
Это не первый случай, когда учёные используют возросшие технологические и вычислительные возможности для работы над сложными задачами. Можно вспомнить Большой адронный коллайдер или Нобелевскую премию за нейросети.
Языковые модели от Google и OpenAI победили в олимпиаде по программированию
Сразу два лидера в области LLM заняли призовые места в ICPC — Международном студенческом командном чемпионате по программированию.
Обеим командам предоставили столько же времени, сколько и обычным участникам. Команда OpenAI заняла первое место, решив все 12 задач, Google — второе, решив десять.
OpenAI использовала три модели: GPT-5 и экспериментальную рассуждающую модель для генерации решений, и еще одну — для выбора финального решения из набора кандидатов. Ни одна из модель не обучалась специально для ICPC. GPT-5 решила 11 задач, а самую сложную — экспериментальная модель.
Google использовала модель Gemini 2.5 в режиме продвинутых рассуждений DeepThink. Примечательно, что на отдельных задачах она показала время лучше, чем у самых быстрых участников.
Обе модели справилась с задачей, которую не решила ни одна человеческая команда. Среди людей первое место заняла команда петербургская университета СПбГУ, решив 11 задач. Второе и третье места достались командам из Японии и Китая соответственно.
Почему это важно?
Модели этих же компаний недавно одержали победу и на олимпиаде по математике.
И OpenAI, и Google используют исключительно языковые модели общего назначения, а не специализированные системы для отдельных задач. Это демонстрирует потенциал больших языковых моделей в решении сложных технических и наукоемких проблем.
Лидерство в соревнованиях с людьми показывает и прогресс в развитии LLM. К примеру, в 2023 году они не всегда генерировали корректный код. Однако эти успехи не полностью отображают качество моделей. Они всё еще часто ошибаются в более простых задачах и галлюцинируют.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤21👍10🔥5👎1
«Чукотка — это культура, сквозь которую прорастает язык»: лингвист Инна Зибер об изучении Севера, магии чукотского имени и утрате традиций
Как Север может оказаться южнее Москвы? С какими сложностями сталкивается исследователь языков и народов Арктики? Где лучше искать носителей чукотского языка и культуры? Как правильно дать ребенку чукотское имя и как смириться с языковой утратой? Что изменилось в жизни чукчей за 100 лет? Об этом «Системный Блокъ» поговорил с Инной Зибер, заведующей Научно-учебной лабораторией социогуманитарных исследований Севера и Арктики НИУ ВШЭ.
Экспедиции
Инна Зибер и её коллеги регулярно ездят в экспедиции в поселки Чукотки — именно там живут пожилые, а значит и самые опытные носители языка. Ещё интереснее – попасть в тундру, где люди используют чукотский язык как необходимый.
Раньше Инна ездила в Удмуртию, к бесермянам, где есть и старшие представители культуры, которые лучше знают язык, песни, хозяйственную деятельность, и более урбанизированная молодежь. Но все-таки разница между традиционной бессермянской жизнью 100 лет назад и сегодня меньше, чем у чукчей.
Иначе ситуация выглядит и в Поволжье или Прикамье, где носители привыкли к лингвистам и могут, например, сами поправить транскрипцию, глядя ученому в компьютер.
О традиции и разрыве
На язык и традиции Чукотки сильно повлияла советская политика. Критическими точками изменения стали стали коллективизация и увоз детей из тундры в поселковые интернаты. И если поколение, которое в 1950-1960-х уезжало в интернат и возвращалось летом к своим родителям в тундру, еще остается носителями культуры, то более молодые — уже нет.
Русское влияние сказалось и на представлениях о религии, потому что на место шаманов пришло христианство, и отношение к этому у местных жителей двойственное.
Подробнее о работе лаборатории, сохранении традиций на Чукотке, цифровых технологиях в изучении малых языков, а также о мечтах североведов узнаете из полной версии интервью на сайте.
🤖 «Системный Блокъ» @sysblok
Как Север может оказаться южнее Москвы? С какими сложностями сталкивается исследователь языков и народов Арктики? Где лучше искать носителей чукотского языка и культуры? Как правильно дать ребенку чукотское имя и как смириться с языковой утратой? Что изменилось в жизни чукчей за 100 лет? Об этом «Системный Блокъ» поговорил с Инной Зибер, заведующей Научно-учебной лабораторией социогуманитарных исследований Севера и Арктики НИУ ВШЭ.
Экспедиции
Инна Зибер и её коллеги регулярно ездят в экспедиции в поселки Чукотки — именно там живут пожилые, а значит и самые опытные носители языка. Ещё интереснее – попасть в тундру, где люди используют чукотский язык как необходимый.
Раньше Инна ездила в Удмуртию, к бесермянам, где есть и старшие представители культуры, которые лучше знают язык, песни, хозяйственную деятельность, и более урбанизированная молодежь. Но все-таки разница между традиционной бессермянской жизнью 100 лет назад и сегодня меньше, чем у чукчей.
Иначе ситуация выглядит и в Поволжье или Прикамье, где носители привыкли к лингвистам и могут, например, сами поправить транскрипцию, глядя ученому в компьютер.
На Чукотке все по-другому. Сначала 8–9 часов летишь на самолете до Анадыря, потом ждешь погоды. Если повезло — долетаешь до центра района. <...>
Когда ты через много-много дней наконец добираешься до поселка, который вообще-то один из самых легкодоступных на Чукотке, ты смотришь на людей и понимаешь, что они здесь все это время занимались делом. Ты сидишь в большом городе над книжками, с компьютером, рассчитываешь дорогу до минуты с помощью «Яндекс Карт», а тут у людей совершенно другая жизнь. Погода решает за них, могут ли они куда-то передвигаться. Они должны делать какую-то работу, потому что от этого зависит их жизнь. Если не выделать шкуру и если не сшить одежду пастуху, он замерзнет насмерть в тундре. По сравнению с моей московской жизнью, все очень трудно и неудобно.
О традиции и разрыве
На язык и традиции Чукотки сильно повлияла советская политика. Критическими точками изменения стали стали коллективизация и увоз детей из тундры в поселковые интернаты. И если поколение, которое в 1950-1960-х уезжало в интернат и возвращалось летом к своим родителям в тундру, еще остается носителями культуры, то более молодые — уже нет.
Русское влияние сказалось и на представлениях о религии, потому что на место шаманов пришло христианство, и отношение к этому у местных жителей двойственное.
«Русской» одеждой может называться и финская куртка, и китайская. «Русский» дом — это и канадский домик, и советский домик. Поэтому русское — это все, что нетрадиционное. И оно может оцениваться и положительно, и отрицательно.
Подробнее о работе лаборатории, сохранении традиций на Чукотке, цифровых технологиях в изучении малых языков, а также о мечтах североведов узнаете из полной версии интервью на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Лингвист Инна Зибер о чукотском языке, именах и утрате традиций
«Системный Блокъ» поговорил с Инной Зибер, заведующей Научно-учебной лабораторией социогуманитарных исследований Севера и Арктики НИУ ВШЭ об исследовании северных языков и экспедициях на Чукотку.
❤37🔥23☃9👍5🤷♂2👎1🎉1🗿1
Кто написал «Тихий Дон»? Что цифровые методы говорят о «Шолоховском вопросе»
Уже почти сто лет читатели и исследователи пытаются выяснить, кто написал «Тихий Дон» — всё-таки Шолохов или кто-то другой? В новом тексте наш главный редактор Даниил Скоринкин (канал Цифровой филолог) рассказывает о том, какие ответы на этот вопрос предлагают стилометрия и количественные методы.
✍🏼 Почему вопрос авторства Шолохова вообще возникает?
Роман Шолохова быстро завоевал популярность у читателей, но юный возраст автора, отсутствие у него формального образования и стремительный переход от небольших рассказов к эпопее вызвали подозрения в плагиате.
Главных кандидатов на «настоящее» авторство оказалось двое: Фёдор Крюков и Вениамин Краснушкин (он же Виктор Севский). Оба происходили из донских казаков, оба были литераторами и журналистами, оба — свидетели и участники сначала Первой мировой, а затем Гражданской войны на Дону на стороне белых. Оба бесследно пропали в 1920-м году. Еще один известный «альтернативный автор» Шолоховских текстов — Александр Серафимович (настоящая фамилия — Попов). Сам он, кстати, был одним из главных защитников авторства Шолохова и даже возглавлял в конце 1920-х комиссию по установлению истины вокруг «Тихого Дона».
📊 А что говорит статистика?
Группа шведско-норвежских исследователей во главе с профессором-русистом из Осло Г. Хьетсо исследовала роман в конце 1980-х. Сопоставив текст «Тихого Дона» с другими текстами Шолохова и Крюкова, они выяснили, что длина предложений и распределение по ним частей речи скорее указывают на авторство Шолохова.
Однако проблема в том, что в тексте можно посчитать очень много что, для всего будет какое-то численное выражение. Вот только откуда мы знаем, что тот или иной параметр связан с авторством? Например, по длине предложений «Тихий Дон» с тем же успехом можно было бы приписать Достоевскому.
Супруги Фоменко, один из первых «цифро-гуманитарных тандемов» в истории советской науки, предложили свой метод поиска авторства — на основе средней доли служебных слов. Их эксперименты указали уже на авторство Крюкова. В итоге две работы — каждая на основе своего математического аппарата — получили противоположные результаты. Доверие к количественным методам было подорвано.
📈 Что меняет (и чего не меняет) появление метода Delta
Начало XXI века — время рождения современной стилометрии, основанной на методе Delta (мы часто упоминанием этот метод, а здесь рассказывали о нём подробнее). Если применить его к Шолохову, можно выяснить, что, во-первых, первые три тома «Тихого Дона» стилометрически близки ранней прозе автора. Во-вторых, что сближений произведений Шолохова с текстами других известных предполагаемых кандидатов — нет. В-третьих, что тексты, автором которых считается Шолохов, стилометрически неоднородны и ведут себя в эксперименте иначе, чем тексты других современных ему писателей.
И всё же даже этих выводов может не быть достаточно, чтобы уверенно утверждать, что фамилия на обложке «Тихого Дона» принадлежит его истинному автору. Подробнее об этой литературоведческой загадке и о том, как исследователи подступались к ней в разное время, узнаете из полной версии текста.
🤖 «Системный Блокъ» @sysblok
Уже почти сто лет читатели и исследователи пытаются выяснить, кто написал «Тихий Дон» — всё-таки Шолохов или кто-то другой? В новом тексте наш главный редактор Даниил Скоринкин (канал Цифровой филолог) рассказывает о том, какие ответы на этот вопрос предлагают стилометрия и количественные методы.
✍🏼 Почему вопрос авторства Шолохова вообще возникает?
Роман Шолохова быстро завоевал популярность у читателей, но юный возраст автора, отсутствие у него формального образования и стремительный переход от небольших рассказов к эпопее вызвали подозрения в плагиате.
Главных кандидатов на «настоящее» авторство оказалось двое: Фёдор Крюков и Вениамин Краснушкин (он же Виктор Севский). Оба происходили из донских казаков, оба были литераторами и журналистами, оба — свидетели и участники сначала Первой мировой, а затем Гражданской войны на Дону на стороне белых. Оба бесследно пропали в 1920-м году. Еще один известный «альтернативный автор» Шолоховских текстов — Александр Серафимович (настоящая фамилия — Попов). Сам он, кстати, был одним из главных защитников авторства Шолохова и даже возглавлял в конце 1920-х комиссию по установлению истины вокруг «Тихого Дона».
📊 А что говорит статистика?
Группа шведско-норвежских исследователей во главе с профессором-русистом из Осло Г. Хьетсо исследовала роман в конце 1980-х. Сопоставив текст «Тихого Дона» с другими текстами Шолохова и Крюкова, они выяснили, что длина предложений и распределение по ним частей речи скорее указывают на авторство Шолохова.
Однако проблема в том, что в тексте можно посчитать очень много что, для всего будет какое-то численное выражение. Вот только откуда мы знаем, что тот или иной параметр связан с авторством? Например, по длине предложений «Тихий Дон» с тем же успехом можно было бы приписать Достоевскому.
Супруги Фоменко, один из первых «цифро-гуманитарных тандемов» в истории советской науки, предложили свой метод поиска авторства — на основе средней доли служебных слов. Их эксперименты указали уже на авторство Крюкова. В итоге две работы — каждая на основе своего математического аппарата — получили противоположные результаты. Доверие к количественным методам было подорвано.
📈 Что меняет (и чего не меняет) появление метода Delta
Начало XXI века — время рождения современной стилометрии, основанной на методе Delta (мы часто упоминанием этот метод, а здесь рассказывали о нём подробнее). Если применить его к Шолохову, можно выяснить, что, во-первых, первые три тома «Тихого Дона» стилометрически близки ранней прозе автора. Во-вторых, что сближений произведений Шолохова с текстами других известных предполагаемых кандидатов — нет. В-третьих, что тексты, автором которых считается Шолохов, стилометрически неоднородны и ведут себя в эксперименте иначе, чем тексты других современных ему писателей.
И всё же даже этих выводов может не быть достаточно, чтобы уверенно утверждать, что фамилия на обложке «Тихого Дона» принадлежит его истинному автору. Подробнее об этой литературоведческой загадке и о том, как исследователи подступались к ней в разное время, узнаете из полной версии текста.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
«Тихий Дон» и стилометрия: что говорят о «Шолоховском вопросе» количественные методы - Системный Блокъ
Кто написал «Тихий Дон»? Этому вопросу уже почти 100 лет, и чем дольше он исследуется, тем больше на него появляется альтернативных ответов. Рассказываю, как ученые пытались искать ответ на этот вопрос при помощи статистики, как на Шолохове отрабатывали компьютерные…
🔥59❤30👏10👍6🤡2
Горький урок ABBYY год спустя: как лингвисты проиграли битву за NLP
Ровно год назад, 30 сентября 2024 года, IT-компания ABBYY, которая когда-то была примером международного успеха российского IT, уволила несколько сотен разработчиков, релоцированных из России в 2022-м. Это событие важно с разных сторон: и как веха трансформации области Natural Language Processing, которую компания проморгала, и как пример дискриминации, с которой сталкиваются россияне в эмиграции (увольняли «по паспорту»), и как образец нарушения корпорацией трудовых прав. В годовщину печального события перечитываем хронику взлета и падения ABBYY от её бывшего сотрудника, а ныне главного редактора «Системного Блока».
Что за ABBYY и при чем тут лингвисты и NLP?
История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод.
На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым
Что пошло не так?
В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения.
C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.
Какие уроки мы извлекаем?
За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией.
И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.
🤖 «Системный Блокъ» @sysblok
Ровно год назад, 30 сентября 2024 года, IT-компания ABBYY, которая когда-то была примером международного успеха российского IT, уволила несколько сотен разработчиков, релоцированных из России в 2022-м. Это событие важно с разных сторон: и как веха трансформации области Natural Language Processing, которую компания проморгала, и как пример дискриминации, с которой сталкиваются россияне в эмиграции (увольняли «по паспорту»), и как образец нарушения корпорацией трудовых прав. В годовщину печального события перечитываем хронику взлета и падения ABBYY от её бывшего сотрудника, а ныне главного редактора «Системного Блока».
Что за ABBYY и при чем тут лингвисты и NLP?
История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод.
На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым
Что пошло не так?
В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения.
C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.
Какие уроки мы извлекаем?
За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией.
И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP - Системный Блокъ
Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более…
❤83💔34❤🔥23👍10😢3👎1🔥1👾1
Нейросети, микрообучение и цифровые репетиторы: подборка материалов ко Дню учителя
5 октября в России отмечается День учителя. В честь праздника мы собрали наши статьи, полезные и для тех, кто учит, и для тех, кто учится. Рассказываем, как технологии меняют образование детей и взрослых, сравниваем цифровых помощников и делимся готовыми промптами для нейросетей.
ИИ для учителей: инструменты и готовые промпты для преподавателей
Мы искренне желаем преподавателям перестать бояться и полюбить нейросети. Ведь без них нынче никуда. Мы посвятили целый раздел нашего спецпроекта «ИИ-лайфхаки для вашей профессии» задачам учителей. Здесь рассказали про примеры промптов для разработки плана урока, создания обучающих материалов или тестов. А еще мы написали:
• Как педагогу правильно составить промпт для нейросети?
• Какие нейросети использовать для генерации изображений, а какие для поиска идей?
• Как с помощью нейросети разработать занятие по профориентации?
Коротко и быстро: что такое микрообучение и когда оно (не) может помочь
Микрообучение — это образовательный подход, при котором новая информация подается небольшими порциями, например, в формате коротких роликов, презентаций или иллюстрированных текстов. Его нередко используют компании для обучения сотрудников, не отрываясь от рабочего процесса. Но действительно ли микрообучение эффективно? Мы разобрались в этом вопросе и выяснили:
• Почему микрообучение стало популярным?
• Когда оно действительно помогает?
• Можно ли измерить эффективность микрообучения?
Сложно ли учиться в Zoom после 55: как устроено цифровое образование для старших возрастов
Обучение в старшем возрасте становится все более популярным, и выход на пенсию может стать поводом получить новую квалификацию. Благодаря онлайн-платформам, у студентов после 55 есть большой выбор программ: от освоения гаджетов до открытия своего дела. Из нашего материала вы узнаете:
• Зачем люди пенсионного возраста идут учиться?
• Что они предпочитают изучать?
• Какие образовательные платформы предлагают специальные программы для студентов 55+?
Цифровые репетиторы: как ИИ помогает готовиться к экзаменам
Несмотря на то, что до конца учебного года и выпускных экзаменов еще далеко, готовиться к ним школьникам приходится едва ли не с 1 сентября. Теперь им в этом помогают и цифровые помощники на основе искусственного интеллекта. Мы протестировали, как они справляются с подготовкой к итоговому сочинению, ЕГЭ по информатике и английскому языку. Из нашего обзора вы узнаете:
• Какой ИИ-помощник лучше всех помогает написать сочинение?
• Какая нейросеть лучше всех решает и объясняет математические задачи?
• Какой сервис разберет ошибки в устной речи на английском языке?
Как это будет по-русски? Цифровые технологии для изучения русского как иностранного
Если вы преподаете или изучаете русский как иностранный, то знаете, сколько сложностей возникает при освоении ударений или склонений. Мы изучили цифровые инструменты, которые помогут справиться с трудностями великого и могучего любому (даже тому, для кого он родной). Рассказываем:
• Где найти правила русской фонетики с примерами?
• Где слушать обучающие подкасты?
• С помощью какого инструмента можно научиться спрягать глаголы?
Бонус: Ахматова и Цветаева в списке для чтения. А кто ещё?
Если вы уже прочитали все наши статьи про образование, пройдите наш тест по мотивам исследования школьного литературного канона. Как из любой контрольной работы, из него можно узнать много нового. Например:
• Какая российская императрица попала в школьную программу?
• Творчество какой неграмотной сочинительницы изучали советские школьники?
• Какая поэтесса Серебряного века еще при жизни вошла в учебники литературы, а потом пропала оттуда на 60 лет?
🤖 «Системный Блокъ» @sysblok
5 октября в России отмечается День учителя. В честь праздника мы собрали наши статьи, полезные и для тех, кто учит, и для тех, кто учится. Рассказываем, как технологии меняют образование детей и взрослых, сравниваем цифровых помощников и делимся готовыми промптами для нейросетей.
ИИ для учителей: инструменты и готовые промпты для преподавателей
Мы искренне желаем преподавателям перестать бояться и полюбить нейросети. Ведь без них нынче никуда. Мы посвятили целый раздел нашего спецпроекта «ИИ-лайфхаки для вашей профессии» задачам учителей. Здесь рассказали про примеры промптов для разработки плана урока, создания обучающих материалов или тестов. А еще мы написали:
• Как педагогу правильно составить промпт для нейросети?
• Какие нейросети использовать для генерации изображений, а какие для поиска идей?
• Как с помощью нейросети разработать занятие по профориентации?
Коротко и быстро: что такое микрообучение и когда оно (не) может помочь
Микрообучение — это образовательный подход, при котором новая информация подается небольшими порциями, например, в формате коротких роликов, презентаций или иллюстрированных текстов. Его нередко используют компании для обучения сотрудников, не отрываясь от рабочего процесса. Но действительно ли микрообучение эффективно? Мы разобрались в этом вопросе и выяснили:
• Почему микрообучение стало популярным?
• Когда оно действительно помогает?
• Можно ли измерить эффективность микрообучения?
Сложно ли учиться в Zoom после 55: как устроено цифровое образование для старших возрастов
Обучение в старшем возрасте становится все более популярным, и выход на пенсию может стать поводом получить новую квалификацию. Благодаря онлайн-платформам, у студентов после 55 есть большой выбор программ: от освоения гаджетов до открытия своего дела. Из нашего материала вы узнаете:
• Зачем люди пенсионного возраста идут учиться?
• Что они предпочитают изучать?
• Какие образовательные платформы предлагают специальные программы для студентов 55+?
Цифровые репетиторы: как ИИ помогает готовиться к экзаменам
Несмотря на то, что до конца учебного года и выпускных экзаменов еще далеко, готовиться к ним школьникам приходится едва ли не с 1 сентября. Теперь им в этом помогают и цифровые помощники на основе искусственного интеллекта. Мы протестировали, как они справляются с подготовкой к итоговому сочинению, ЕГЭ по информатике и английскому языку. Из нашего обзора вы узнаете:
• Какой ИИ-помощник лучше всех помогает написать сочинение?
• Какая нейросеть лучше всех решает и объясняет математические задачи?
• Какой сервис разберет ошибки в устной речи на английском языке?
Как это будет по-русски? Цифровые технологии для изучения русского как иностранного
Если вы преподаете или изучаете русский как иностранный, то знаете, сколько сложностей возникает при освоении ударений или склонений. Мы изучили цифровые инструменты, которые помогут справиться с трудностями великого и могучего любому (даже тому, для кого он родной). Рассказываем:
• Где найти правила русской фонетики с примерами?
• Где слушать обучающие подкасты?
• С помощью какого инструмента можно научиться спрягать глаголы?
Бонус: Ахматова и Цветаева в списке для чтения. А кто ещё?
Если вы уже прочитали все наши статьи про образование, пройдите наш тест по мотивам исследования школьного литературного канона. Как из любой контрольной работы, из него можно узнать много нового. Например:
• Какая российская императрица попала в школьную программу?
• Творчество какой неграмотной сочинительницы изучали советские школьники?
• Какая поэтесса Серебряного века еще при жизни вошла в учебники литературы, а потом пропала оттуда на 60 лет?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤28🔥10👍9
Нейротикток от OpenAI, новая модель Anthropic, новый тест для LLM
Рассказываем, что произошло в мире ИИ за последнее время.
Sora 2 и нейротикток
Компания OpenAI представила обновлённую версию модели Sora для генерации видео по текстовым описаниям. Новая версия создает более качественные и реалистичные ролики со звуком, а еще умеет добавлять в кадр конкретных людей и предметы на основе загруженных примеров.
Одновременно с обновлением вышло мобильное приложение Sora для iPhone с короткими роликами, созданными пользователями с помощью Sora 2. Меньше чем за неделю социальная сеть возглавила топ App Store в категории «Фото и видео».
Пока приложение работает только в США и Канаде по приглашениям.
Новый Sonnet от Anthropic
Компания Anthropic представила Claude Sonnet 4.5 — новую версию своей языковой модели. По заявлению разработчиков, это лучшая в мире модель для написания кода и создания сложных агентов (программ, использующих ИИ для автономного выполнения задач на компьютере). Sonnet 4.5 также показала значительные улучшения в задачах на логику и математику.
Одно из ключевых улучшений — способность работать автономно до 30 часов без вмешательства человека. Поэтому модель особенно полезна для долгосрочных задач вроде анализа данных. Sonnet 4.5 также получила улучшения в специализированных областях, таких как финансы и медицина.
Тест LLM в реальных рабочих задачах
Компания OpenAI представила GDPval — новый тест для оценки способности языковых моделей выполнять экономически значимые задачи из реального мира.
OpenAI выбрала девять крупнейших отраслей экономики США и 44 профессии с наибольшим вкладом в фонд оплаты труда, связанных с интеллектуальным трудом. Для каждой подготовили по 30 реальных задач, прошедших несколько раундов экспертной проверки, а результаты моделей оценивали специалисты оценивали в слепом формате, сравнивая их с работой людей.
В тестировании участвовали несколько моделей OpenAI, Claude Opus 4.1, Gemini 2.5 Pro и Grok 4. Claude Opus 4.1 показала лучший результат (в 43,5% модель оказалась лучше эксперта, еще в 4% — на уровне экспертов), особенно в эстетических аспектах вроде форматирования документов, а GPT-5 отличилась в точности поиска специализированных знаний.
Модели выполняют задачи GDPval примерно в 100 раз быстрее и дешевле экспертов, однако эти цифры не учитывают человеческий контроль и итерации, необходимые в реальных рабочих условиях.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время.
Sora 2 и нейротикток
Компания OpenAI представила обновлённую версию модели Sora для генерации видео по текстовым описаниям. Новая версия создает более качественные и реалистичные ролики со звуком, а еще умеет добавлять в кадр конкретных людей и предметы на основе загруженных примеров.
Одновременно с обновлением вышло мобильное приложение Sora для iPhone с короткими роликами, созданными пользователями с помощью Sora 2. Меньше чем за неделю социальная сеть возглавила топ App Store в категории «Фото и видео».
Пока приложение работает только в США и Канаде по приглашениям.
Почему это важно?
Модели для генерации видео начали активно развиваться с 2024 года. С тех пор OpenAI, Google и ряд китайских компаний представили решения, способные создавать относительно реалистичные ролики.
Сейчас их используют преимущественно для развлекательного контента, но существуют опасения, что в будущем компании будут применять такие технологии для генерации крайне персонализированного и вызывающего зависимость контента.
В перспективе генеративные модели могут превратиться в модели мира, способные относительно точно и быстро симулировать физические процессы и ситуации из реальности. Например, моделировать редкие дорожные ситуации для проверки автопилотов или рутинные задачи вроде складывания вещей и приготовления пищи для обучения роботов.
Новый Sonnet от Anthropic
Компания Anthropic представила Claude Sonnet 4.5 — новую версию своей языковой модели. По заявлению разработчиков, это лучшая в мире модель для написания кода и создания сложных агентов (программ, использующих ИИ для автономного выполнения задач на компьютере). Sonnet 4.5 также показала значительные улучшения в задачах на логику и математику.
Одно из ключевых улучшений — способность работать автономно до 30 часов без вмешательства человека. Поэтому модель особенно полезна для долгосрочных задач вроде анализа данных. Sonnet 4.5 также получила улучшения в специализированных областях, таких как финансы и медицина.
Почему это важно?
Anthropic – один из главных конкурентов OpenAI. Модели Antropic на протяжении долгого времени остаются лидерами в области программирования и агентных систем.
Тест LLM в реальных рабочих задачах
Компания OpenAI представила GDPval — новый тест для оценки способности языковых моделей выполнять экономически значимые задачи из реального мира.
OpenAI выбрала девять крупнейших отраслей экономики США и 44 профессии с наибольшим вкладом в фонд оплаты труда, связанных с интеллектуальным трудом. Для каждой подготовили по 30 реальных задач, прошедших несколько раундов экспертной проверки, а результаты моделей оценивали специалисты оценивали в слепом формате, сравнивая их с работой людей.
В тестировании участвовали несколько моделей OpenAI, Claude Opus 4.1, Gemini 2.5 Pro и Grok 4. Claude Opus 4.1 показала лучший результат (в 43,5% модель оказалась лучше эксперта, еще в 4% — на уровне экспертов), особенно в эстетических аспектах вроде форматирования документов, а GPT-5 отличилась в точности поиска специализированных знаний.
Модели выполняют задачи GDPval примерно в 100 раз быстрее и дешевле экспертов, однако эти цифры не учитывают человеческий контроль и итерации, необходимые в реальных рабочих условиях.
Почему это важно?
Большинство существующих тестов для языковых моделей проверяют академические способности или производительность в узких областях вроде математики и олимпиадного программирования. Поэтому их результаты плохо отражают реальную пользу ИИ в практических задачах. Несмотря на это, в общественной дискуссии активно обсуждается вероятность замены человеческого труда искусственным интеллектом.
GDPval призван тестировать модели на репрезентативных задачах из реальной жизни, чтобы оценить экономический потенциал ИИ и возможные тренды автоматизации труда в будущем.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13👍9🔥8😁1🤩1
UNESCO открыла виртуальный музей украденных культурных объектов
29 сентября на конференции MONDIACULT 2025 в Барселоне ЮНЕСКО представила Виртуальный музей украденных культурных объектов. Работа над этим проектом велась с июня 2023 года совместно с Интерполом. В качестве спонсора выступило правительство Саудовской Аравии, а «архитектуру» виртуального музея спроектировал Франсис Кере, лауреат Притцкеровской премии.
Коллекция содержит более 250 экспонатов — это изображения и 3D-модели артефактов, которые были украдены в 46 странах по всему миру. Все они доступны для просмотра бесплатно на сайте музея — для этого можно использовать не только телефон или компьютер, но и VR-очки. Экспонаты сгруппированы по регионам: Европа и Северная Америка (96), Латинская Америка и страны Карибского бассейна (57), Африка (51), Азиатско-Тихоокеанский регион (37) и Арабские страны (36). Объекты можно также искать по цвету и назначению.
Кроме зала с утраченными артефактами в музее доступно еще одно виртуальное помещение, которое создатели назвали Return and Restitution Room. Здесь представлены объекты, которые удалось передать обратно законным владельцам. На данный момент таких всего три — посетители могут посмотреть на их модели и изображения, а также узнать, что было сделано для их возвращения.
🤖 «Системный Блокъ» @sysblok
29 сентября на конференции MONDIACULT 2025 в Барселоне ЮНЕСКО представила Виртуальный музей украденных культурных объектов. Работа над этим проектом велась с июня 2023 года совместно с Интерполом. В качестве спонсора выступило правительство Саудовской Аравии, а «архитектуру» виртуального музея спроектировал Франсис Кере, лауреат Притцкеровской премии.
Коллекция содержит более 250 экспонатов — это изображения и 3D-модели артефактов, которые были украдены в 46 странах по всему миру. Все они доступны для просмотра бесплатно на сайте музея — для этого можно использовать не только телефон или компьютер, но и VR-очки. Экспонаты сгруппированы по регионам: Европа и Северная Америка (96), Латинская Америка и страны Карибского бассейна (57), Африка (51), Азиатско-Тихоокеанский регион (37) и Арабские страны (36). Объекты можно также искать по цвету и назначению.
Кроме зала с утраченными артефактами в музее доступно еще одно виртуальное помещение, которое создатели назвали Return and Restitution Room. Здесь представлены объекты, которые удалось передать обратно законным владельцам. На данный момент таких всего три — посетители могут посмотреть на их модели и изображения, а также узнать, что было сделано для их возвращения.
Почему это важно?
Поскольку культурные объекты напрямую связаны с историей, их утрата означает постепенное разрушение идентичности сообществ. Первый шаг к их возвращению — огласка. При помощи этого проекта организация планирует привлечь внимание к проблеме мародерства, а также незаконного оборота археологических находок, произведений искусства и других предметов, представляющих культурную ценность.
Представители ЮНЕСКО заявляют, что, в отличие от других культурных институций, их виртуальный музей будет стремиться уменьшить, а не расширить свою коллекцию: если какой-либо из экспонатов удастся найти и вернуть, его уберут из экспозиции.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40🔥26🥰7😱3👏2🤡2
Искажение восприятия: риски использования 3D-диаграмм
Трехмерные диаграммы выглядят современно и эффектно, но очень часто они обманывают наше восприятие, искажают данные и заставляют делать неверные выводы. Разбираемся, как 3D-эффекты становятся источником дезинформации и как этого избежать (очень просто!).
👁️👄👁️ Искажение перспективы
Одной из главных проблем трехмерных диаграмм является искажение перспективы. На восприятие фигур в 3D-формате влияют различные визуальные эффекты, в частности, окклюзия — явление, когда объекты, расположенные ближе к наблюдателю, кажутся больше, чем те, что находятся на заднем плане. Это может вводить в заблуждение при интерпретации данных.
Например, на нашей иллюстрации сектор бирюзового цвета визуально выглядит больше, хотя его числовое значение меньше, чем у синего сегмента.
😐🫥 Потеря информации из-за перекрытия
В трехмерных столбчатых диаграммах столбцы с более высокими значениями могут полностью перекрывать те, что имеют более низкие значения. Из-за этого теряется часть информации, становится сложнее выявлять закономерности и тенденции и точно определять значения на центральных полосах графика (особенно если они не выровнены по числовой сетке).
🔹🔷 Проблемы со сравнением значений
Трехмерные фигуры также создают трудности для сравнения значений. Поскольку на нашем примере не указаны числовые значения, быстро разобраться в соотношении частей на левой диаграмме — практически невозможно.
😎 Что делать?
Решение проблемы довольно простое: избегайте использования трехмерных диаграмм, которые искажают представляемые данные. Вместо этого выбирайте двумерные диаграммы или таблицы, чтобы обеспечить честность и максимальную достоверность информации.
🤖 «Системный Блокъ» @sysblok
Трехмерные диаграммы выглядят современно и эффектно, но очень часто они обманывают наше восприятие, искажают данные и заставляют делать неверные выводы. Разбираемся, как 3D-эффекты становятся источником дезинформации и как этого избежать (очень просто!).
👁️👄👁️ Искажение перспективы
Одной из главных проблем трехмерных диаграмм является искажение перспективы. На восприятие фигур в 3D-формате влияют различные визуальные эффекты, в частности, окклюзия — явление, когда объекты, расположенные ближе к наблюдателю, кажутся больше, чем те, что находятся на заднем плане. Это может вводить в заблуждение при интерпретации данных.
Например, на нашей иллюстрации сектор бирюзового цвета визуально выглядит больше, хотя его числовое значение меньше, чем у синего сегмента.
😐🫥 Потеря информации из-за перекрытия
В трехмерных столбчатых диаграммах столбцы с более высокими значениями могут полностью перекрывать те, что имеют более низкие значения. Из-за этого теряется часть информации, становится сложнее выявлять закономерности и тенденции и точно определять значения на центральных полосах графика (особенно если они не выровнены по числовой сетке).
🔹🔷 Проблемы со сравнением значений
Трехмерные фигуры также создают трудности для сравнения значений. Поскольку на нашем примере не указаны числовые значения, быстро разобраться в соотношении частей на левой диаграмме — практически невозможно.
😎 Что делать?
Решение проблемы довольно простое: избегайте использования трехмерных диаграмм, которые искажают представляемые данные. Вместо этого выбирайте двумерные диаграммы или таблицы, чтобы обеспечить честность и максимальную достоверность информации.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48❤23🔥9👏3😱2❤🔥1💯1
Как написать хороший промпт
Если нейросети дают слишком общие ответы, часто можно переформулировать сам вопрос — промпт, который вы им задаете. Даем три варианта инструкций, которые сделают коммуникацию с ИИ конструктивнее.
1️⃣ Будьте конкретны
Чем больше деталей вы предоставите (цель и задачи, стиль, объем и т. д.), тем точнее окажется выдача (ответ) нейросети. Например, если вы хотите придумать пост для вашего личного блога, то промпт «Напиши пост про отпуск» будет не слишком полезен. А вот другой пример:
Так мы объясняем нейросети её роль, ставите четкую задачу и объясняете, какой формат ответа ждёте.
2️⃣ Покажите нейросети пример
Если вам нужен ответ в определенном стиле, покажите нейросети, как это должно выглядеть. Используйте конструкции: «Напиши в таком формате…», «Следуй этому примеру…», «В таком же стиле, как…».
Важно: Пример, который вы даете нейросети, должен соответствовать условиям, описанным в промпте. Так, если вы просите дать ответ в двух абзацах, то пример тоже должен состоять из двух абзацев.
Кроме того, описание формата стоит указывать и в промпте, даже если вы прилагаете пример. Иными словами, если вы хотите получить от нейросети ответ, который будет соответствовать желаемому формату, одного примера недостаточно: дополнительно пропишите структуру в запросе.
3️⃣ Просим нейросеть думать пошагово
Если вы задаете вопрос, который требует логики или расчетов, попросите нейросеть объяснить ход ее «мыслей». Для этого вы можете использовать следующие формулировки: «Думай пошагово», «Рассуждай логически», «Объясни свой ход мыслей», «Разбей решение на этапы».
Некоторые нейросети автоматически определяют сложность запроса и решают, нужно ли приводить ход размышлений. Фразы-триггеры побуждают модель рассуждать, — но иногда вы можете получить рассуждения автоматически (например, как в этом случае). Вот пример хорошего промпта такого формата:
Что дальше?
Если вы хотите лучше разобраться в техниках промптинга, переходите к нашему спецпроекту или читайте подробный гайд.
🤖 «Системный Блокъ» @sysblok
Если нейросети дают слишком общие ответы, часто можно переформулировать сам вопрос — промпт, который вы им задаете. Даем три варианта инструкций, которые сделают коммуникацию с ИИ конструктивнее.
Чем больше деталей вы предоставите (цель и задачи, стиль, объем и т. д.), тем точнее окажется выдача (ответ) нейросети. Например, если вы хотите придумать пост для вашего личного блога, то промпт «Напиши пост про отпуск» будет не слишком полезен. А вот другой пример:
Ты — SMM-менеджер канала в Telegram.
Напиши короткий (80-90 слов) пост для канала о поездке в горы на выходные. Канал посвящен туризму. Целевая аудитория канала: мужчины и женщины 30-35 лет, которые ценят активный отдых и ищут идеи для запоминающихся путешествий.
Цель поста — вовлечь подписчиков в обсуждение (реакции, комментарии о своем опыте). Пост должен быть написан через личную перспективу, через первое лицо. Сделай акцент на эмоции от единения с природой и адреналин. Используй подходящие к теме хэштеги.
Так мы объясняем нейросети её роль, ставите четкую задачу и объясняете, какой формат ответа ждёте.
Если вам нужен ответ в определенном стиле, покажите нейросети, как это должно выглядеть. Используйте конструкции: «Напиши в таком формате…», «Следуй этому примеру…», «В таком же стиле, как…».
Важно: Пример, который вы даете нейросети, должен соответствовать условиям, описанным в промпте. Так, если вы просите дать ответ в двух абзацах, то пример тоже должен состоять из двух абзацев.
Кроме того, описание формата стоит указывать и в промпте, даже если вы прилагаете пример. Иными словами, если вы хотите получить от нейросети ответ, который будет соответствовать желаемому формату, одного примера недостаточно: дополнительно пропишите структуру в запросе.
Если вы задаете вопрос, который требует логики или расчетов, попросите нейросеть объяснить ход ее «мыслей». Для этого вы можете использовать следующие формулировки: «Думай пошагово», «Рассуждай логически», «Объясни свой ход мыслей», «Разбей решение на этапы».
Некоторые нейросети автоматически определяют сложность запроса и решают, нужно ли приводить ход размышлений. Фразы-триггеры побуждают модель рассуждать, — но иногда вы можете получить рассуждения автоматически (например, как в этом случае). Вот пример хорошего промпта такого формата:
Ты — репетитор по математике. Нужно, чтобы ты объяснил решение задачи о пересекающихся множествах для ученика 8-9 класса, который только начинает изучать эту тему.
Задача звучит так: в классе 30 учеников, 16 занимаются программированием, 15 — дизайном, а 10 — и тем, и другим. Нужно найти, сколько человек ничем не занимаются.
Цель — не просто дать ответ, а подробно разобрать решение шаг за шагом, чтобы ученик понял принцип работы с пересекающимися множествами. Распиши решение поэтапно, с комментариями к каждому действию.
Объясняй простым и понятным языком, без излишней формальности, но с точными математическими формулировками. Представь ответ в виде связного объяснения, как если бы ты разговаривал с учеником у доски.
Что дальше?
Если вы хотите лучше разобраться в техниках промптинга, переходите к нашему спецпроекту или читайте подробный гайд.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как использовать ИИ для работы — гид по нейросетям
ИИ-лайфхаки для вашей работы: узнайте, как применять искусственный интеллект для работы, исследований и автоматизации рутинных задач.
🔥23❤14👍9
Классное чтение. Писательницы из союзных республик и стран зарубежья
«Системный Блокъ» продолжает рассказывать о писательницах и поэтессах, чьи сочинения в разные годы входили в школьный канон по литературе. В ходе исследования мы выяснили, что в списках для чтения появлялись имена 36 женщин, которым принадлежит в общей сложности всего 2% рекомендованных произведений.
Однако даже из этих 36 авторок сложно сразу вспомнить кого-нибудь, кроме Ахматовой и Цветаевой. В прошлом посте мы рассказывали о тех, кто надолго задержался в школьной программе, а сегодня предлагаем вам узнать больше о писательницах из союзных республик и стран зарубежья.
🤖 «Системный Блокъ» @sysblok
«Системный Блокъ» продолжает рассказывать о писательницах и поэтессах, чьи сочинения в разные годы входили в школьный канон по литературе. В ходе исследования мы выяснили, что в списках для чтения появлялись имена 36 женщин, которым принадлежит в общей сложности всего 2% рекомендованных произведений.
Однако даже из этих 36 авторок сложно сразу вспомнить кого-нибудь, кроме Ахматовой и Цветаевой. В прошлом посте мы рассказывали о тех, кто надолго задержался в школьной программе, а сегодня предлагаем вам узнать больше о писательницах из союзных республик и стран зарубежья.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥29❤26👍13🥰5🔥1😁1💋1