iMak AI Lab

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍10🔥9🎉8🗿1

807 views19:02

В качестве опенинга к дальнейшим постам на нашем канале - авторский взгляд руководителя iMak AI Lab, рассказанный на митапе у наших друзей из CS Space.

😉О зигзагах научной карьеры в CS/AI, жизни «не благодаря, а вопреки» и роли поддерживающего сообщества в современной науке и многом другом - смотрите на YouTube.

✔️

Выступление отражает позицию автора и может не совпадать с мнением работодателей.

#opinion #story

🔬

😌

Не благодаря, а вопреки: Наруто, Луффи и Ичиго в современной российской науке | Илья Макаров

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

– Илья Макаров
– Митап "Как строить научную карьеру в CS/AI?"
– Сайт: https://csspace.io/meetup/2025fall-science
– Telegram: https://t.iss.one/csspace

1❤16👍9✍4👨‍💻3🔥2👎1🙏1

810 viewsedited 06:31

🥰

Мартин Ридмиллер, один из главных авторов знаменитой статьи DeepMind (https://arxiv.org/pdf/1312.05602) об обучении агентов играть в десятки Atari-игр по пикселям на экране, покидает Google DeepMind и переориентируется на «физический» искусственный интеллект.

После многолетней работы над архитектурами управления и алгоритмами, эффективно обучающимися по данным, он заявил, что намерен сосредоточиться на воплощенном ИИ-системах, которые не только «осмысливают» мир, но и физически функционируют в нем.

🤖 В апреле он присоединится к свежему европейскому проекту в области Physical AI, где создают автономных гуманоидов: энергоэффективных, надежных и масштабируемых. Команда уже начала работу в Мюнхене и Лимасоле, а сам Ридмиллер заявил, что «с нетерпением ждет присоединения».

✔️ Для сообщества это не только символическое завершение карьеры в Google DeepMind, но и серьезная смена вектора внимания - GDM больше не предел мечтаний, и для реализации своих амбиций в отрыве от продуктовой гонки LLM приходится идти на более рискованные пути развития.

Из личного опыта:

Я познакомился с Мартином на конференции IJCAI 2024 в Южной Корее. Своим рассказом о том, как все смеялись над исследователями в области RL на его заре, когда не было доступа к серьезным вычислительным мощностям и скейлингу, он произвел впечатление очень интеллигентного глубокого ученого.

На мой вопрос как попасть на позицию Директора в Google DeepMind ответ был: “верить в то что вы делаете, продолжать это делать даже если никто в это не верит, четко формулировать челленджинг таргет исследования, и быть достаточно везучим чтобы попасть на старте компании в стрим”.

🤔 Не заняться ли Quantum ML ... в целом, AI коммьюнити не хватает веры для фокуса усилий, ИМХО.”

#news #story

🔬

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍5🤔2⚡1

751 viewsedited 06:35

🔬 Сегодня мы расскажем об одном из наших проектов, который достаточно громко «выстрелил» в прошлом году

Представьте: вы наводите камеру телефона на стелу в музее, и мгновенно видите перевод надписи, которой больше трех тысяч лет. Звучит как научная фантастика? Команда нашей лаборатории в составе исследователей из Института AIRI, ИСП РАН и ИТМО уже сделала значительный шаг в этом направлении.

Древнеегипетское письмо - это не алфавит из нескольких десятков букв, а сотни уникальных символов, многие из которых визуально похожи друг на друга. Иероглифы группируются в сложные блоки, пишутся в разных направлениях и встречаются на самых разных поверхностях — от папирусов до каменных стел. Автоматически распознать и перевести такой текст — серьезный вызов даже для современных нейросетей .

Наши исследователи разработали целую экосистему инструментов:

✔️

Датасеты MEH и MuMMy: первые в мире многостилевые наборы данных для классификации, распознавания и перевода египетских иероглифов. MEH включает 40 изображений с 12 744 размеченными иероглифами и 639 уникальными знаками, а MuMMy — первый мультимодальный датасет, связывающий изображения иероглифов с их транслитерацией и переводом на английский .

✔️

Система генерации синтетических данных: с помощью диффузионных моделей исследователи научились создавать реалистичные изображения иероглифов для обучения нейросетей, что критически важно при нехватке настоящих размеченных данных .

✔️

Инструмент разметки pyThoth: специальный редактор на базе Label Studio с палитрой иероглифов и встроенными моделями OCR и машинного перевода, который ускоряет работу египтологов почти в 6 раз .

✔️

Полный пайплайн перевода от изображения к распознаванию знаков, транслитерации и переводу на современные языки. Пайплайн адаптирован для длинных текстов и AR-приложений .

Работы команды приняты на ведущих международных конференциях:

✔️

ACM SIGGRAPH 2025 (постерный доклад о системе интерпретации текстов)

✔️

ACM Multimedia 2025 (две статьи — о датасете MMM и мультимодальном датасете MuMMy)

✔️

ICCV 2025 (статья о датасете MEH и инструментарии для OCR иероглифов)

✔️

IEEE ISMAR 2025 (пайплайн перевода длинных текстов для дополненной реальности)

Также в прошлом году мы засветились и в СМИ:

🗣️ О проекте написали РИА Новости, Ferra, Hi-Tech Mail.ru и ряд других изданий. Руководитель проекта Илья Макаров поучаствовал в подкасте на Радио Маяк, где рассказал Александру Пушному о том, как машинное обучение справляется с древнеегипетскими иероглифами, и ответил на вопрос, сможем ли мы наконец узнать, инопланетяне ли построили египетские пирамиды.

📱В проект по-прежнему требуются Египтологи и разметчики для достижения продакшн качества. Кроме того, мы активно работаем над масштабированием наших систем и применяем полученный опыт для исследования других древних языков.

✔️Среди новых направлений — базовые модели в археологии и новые подходы для генерации синтетики, а также новые few-shot подоходы к проблеме машинного перевода.

#project #archaeology

🔬

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥15👍6✍1😎1

1.05K views09:55

🤖🤬 ~~Меня обматерила LLM-ка~~ ИИ научился сокращать тексты без потери смысла

В живой речи одно крепкое словцо часто заменяет целое предложение, при этом смысл не теряется. Наши исследователи решили проверить, может ли ИИ использовать тот же принцип.

Мы собрали словарь соответствий «нейтральная фраза → аналог с использованием обсценной лексики» и дообучили модель методами обучения с подкреплением. Иными словами, модель поощрялась только тогда, когда ей удавалось сокращать текст до заданных значений, сохранив при этом исходный смысл.

И каков результат?
✔️Короткие фразы сжались на 23% при сохранении смысла (BERTScore 0.85).
✔️Новостные тексты — аж на 65%, при этом качество суммаризации выросло.

«Наша главная цель — не научить ИИ ругаться, а использовать феномен "смысловой плотности" для улучшения алгоритмов», — подчеркнул основную идею проекта Илья Макаров.

⭐️

⭐️ Работа была принята на воркшоп AIGOV на конференции AAAI 2026 в Сингапуре — это одна из крупнейших мировых конференций по ИИ с рейтингом A*.

📻 А сегодня ведущий научный сотрудник AIRI Илья Макаров вновь посетил студию «Радио Маяк», где ответил на вопросы о том, как ИИ воспринимает матерные слова, что такое "детоксификация текстов", зачем она нужна и стоит ли запрещать нецензурную лексику в медиа.

#project #news

🔬

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁14❤8🔥7👍3🤣3

1.28K views15:14

🇷🇸🎤 Прошла конференция OpenTalks.AI 2026 в Белграде

На прошлой неделе прошла OpenTalks.AI 2026 — одна из крупнейших независимых конференций по ИИ объединяющая специалистов на постсоветском пространстве и Восточной Европе. С 2018 года она выросла с 600 участников до 1000+ профессионалов, а с 2023-го превратилась в один из главных хабов русскоязычного AI/ML-сообщества со всего мира. В 2026 году конференция впервые прошла в Белграде: 2 дня, 100+ спикеров, 3 трека — бизнес, девелопмент и наука.

🔬 Мы рассказали о том, как ИИ-агенты меняют саму логику научного исследования:

✔️ Кооперативные агенты уже сегодня могут брать на себя рутину ученого: искать литературу, запускать эксперименты в облаке, автоматически писать и рецензировать статьи
✔️ «Эмоциональный» контекст в запросах (злость, страх, радость) заметно влияет на решения языковых моделей в этических задачах и ситуациях сотрудничества — это важно учитывать везде, где ИИ принимает значимые решения
✔️ Победа в конкурсе Concordia Challenge (⭐️

⭐️

⭐️'24) - наш агент MegaMind вошёл в топ-5, научившись не просто договариваться, но и убеждать других агентов в сложных многоходовых сценариях
✔️ Победа в конкурсе Mindgames Arena (⭐️

⭐️

⭐️’25) - новый подход к обучению агентов с отложенным вознаграждением позволяет распределять награду по всей цепочке решений задним числом — чтобы ИИ думал стратегически, а не гнался за быстрым результатом.

Особенно интересными оказались доклады коллег:

✔️Руслан Салахутдинов (FAIR) рассказал про WebUI агентов, автоматизирующих поиск в интернете;
✔️Наталья Ханжина (GenAI StartUp) представила стартап в области генерации персонализированных стикеров в Телеграм;

✔️

Татьяна Шаврина (LLama team) провела краткий экскурс по последним достижениям в области ИИ-агентов;

✔️

Сергей Николенко (Synthesis AI) рассказал, как как исследование AI safety помогает предотвратить потерю контроля над развивающимся искусственным интеллектом.

Для нас OpenTalks — это не только про доклады, но и про живые разговоры, поиск новых коллабораций и встречи со старыми знакомыми. Коллеги, выпускники, стартаперы, люди построившие бизнес в ИИ собираются чтобы обсудить наболевшее, тренды и найти новые колаборации, а завершилась конференция выступлением RockBand от организатора конференции Игоря Пивоварова.

#conference #opentalks

🔬

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14✍3👍2❤1

606 views08:25

🇷🇸🎤 Прошла конференция OpenTalks.AI 2026 в Белграде На прошлой неделе прошла OpenTalks.AI 2026 — одна из крупнейших независимых конференций по ИИ объединяющая специалистов на постсоветском пространстве и Восточной Европе. С 2018 года она выросла с 600 участников…

Cooperative_AI_Agents_in_Science_and_Digital_Twin_of_Human_Interactions.pdf

4.5 MB

🔬 Скоро будет еще один пост про нашу поездку в Белград, где мы расскажем о полезных аспектах научного туризма, а пока можете ознакомиться с нашим докладом)

#conference

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍5👏2👨‍💻2

575 views08:27

Мы начинаем серию регулярных постов, в которых будем рассказывать о выпускниках и коллегах нашей лаборатории: с чего они начинали свой путь в ИИ, и чего достигли на сегодняшний день.

Первооткрывателем в этом марафоне будет Владимир Мануйлов, выпускник совместной магистерской программы KU Leuven и Университета Валенсии (Erasmus Mundus TCCM), который сейчас работает AI‑ресерчером в компании GERO.

🧬В GERO Владимир занимается «био‑ИИ», который, как он сам говорит, «не заберет у вас работу, но может помочь вам прожить дольше». Он разрабатывает генеративные модели для поиска молекул‑кандидатов в лекарства и биотехнологические применения, а их недавняя работа ProtoBind‑Diff показывает, что можно генерировать перспективные молекулы, зная только последовательность белка, без дорогостоящих 3D‑структур.

Это сильно сокращает путь от идеи до первых лабораторных проверок — в их последних экспериментах поиск «хитов» занимает минуты, а не месяцы, и стабильно показывает реальные результаты в мокрой лаборатории.

Сейчас, помимо работы над диффузионками для drug discovery, Владимир с другими участниками iMak AI Lab развивает новую «DNA LLM» — модель, которая учится на последовательностях ДНК.

🎓О своем пути от научных конкурсов до серьезных ресерч проектов — шорт-стори от самого Владимира:

«Пока что самые интересные карьерные и академические проекты у меня случались благодаря нетворку из МФТИ, и ретроспективно это меня всегда удивляет. С преподавателем лабораторных работ по физике я и мои друзья делали такие интересные проекты для “вопросов по выбору”, что они побеждали в различных конкурсах и их просили для себя старшекурсники. Другой преподаватель позвал писать диплом с одним из самых цитируемых российских ученых, в результате опубликовали совместно три q1/q2 работы. Пока писал диплом, познакомился с людьми из лаборатории - они помогли с заявкой на грант в магистратуру, и познакомили с основателями GERO, Terra Quantum, куда я затем устраивался работать. В конце концов, с Ильей Макаровым меня познакомил Радослав Нейчев (рук. MSс in AI) в нужный момент, и теперь мы вместе занимаемся очень интересными ресерч проектами».

#student_story #DNA #longevity

🔬

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14👍9❤5👏1

517 views06:31

🐋 Слушаем животных и пытаемся понять их язык

Пассивный акустический мониторинг морских млекопитающих является одним из ключевых инструментов биоакустических исследований и охраны океанской фауны. Наша команда разработала первый браузерный пайплайн на основе самообучающихся нейронных сетей для выявления акустических сигналов кашалотов в зашумлённых потоках воды с миллисекундным разрешением.

🔊Кашалоты используют характерные акустические импульсы — «щелчки» — как для эхолокации, так и для межособевой коммуникации. Анализ этих сигналов позволяет исследовать нейрокогнитивные и коммуникативные механизмы, лежащие в основе языка морских млекопитающих. Именно понимание таких механизмов — один из ключевых научных результатов нашей работы.

Детектор кашалотов с функцией live-трансляции — это флагманский проект iMak AI Lab в области биоакустики. Возможность анализировать сигналы в режиме реального времени открывает путь к непрерывному мониторингу популяций и изучению поведенческих паттернов прямо в полевых условиях.

Что сделали:
✔️ Обучили нейросеть (SSL-энкодер + BiLSTM) распознавать щелчки с точностью до 1 миллисекунды
✔️ Достигли 99% F1-score на стандартном бенчмарке Watkins
✔️ На 60% снизили число ложных тревог по сравнению с лучшими существующими методами
✔️ Система обрабатывает 1 секунду аудио всего за 40 мс на обычном GPU

Все это завернули в удобный интерактивный веб-демо: загружаешь запись, видишь форму сигнала, спектрограмму, можешь приближать нужные участки и сравнивать результаты разных алгоритмов.
Демо было представлено на ⭐️⭐️ Multimedia 2025 — одной из ведущих международных конференций по мультимедиа — в Дублине.

Небольшое лирическое отступление

Помните миелофон из «Гостьи из будущего» — устройство, способное читать мысли и расшифровывать любой язык? Это, конечно, фантастика. Но именно такого рода амбиция — научиться «слышать» и понимать нечеловеческую коммуникацию — движет нашими исследованиями. Детектор щелчков кашалотов — первый реальный шаг на этом пути: прежде чем декодировать смысл, нужно научиться надёжно выделять сам сигнал из шума.

Код, веса модели и демо — в открытом доступе. Архитектура легко адаптируется и для других видов морских животных.

🔬 Коммуникации животных — отдельное направление исследований нашей лаборатории, в фокусе летучие мыши, касатки, птицы и домашние животные, для которых требуется уже мультимодальный анализ. По аналогии с тестом Тьюринга для ИИ у нас есть свой тест Доктора Дулиттла, но о нем расскажем в в одном из наших следующих постов.

#project #animals

🔬

😌

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14👍4❤1🤩1

258 views07:01

🔬🔥 Мы на Burning Heroes уже сегодня!

Обсуждения горячих AI-исследований в необычном формате «Sell vs Grill» пройдет сегодня на дискуссионной площадке в Сан-Франциско.

Burning Heroes Founders Association — это международное сообщество для технологических фаундеров, объединяющее стартапы, инвесторов и AI-экспертов по всему миру. Burning Heroes известны своими питч-конкурсами, хакатонами и экспертными дискуссиями о передовых исследованиях в области ИИ.

⏰ Мероприятие начнется в 21:00 мск. Подключайтесь, будет burning)

🔥4👍2👏1🤩1

196 viewsedited 09:27