В цикле хабропостов Дмитрия Кабанова, посвященном опенсорсу, вышел новый материал - расширенный вариант одного из докладов с нашей секции Datafest:
От экосистемы KScience к опенсорс-хабу — рассказывает Александр Нозик, директор Центра научного программирования
Внутри - много подробностей про экосистему KScience, опыте опенсорс-разработчиков решений с бизнесом, а также обсуждение концепции университетского open source-хаба и его потенциальной финансовой модели.
При этом, если мы фокусируемся больше на опенсорсе в науке (пусть и с большим креном в сторону AI/ML), то тематику нового хаба (создаваемого на базе МФТИ) Александр обозначил как "Индустриальный open-source" (уже есть чат хаба, в котором можно поучаствовать всем заинтересованным).
От экосистемы KScience к опенсорс-хабу — рассказывает Александр Нозик, директор Центра научного программирования
Внутри - много подробностей про экосистему KScience, опыте опенсорс-разработчиков решений с бизнесом, а также обсуждение концепции университетского open source-хаба и его потенциальной финансовой модели.
При этом, если мы фокусируемся больше на опенсорсе в науке (пусть и с большим креном в сторону AI/ML), то тематику нового хаба (создаваемого на базе МФТИ) Александр обозначил как "Индустриальный open-source" (уже есть чат хаба, в котором можно поучаствовать всем заинтересованным).
Хабр
От экосистемы KScience к опенсорс-хабу — рассказывает Александр Нозик, директор Центра научного программирования
В начале лета меня пригласили на Data Fest 2025 в секцию по менеджменту и научным инициативам в open source. Делюсь расшифровкой доклада, но не своего, а одного из коллег по секции. Это — Александр...
👍9
Недавно обещал рассказать про то, как статью о нашем инструменте OSA приняли на воркшоп CODEML конференции ICML 2025.
Формат воркшопа любопытный - рассматривают статьи про новые ML-проекты с открытым кодом, багфиксы и улучшения в существующих, опыт разработки и предложения по улучшению процессов.
Поэтому написали туда короткую статью с описанием Осы и небольшими экспериментами по оценка качества генерации README и его сравнению с аналогами (ReadmeAI и др.). Получилось, на мой взгляд неплохо - с чем рецензенты и согласились.
Публикации non-archival - так что учтем полученные рецензии (довольно содержательные и позитивные) и подадим куда-нибудь ещё. Из минусов - нужна анонимизация (мне кажется, что для статей про опенсорс это несколько излишне).
Порадовало что организаторы отнесли нашу статью к категории spotlight - т.е. предложили выступить с докладом, а не только с постером. К сожалению, вживую добраться до ICML не удалось (получить визу в Канаду непросто) - но с доставкой постера помогли коллеги из AIRI, так что на воркшопе мы засветились (см. фото).
Текст статьи доступен на openreview, код - всё в том же репозитории https://github.com/aimclub/OSA.
Формат воркшопа любопытный - рассматривают статьи про новые ML-проекты с открытым кодом, багфиксы и улучшения в существующих, опыт разработки и предложения по улучшению процессов.
Поэтому написали туда короткую статью с описанием Осы и небольшими экспериментами по оценка качества генерации README и его сравнению с аналогами (ReadmeAI и др.). Получилось, на мой взгляд неплохо - с чем рецензенты и согласились.
Публикации non-archival - так что учтем полученные рецензии (довольно содержательные и позитивные) и подадим куда-нибудь ещё. Из минусов - нужна анонимизация (мне кажется, что для статей про опенсорс это несколько излишне).
Порадовало что организаторы отнесли нашу статью к категории spotlight - т.е. предложили выступить с докладом, а не только с постером. К сожалению, вживую добраться до ICML не удалось (получить визу в Канаду непросто) - но с доставкой постера помогли коллеги из AIRI, так что на воркшопе мы засветились (см. фото).
Текст статьи доступен на openreview, код - всё в том же репозитории https://github.com/aimclub/OSA.
🔥19❤3⚡3🤩2👍1
Всем летний привет от нашего сообщества!
Рады анонсировать внеочередной Scientific Open Source Meetup от нашего сообщества ITMO Opensource, который пройдет 24 июля 2025 года с 18:30 до 22:00 в Санкт-Петербурге.
Формат необычный - митап частично проводится как элемент обучения в рамках программы дополнительного профессионального образования для преподавателей и руководителей образовательных программ подготовки топ-специалистов в области ИИ. Поэтому и уклон выступлений - в сторону образования. Из-за ограниченной вместимости площадки, для широкой публики все выступления будут доступны в формате live-трансляции.
Какие доклады будут в программе митапа:
- Николай Никитин, руководитель группы научно-технического развития, Институт ИИ ИТМО - Практики создания и поддержки культуры и экосистемы открытого кода в сфере ИИ в университете
- Владислав Терещенко, аспирант лаборатории LISA, ИТМО - Как мы научили LLM-ассистента рецензировать научные работы студентов ИТМО: вновь о проекте Edulytica
- Юлия Борисова, аспирант лаборатории NSS, ИТМО - Репозитории и опенсорс для студентов - что, зачем и как?
- Дмитрий Чуканов, ведущий эксперт по технологиям GitVerse - GitVerse — пространство для развития, обучения и новых открытий
- Олег Сиротюк, лидер сообщества OpenScaler - Секреты DeepSeek: академический open source как катализатор китайских инноваций и технологической независимости
Мероприятие проходит при поддержке:
OpenScaler — сообщество разработчиков ОС с открытым исходным кодом. Они уже несколько лет исследуют китайскую open-source экосистему, а также ведут канал Китай.AI, где публикуют и разбирают статьи из первоисточников про достижения Китая в ИИ. На этот раз коллеги расскажут о том, как в Китае opensource применяется в образовании.
Дата: 24 июля 2025 года
Время: 18:30 - 22:00
Место: онлайн
Ждем вас в трансляции в четверг!
Рады анонсировать внеочередной Scientific Open Source Meetup от нашего сообщества ITMO Opensource, который пройдет 24 июля 2025 года с 18:30 до 22:00 в Санкт-Петербурге.
Формат необычный - митап частично проводится как элемент обучения в рамках программы дополнительного профессионального образования для преподавателей и руководителей образовательных программ подготовки топ-специалистов в области ИИ. Поэтому и уклон выступлений - в сторону образования. Из-за ограниченной вместимости площадки, для широкой публики все выступления будут доступны в формате live-трансляции.
Какие доклады будут в программе митапа:
- Николай Никитин, руководитель группы научно-технического развития, Институт ИИ ИТМО - Практики создания и поддержки культуры и экосистемы открытого кода в сфере ИИ в университете
- Владислав Терещенко, аспирант лаборатории LISA, ИТМО - Как мы научили LLM-ассистента рецензировать научные работы студентов ИТМО: вновь о проекте Edulytica
- Юлия Борисова, аспирант лаборатории NSS, ИТМО - Репозитории и опенсорс для студентов - что, зачем и как?
- Дмитрий Чуканов, ведущий эксперт по технологиям GitVerse - GitVerse — пространство для развития, обучения и новых открытий
- Олег Сиротюк, лидер сообщества OpenScaler - Секреты DeepSeek: академический open source как катализатор китайских инноваций и технологической независимости
Мероприятие проходит при поддержке:
OpenScaler — сообщество разработчиков ОС с открытым исходным кодом. Они уже несколько лет исследуют китайскую open-source экосистему, а также ведут канал Китай.AI, где публикуют и разбирают статьи из первоисточников про достижения Китая в ИИ. На этот раз коллеги расскажут о том, как в Китае opensource применяется в образовании.
Дата: 24 июля 2025 года
Время: 18:30 - 22:00
Место: онлайн
Ждем вас в трансляции в четверг!
🔥13❤1👍1
Небольшое объявление для тех, кто хочет попробовать себя на научной позиции в сфере AI/ML:
У нас Институте ИИ ИТМО открылось несколько вакансий уровня junior и middle, от NSS Lab и AI Industrial Research Lab.
Среди тематики выделали три основных трека: по AI4Science, AI4Industry и по мультиагентным LLM.
В ходе работы можно будет и поучаствовать в разработке наших многочисленных open-source решений, и поресерчить на уровне A* / Q1.
Так что если ищете позицию с уклоном в разработку ПО - такие тоже есть.
Все подробности и форма для откликов - тут (по ссылке - канал NSS Lab, там периодически пишем о наших достижениях и результатах).
У нас Институте ИИ ИТМО открылось несколько вакансий уровня junior и middle, от NSS Lab и AI Industrial Research Lab.
Среди тематики выделали три основных трека: по AI4Science, AI4Industry и по мультиагентным LLM.
В ходе работы можно будет и поучаствовать в разработке наших многочисленных open-source решений, и поресерчить на уровне A* / Q1.
Так что если ищете позицию с уклоном в разработку ПО - такие тоже есть.
Все подробности и форма для откликов - тут (по ссылке - канал NSS Lab, там периодически пишем о наших достижениях и результатах).
🔥7❤1
Вышел лонгрид от ICT Moscow про отечественные LLM и различные подходы к их созданию: Остаться в седле: кто и как в России обучает модели искусственного интеллекта.
Мне материал показался интересным, достаточно системно рассмотрены релизы ИИ-моделей этого года, опрошены эксперты как из бигтеха и университетов, так и стартапов.
Наверное, в не-бигтеховую часть подборки можно было бы включить мини-модели от "Сибирских нейросетей". Но, вероятно, не вошли по дате релиза.
Мы в ИТМО свои наработки по до-обучению специализированных моделей тоже ещё пока не успели опубликовать.
P.S. Про вчерашние open-source модели от OpenAI все, вероятно, уже прочитали. По метрикам выглядит многообещающе, у себя тоже попробуем поднять GPT-OSS-20B и протестировать в составе наших мультиагентных LLM-инструментов, вместо текущей Gemma 3 27b.
Мне материал показался интересным, достаточно системно рассмотрены релизы ИИ-моделей этого года, опрошены эксперты как из бигтеха и университетов, так и стартапов.
Наверное, в не-бигтеховую часть подборки можно было бы включить мини-модели от "Сибирских нейросетей". Но, вероятно, не вошли по дате релиза.
Мы в ИТМО свои наработки по до-обучению специализированных моделей тоже ещё пока не успели опубликовать.
P.S. Про вчерашние open-source модели от OpenAI все, вероятно, уже прочитали. По метрикам выглядит многообещающе, у себя тоже попробуем поднять GPT-OSS-20B и протестировать в составе наших мультиагентных LLM-инструментов, вместо текущей Gemma 3 27b.
🔥11
Коллеги из Yandex анонсируют опенсорсные активности вокруг платформы SourceCraft:
- Рейтинг репозиториев на SourceCraft с лайками и ачивками. Про лучшие проекты обещают написать в канале, а авторов - снабдить мерчом.
Наверное, на будущее не хватает каких-то фильтров по языкам и тематикам.
- Очередной цикл уже традиционной грантовой программы от Yandex Open Source, подавать заявки можно будет с середины августа и до 15 марта 2026. Но в этом году репозитории-кандидаты должны быть размещены именно на SourceCraft-е.
- Рейтинг репозиториев на SourceCraft с лайками и ачивками. Про лучшие проекты обещают написать в канале, а авторов - снабдить мерчом.
Наверное, на будущее не хватает каких-то фильтров по языкам и тематикам.
- Очередной цикл уже традиционной грантовой программы от Yandex Open Source, подавать заявки можно будет с середины августа и до 15 марта 2026. Но в этом году репозитории-кандидаты должны быть размещены именно на SourceCraft-е.
opensource.yandex
Программа грантов Yandex Open Source × SourceCraft
Поддерживаем внешние опенсорс-проекты независимыx разработчиков — теперь совместно с SourceCraft
❤9👍2❤🔥1🔥1
В канале pythonl узнал про любопытный open-source инструмент - https://github.com/HKUDS/DeepCode
C его помощью можно генерировать полноценные репозитории с кодом (включая не только алгоритмы, но и фронтенд и бекенд) на основе текста научной статьи:
- Paper2Code — реализация идей из исследований в рабочий код;
- Text2Web — генерация веь-интерфейсов по описанию ;
- Text2Backend — автоматическое создание масштабируемой серверной части;
- Поддержка длинных документов и больших проектов.
Тестируют планируют на бенчмарке по воспроизводимости научных статей (PaperBench), но это пока future plans.
В целом, выглядит весьма интересно, часть функциональности близка к нашей разработке OSA (у нас в планах как раз авто-анализ соответствия текста статьи и документации коду). Внутренняя реализация тоже схожа - внутри MAS LLM с множеством агентов и тулов.
У авторов проекта вообще очень сильный задел - ранее они выкатывали довольно популярные AutoAgent, AI-Researcher, Auto-Deep-Research, RAG-Anything и другие LLM-based инструменты.
Насколько DeepCode будет используем на практике - надо смотреть; но вообще концептуально ситуация когда код статьи надо с нуля восстанавливать по тексту - она какая-то не очень здоровая.
C его помощью можно генерировать полноценные репозитории с кодом (включая не только алгоритмы, но и фронтенд и бекенд) на основе текста научной статьи:
- Paper2Code — реализация идей из исследований в рабочий код;
- Text2Web — генерация веь-интерфейсов по описанию ;
- Text2Backend — автоматическое создание масштабируемой серверной части;
- Поддержка длинных документов и больших проектов.
Тестируют планируют на бенчмарке по воспроизводимости научных статей (PaperBench), но это пока future plans.
В целом, выглядит весьма интересно, часть функциональности близка к нашей разработке OSA (у нас в планах как раз авто-анализ соответствия текста статьи и документации коду). Внутренняя реализация тоже схожа - внутри MAS LLM с множеством агентов и тулов.
У авторов проекта вообще очень сильный задел - ранее они выкатывали довольно популярные AutoAgent, AI-Researcher, Auto-Deep-Research, RAG-Anything и другие LLM-based инструменты.
Насколько DeepCode будет используем на практике - надо смотреть; но вообще концептуально ситуация когда код статьи надо с нуля восстанавливать по тексту - она какая-то не очень здоровая.
🔥8❤1👍1
Не будем нарушать традицию анонсов этого цикла опенсорсных конференций:
«Базальт СПО» при поддержке Института программных систем им. А.К. Айламазяна РАН проводит "XXI конференцию разработчиков свободных программ". Она состоится 3-5 октября 2025 года в городе Переславле-Залесском на базе ИПС РАН.
7 сентября заканчивается прием заявок на участие в качестве докладчика, слушателям можно регистрироваться до 1 октября.
Тематики следующие:
- Разработка свободного программного обеспечения;
- Новейшие достижения проектов СПО;
- Формирование сообщества разработчиков СПО;
- Философские, культурные и правовые аспекты свободного ПО;
- Студенческие проекты разработки СПО;
- Разработка свободного аппаратного обеспечения (OSHW).
Заявлены следующие ограничения:
- Доклады о проприетарном ПО и бизнесе не допускаются.
- Если тема доклада связана с разработкой ПО, заявка должна содержать ссылку на код, опубликованный в любом общедоступном репозитории под любой свободной лицензией (по определению ГОСТ Р 54593-2011, FSF или OSI).
- Если тема доклада связана с разработкой свободного аппаратного обеспечения (OSHW), то все материалы проекта должны быть опубликованы в соответствии с требованиями Open Source Hardware (OSHW) Definition.
Актуальная информация о регистрации и участии публикуется на странице конференции. Там же будут размещены программа конференции и электронная версия сборника тезисов докладов.
Участие для докладчиков и слушателей бесплатное. Будет онлайн-трансляция.
На прошлогодней конференции от нас выступал Андрей Гетманов с докладом "Создание научного Open Source-сообщества — опыт ИТМО". На эту конференцию тоже постараемся добраться и рассказать про наши новые результаты - в частности про активно развиваемый улучшатель репозиториев OSA.
«Базальт СПО» при поддержке Института программных систем им. А.К. Айламазяна РАН проводит "XXI конференцию разработчиков свободных программ". Она состоится 3-5 октября 2025 года в городе Переславле-Залесском на базе ИПС РАН.
7 сентября заканчивается прием заявок на участие в качестве докладчика, слушателям можно регистрироваться до 1 октября.
Тематики следующие:
- Разработка свободного программного обеспечения;
- Новейшие достижения проектов СПО;
- Формирование сообщества разработчиков СПО;
- Философские, культурные и правовые аспекты свободного ПО;
- Студенческие проекты разработки СПО;
- Разработка свободного аппаратного обеспечения (OSHW).
Заявлены следующие ограничения:
- Доклады о проприетарном ПО и бизнесе не допускаются.
- Если тема доклада связана с разработкой ПО, заявка должна содержать ссылку на код, опубликованный в любом общедоступном репозитории под любой свободной лицензией (по определению ГОСТ Р 54593-2011, FSF или OSI).
- Если тема доклада связана с разработкой свободного аппаратного обеспечения (OSHW), то все материалы проекта должны быть опубликованы в соответствии с требованиями Open Source Hardware (OSHW) Definition.
Актуальная информация о регистрации и участии публикуется на странице конференции. Там же будут размещены программа конференции и электронная версия сборника тезисов докладов.
Участие для докладчиков и слушателей бесплатное. Будет онлайн-трансляция.
На прошлогодней конференции от нас выступал Андрей Гетманов с докладом "Создание научного Open Source-сообщества — опыт ИТМО". На эту конференцию тоже постараемся добраться и рассказать про наши новые результаты - в частности про активно развиваемый улучшатель репозиториев OSA.
👍7🔥2
Пишут о запуске новой грантовой программы "Код без границ" от GitVerse, совместно с Cloud. ru и Хабром.
Обещают финансовую поддержку (150к, 100к и 50к рублей за 1, 2 и 3 места в каждой из четырех номинации), вычислительные ресурсы и менторинг для опенсорсных проектов.
Выглядит как полезный формат для поддержки небольших опенсорсных проектов, в том числе студенческих.
Номинации следующие:
1) AI-инновации: проекты, использующие искусственный интеллект для решения технологических задач: новые алгоритмы, фреймворки, AI-инструменты, реализации мультиагентных и RAG-систем и другие;
2) Наука и образование: проекты, направленные на улучшение образовательных процессов или научных исследований с использованием открытых технологий;
3) Проекты для всех: приложения и сервисы для конечного пользователя, средства коммуникации, программы для просмотра и редактирования файлов, цифровые помощники.
4) Разработка для разработчиков: проекты, которые ускоряют и облегчают работу. AI-инструменты разработки (кодовые ассистенты, ассистенты DevOps).
Из ограничений - проекты должны быть независимыми от конкретных компаний, а также размещаться на платформе gitverse (возможно и зеркалирование с других площадок).
Заявки - до 31 октября, результаты - в декабре.
Обещают финансовую поддержку (150к, 100к и 50к рублей за 1, 2 и 3 места в каждой из четырех номинации), вычислительные ресурсы и менторинг для опенсорсных проектов.
Выглядит как полезный формат для поддержки небольших опенсорсных проектов, в том числе студенческих.
Номинации следующие:
1) AI-инновации: проекты, использующие искусственный интеллект для решения технологических задач: новые алгоритмы, фреймворки, AI-инструменты, реализации мультиагентных и RAG-систем и другие;
2) Наука и образование: проекты, направленные на улучшение образовательных процессов или научных исследований с использованием открытых технологий;
3) Проекты для всех: приложения и сервисы для конечного пользователя, средства коммуникации, программы для просмотра и редактирования файлов, цифровые помощники.
4) Разработка для разработчиков: проекты, которые ускоряют и облегчают работу. AI-инструменты разработки (кодовые ассистенты, ассистенты DevOps).
Из ограничений - проекты должны быть независимыми от конкретных компаний, а также размещаться на платформе gitverse (возможно и зеркалирование с других площадок).
Заявки - до 31 октября, результаты - в декабре.
🔥9