Научный опенсорс
598 subscribers
51 photos
1 video
98 links
Канал сообщества ITMO OpenSource, посвященного созданию и использованию наукоёмких open-source проектов, в том числе в области AI/ML.

Чат: https://t.iss.one/itmo_opensource

По всем вопросам - @nicl_nno
Download Telegram
Продолжая рубрику анонсов интересных мероприятий, расскажу ещё и о хакатоне от сообщества @phystech_genesis, тематика которого тоже связана с опенсорсом:

Хакатон Т1 2024 пройдет в Cанкт-Петербурге 15-18.11 (в гибридном формате, дедлайн на регистрацию - 13 ноября)

Треки :
- Разработка open-source WAF (Web Application Firewall), обеспечивающего максимальную защиту от различных видов инъекций;
- Разработка инструмента для оценки спринтов и анализа задач в Agile-командах.

Призы за первую тройку мест - 180к/130к/90к соответственно.

Регистрация по ссылке - https://impulse.t1.ru/hackathons/saint_petersburg_2024

Заинтересовавшися есть смысл посмотреть и другие хакатоны из их канала - например, любопытно выглядит задача "Code Review с помощью ИИ" от EВРАЗ-а.
👍53🔥1
Сделали ещё одну подборку актуальных мероприятий, которые пройдут в ближайшее время:

1) Хакатон от ЕВРАЗа - https://хакатоневраза.рф - с 29 ноября по 1 декабря 2024, формат гибридный.

Предлагают попробовать создать ИИ-чатбота для анализа программного кода на соответствие стандартам (автоматизация code review). Использовать предлагается LLM вместе с RAG. Языки - Python, TypeScript или C#.

Призовой фонд: 250-150-100к за первые три места.

2) Хакатон от Норникеля - https://nornickel-hackathon.ru/ - с 6 по 8 декабря, онлайн.

Предлагают решить задачи ИИ в промышленности по одному из трех треков: оптимизация параметров установки для обогащения руды, определение загрязненности линз камер, анализ документации.

Призовой фонд - 250-150-100к за первые три места в каждом из треков.

3) Конференция RustCon - https://rustcon.ru - 6 декабря 2024, Москва

Конференция по Rust, доклады - в том числе про опенсорсные и ML-решения на этом языке.
Для студентов предлагают скидку на билеты - 5000 вместо 24000 рублей, для первых десяти зарегистрировавшихся.
👍5🔥4🌚1
Недавно писали про конкурс КОД-ИИ-7, а вот и результаты подъехали - https://fasie.ru/press/fund/kod-ai-7-results/.

8 проектов поддержано, 4 в неопределенном статусе. Меньше, чем в прошлом году - конкурс выше 1:10.

Поздравления всем кто прошел, остальным удачи в следующий раз)
🔥11
Мы много рассказываем про свои проекты, связанные с центром ИИ, но вообще в ИТМО довольно много интересного опенсорса и у других подразделений и лабораторий.

Поэтому решили сделать небольшую подборку тематических разделов. В качестве затравки - 10 github-организаций:

1) aimclub - объединение открытых ИИ-инструментов за авторством сообщества AIM Университета ИТМО.
Ссылки: сайт.
Примеры проектов: FEDOT, BAMT, GOLEM, GEFEST, rostok, iOpt.

2) itmo-nss-team - R&D-проекты NSS Lab в области ИИ
Ссылки: сайт, tg, youtube, colab.
Примеры проектов: EPDE, torch_DE_solver.

3) Industrial-AI-Research-Lab - проекты лаборатории промышленного ИИ.
Примеры проектов: rec4u.

4) AI-chem - проекты центра "ИИ в Химии".
Примеры проектов: GEMCODE, Nanomaterial_Morphology_Prediction.
Ссылки: сайт, tg.

5) BE2RLAB - проекты лаборатории биомехатроники и энергоэффективной робототехники.
Примеры проектов: OpenSemanticMapping

6) airalab - проекты лаборатории мультиагентных систем в умных городах и индустрии 4.0.
Примеры проектов: robonomics.
Ссылки: сайт.

7) swarmtronics - проекты лаборатории посвящены моделированию роев, состоящих из простых роботов, способных к самоорганизации и выполнению сложных задач.
Примеры проектов: AMPy, swarmodroid
Ссылки: сайт.

8) СTLab-ITMO и CTLab (старый репозиторий) - проекты учебно-научной лаборатории компьютерных технологий .
Примеры проектов: fgsea, GADMA, samovar, metafast, VGLib.
Ссылки: tg.

9) LISA-ITMO - проекты учебно-научной лаборатории LISA
Примеры проектов: edylytica.
Ссылки: tg.

10) ITMO-MMRM-lab - проекты из области биологии от лаборатории MMRM.

Наверняка про кого-то не знаем, поэтому если владеете информацией - пишите в комментарии.
🔥153👍1
На открытой конференции ИСП РАН сейчас проходит секция "Российский open source: разработка библиотек в сфере ИИ" (по проектам, поддержанным ФСИ - это КОД-ИИ, например)

Трансляция для интересующихся тут - https://www.isprasopen.ru или в ВК.
Конкретная секция - в разделе "Лекторий Кинетика", выступления будут до 19-00. Программа и трансляции остальных секций - по той же ссылке.

Часть докладчиков есть в нашем чате.
👍16🔥1
В последние дни было много новостей про релизы open-source моделей различного масштаба, нацеленных на русский язык - собрал небольшую подборку:

1. T-Lite и T-Pro – открытые русскоязычные опенсорс-модели (7B, 32B)

"T-Lite — небольшая и эффективная в инференсе модель с отличными метриками, ее можно использовать для базовых задач или файнтюнинга на целевую задачу.
T-Pro подойдет для решения более широкого класса задач в промптинге или для решения более сложных задач в режиме файнтюнинга, где модели меньшего размера не справляются."

https://habr.com/ru/companies/tbank/articles/865582/

2. Сбер выкладывает GigaChat Lite в открытый доступ (20B)

"- GigaChat-20B-A3B - первая открытая MoE модель в России. В мировой практике мало кому в мире удается обучать MoE архитектуры с хорошим качеством.
- GigaChat обучен преимущественно на русском языке, поэтому не совершает грамматических и пунктуационных ошибок и не переключается на другие языки во время разговора
- В GigaChat-20B-A3B дешевый инференс сочетается с хорошими показателями метрик
- Модель отлично подходит для исследований, например, концентрации"

https://habr.com/en/companies/sberdevices/articles/865996/

3. Meno-Tiny-0.1 от "Сибирских нейросетей" (1.5B)

"Основная цель Meno-Tiny - быть частью RAG-пайплайна, решая такие задачи, как ответы на вопросы по релевантным документам, абстрактивная саммаризация, разрешение анафоры в пользовательских вопросах, определение токсичности, детоксификация и другие задачи"

https://t.iss.one/dialoger_tech/179

Дополняйте, если что-то свеженькое пропустил.
🔥18
По мотивам моего летнего выступления на SaintHighload++ 2024 коллеги из блога ИТМО сегодня выпустили пост с расширенной текстовой версией:

"Почему мы топим за открытый код в науке ― несколько слов о воспроизводимости результатов научных исследований",
https://habr.com/ru/companies/spbifmo/articles/867236.

Добавил в текст подробностей, также постарались учесть некоторые замечания из чата. Любые дополнения - приветствуются)
🔥11👍4
Минутка саморекламы: вчера неожиданно получил "звезду GitVerse" в номинации "за развитие opensource в науке".

Награждение состоялась в Москве на мероприятии GitVerse All Stars. Формат необычный - "звезды" в нескольких номинациях вручали управляющий директор СберТеха Анатолий Шипов и космонавт Денис Матвеев. Помимо награждений, рассказывали и о новых возможностях платформы.

Спасибо организаторам из gitverse.ru - призы это всегда приятно, плюс удалось увидеться вживую с несколькими активными участниками нашего чата)
🔥28👍8🏆3🤝1
Можно начать понедельник с лонгрида:

Дмитрий Кабанов опубликовал на Хабре пост "Этот год в open source", в котором собраны мнения экспертов о ключевых событиях, корпоративном прогрессе и развитии open source в России в 2024-м, а также ожиданиях на 2k25.

Я тоже немного поучаствовал - в части обсуждения перспектив опенсорса в науке и роли ИИ-инструментов в его развитии.

Обсудить публикацию и задать вопросы Дмитрию можно в комментариях поста на Хабре или прямо тут - он есть в нашем чате.
🔥17
Вышел в паблик ещё один совместный проект Лаборатории ИИ Сбера и ИТМО - библиотека RIDE (новость, описание).

RIDE позволяет повысить производительность логистических расчётов произвольного масштаба от городского до регионального или масштаба целой страны за счет сокращения время на поиск кратчайшего пути на графе. В основе подхода лежит идея кластеризации графа. Благодаря ей RIDE существенно сокращает область поиска решения и заранее исключает неоптимальные варианты маршрутов. В итоге на больших графах результат достигается до 30 раз быстрее относительно базовых алгоритмов. Реализация сделана на Python.

Отзывы и звездочки как всегда приветствуются - https://github.com/sb-ai-lab/Ride.

Это не первый наш совместный проект - например, недавно в чате писали про библиотеку для федеративного обучения stalactite.
🔥15
Коллеги из "Базальт СПО" и ИПС РАН анонсировали XX-ю конференцию "Свободное программное обеспечение в высшей школе" (OSEDUCONF-2025) - https://www.basealt.ru/20edu-conf.

Состоится 7-9 февраля 2025 года в Институте программных систем РАН в Переславле-Залесском Ярославской области.
Заявки на доклады - до 12 января.

Тематики заявлены такие:

"- Использование свободного ПО в учебном процессе: разработка, внедрение, преподавание.
- Научные проекты, связанные с разработкой и использованием свободного программного обеспечения.
- Внедрение СПО в инфраструктуру образовательной организации: проблемы и решения.
- Социальные и экономико-правовые особенности применения свободного программного обеспечения в высшей школе.
- Студенческие проекты разработки СПО.

"Доклады принимаются только по тематике свободного ПО. Доклады о бизнесе, рекламные и о проприетарном ПО запрещены. Если тема доклада связана с разработкой ПО, заявка должна содержать ссылку на сам код, опубликованный в любом общедоступном репозитории под любой свободной лицензией."

Наш опыт с этой конференцией вполне позитивный: мероприятие интересное и содержательное, позволяет пересечься с довольно разнообразным срезом опенсорсных движений, существующих в России. От нас в прошлом году был доклад Андрея Гетманова про опенсорс-сообщество ИТМО. Нетворкинг тоже оказался довольно полезен - например, узнали о опенсорс-сообществе коллег из ФКН ВШЭ. Плюс необычная локация, конечно)
🔥8
Узнал тут о интересном международном сообществе https://www.pyopensci.org. Его фокус - поддержка открытых инструментов для обработки научных данных, реализованных на Python.
Базируются, судя по всему, в Сан-Франциско.

- Самое интересное: предлагается опция peer-review опенсорсных проектов. При этом ревью потом зачитывается в открытом Journal of Open Source Software.
Cами ревью делаются на гитхабе, их можно посмотреть.

- Также есть довольно обширные руководства по тому как создавать научные пакеты.

- Организуют виртуальные мероприятия в духе "фестивалей открытой науки".

- В блоге тоже всякое интересное пишут. Например, размышляют про свою финансовую модель.

В общем, выглядит очень достойно и полезно. Если кто-то попробует туда что-то закинуть на ревью или как-то ещё поучаствует - поделитесь потом своим опытом.
👍10🔥1
В качестве подведения итогов года от нашего сообщества ITMO.OpenSource:

- Провели пять митапов, онлайновых и очных;
- Сделали два масштабных исследования опенсорс-ландшафта;
- Реализовали несколько успешных коллабов;
- Улучшили свои существующие научные опенсорс-проекты и выкатили пару новых;
- Стартовали разработку инструмента для поддержки опенсорс-разработки на основе LLM-агентов.

В следующем году обязательно будем продолжать наши активности, в том числе митапные. Так что если есть про что рассказать - можете уже оставлять заявки)

Всех с наступающим 2к25!
🎄14🎉64👍2🫡1
Добавили в наш репозиторий open-source-ops две новых туториала от Юрия Каминского:

- Про настройку авто-форматирования кода с помощью Black через Github Actions - ссылка;
- Про создания документации с помощью MkDocs, с примером из нашего проекта applyBN - ссылка;

Всё основано на нашем опыте, т.к. сами активно используем эти инструменты. Надеемся, будем полезно.

Ну и если с самим репозиторием ещё не знакомы - загляните, там много руководств, шаблонов и подборок. Issue и PR-ы с улучшениями - как всегда, приветствуются.
👍10🔥65
Перекину анонс интересной конференции про математику в ИИ, в которой решили поучаствовать. Можно подаваться как в non-archival формате (только выступление), так и c публикацией Journal of Mathematical Sciences. В любом случае с отбором по итогам ревью.
🔥6
Forwarded from NSS Lab News (Sasha Hvatov)
Всем привет.

В рамках взращивания своего, отечественного, решили поучаствовать в конференции MathAI 2025. Она пройдёт в конце марта (24.03-28.03) в Сириусе.

Конференция проводится первый раз, обещают проводить строгий отбор. Есть и минусы: пока что для большинства статей планируется non-archival формат, то есть, без публикаций.

Зачем тогда это нужно?

- Аспирантам - выступление на конференции всё ещё засчитывается в показатели.
- Всем, кто подаёт на А* - подача через openreview.net (к слову, говорят, что сейчас валидация профиля проходит около двух недель).
- Вообще всем - посмотреть, что делается в России по ИИ. Нетворкинг, получается.

Что нужно делать (всё как всегда):

- До 1 февраля подать абстракт сюда
- До 20 февраля статью
- Дальше ребуталы, метаревью

В любом случае, регайтесь на openreview.net, не помешает. =)
🔥7
Коллеги из СберТеха сегодня опубликовали своё opensource-исследование. Тоже таким занимаемся, так что почитать было весьма интересно.

Исследование основано на анализе большого числа открытых профилей и репозиториев на github-е. Интересного много, от оценок активности в репозиториях до популярных инструментов СI/CD.

Про наш недавний материал тоже упоминают, с выводами - соглашаются)

Полная версия - тут, данные - в репо на gitverse.
🔥8👏1