Открытый код ФКН ВШЭ
815 subscribers
28 photos
90 links
Показываем новости по открытому коду ФКН ВШЭ.

Контакты: Михаил Гущин @mhushchyn
Download Telegram
Linguacodus

Фреймворк, использующий большие языковые модели для автоматизации преобразования описания задач в код Python. Linguacodus решает эту задачу путем развертывания динамического конвейера, который итеративно преобразует описания задач на естественном языке в код с помощью высокоуровневых инструкций на основе данных. Фреймворк работает в 4 этапа: генерация описания задачи, где модель описывает данные, препроцессинг, архитектуру модели и прочие важные детали; тюнинг Llama2 на основе полученной информации; инференс Llama2, позволяющий отобрать три лучшие инструкции; и итеративный процесс улучшения ответов с помощью мульти-агентной языковой модели. В серии экспериментов на датасете с кодом для машинного обучения авторы демонстрируют эффективность своего метода по генерации кода. Фреймворк будет полезен как исследователям в области языковых моделей и генерации кода, так и прикладным специалистам машинного обучения.

статья|код
🔥101
Forwarded from Yandex Open Source Jam /chat
Всем привет! ❤️

Мы с отличными новостями: уже 23 октября, ровно через полгода после первого Yandex Open Source Jam, пройдет второй. На этот раз мы едем в Санкт-Петербург!

Вас ждут несколько крутых анонсов, доклады, задачки, общение с экспертами из Яндекса и других компаний, а для очных участников — еще и открытый микрофон на афтепати

В программе:

🏮Антон Полухин с рассказом про userver

🧬Никита Соболев с лайфхаками из многолетнего опыта в опенсорсе

🎊Экспо-зона от Яндекс Go, Yandex Cloud и Yandex Infrastructure

…и еще очень много всего интересного!

Регистрируйтесь по ссылке на онлайн и очное участие в Петербурге.

Мы вас очень ждем ❤️ до встречи!

Всегда ваша,
Команда Yandex Open Source
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
Вебинары по разработке кода для всех

Приглашаем вас на серию открытых вебинаров по разработке кода. Мы обсудим командную работу над проектами на платформе Github, научимся создавать воспроизводимые и качественные проекты, а также публиковать их на известных ресурсах открытого кода.

Докладчик:
Павел Ахтямов
Release Engineer в PhotoLab Development. Биоинформатик в ЭНЦ. Преподаватель МФТИ, МГТУ им. Баумана, ВШЭ, ЦУ

Даты и темы:
⭐️ 04.10 Система контроля версий Git. Работа и авторизация с GitHub. Оформление в формате Markdown. Лицензии кода.

⭐️ 11.10 Структура ветвления в Git и GitHub. Механизм Pull Request. Проведение Code Review в проектах. Разные стратегии ветвления проектов. Процедуры воспроизведения проектов.

⭐️ 18.10 Автоматизация сборки проектов с использованием Github Actions. Инструменты проверки качества проекта.

⭐️ 01.11 Основы контейнеризации проектов. Публикация проектов в Docker Registry, PyPi, CRAN.

🕝 Когда: пятницы 18:10
🖥 Где: zoom

Следите за анонсами на канале.
23🔥7
StyleFeatureEditor

Библиотека на Python, позволяющая обучать модель для редактирования изображения. В основе работы лежит новый подход к обучению StyleGan, позволяющий одновременно редактировать изображения в мало- и высокоразмерном пространствах, благодаря чему появляется возможность получать желаемые тонкие детали у редактируемого изображения и вместе с этим сохранить их при обратном переходе в исходное пространство. Авторы демонстрируют превосходное качество подхода даже для сложных, внедоменных изображений, добиваясь практически неотличимого правдоподобия полученных изображений, а также обходя в численных метриках другие методы. Код может быть полезен исследователям в области генеративных моделей и разработчикам приложений для редактирования фотографий.

статья | код
🔥9
До митапа всего 4 дня!

Напоминаем, что он состоится 8 октября в 19:00 в Loft Story (ул. Газовая, 10Ж), а зарегистрироваться можно здесь.

Митап пройдёт в рамках проекта «Научный Петербург». В программе будут доклады про китайский опенсорс от наших коллег из сообщества OpenScaler, питчи LLM-ассистента для проверки научных работ и библиотеки по обработке и генерации векторной графики, а ещё — безумные идеи хранения данных. Полная версия программы доступна здесь.

До встречи на митапе!

Митап организован при поддержке Центра научной коммуникации ИТМО, сообщества OpenScaler и исследовательского центра «Сильный ИИ в промышленности».
Проект поддержан Министерством науки и высшего образования РФ.
#десятилетиенауки #МинобрнаукиРоссии #популяризациянауки
👍6
gen-simplicial-cycles

Код на python, в котором реализованы некоторые классические, а так же авторские алгоритмы, основанные на llm, позволяющие генерировать циклы в симплициальных группах. В частности, в симплициальной групповой настройке формулы Ву авторы переформулируют проблему генерации симплициальных циклов как проблему выборки из пересечения алгоритмических наборов данных, связанных с языками Дика. Исследователи представляют и оценивают подходы к языковому моделированию, которые используют многометковую информацию для входных последовательностей и большие языковые модели, вместе с необходимым теоретико-групповым инструментом и не нейросетевыми базовыми алгоритмами. Построенные на идее ансамблирования генераторов, дополнительная многометковая информация добавляется в обучающий набор данных, что позволяет одной модели работать как обобщение ансамбля. Полученные авторами модели, в отличие от базовых, масштабируемы и будут служить строительными блоками для будущих алгоритмов, специализированных на выборке из гомотопических групп пространств. Код может быть полезен математикам и DL-исследователям, работающим на стыке машинного обучения и топологии.

статья|код
👍4🔥4🤔1
Открытый код ФКН ВШЭ
Вебинары по разработке кода для всех Приглашаем вас на серию открытых вебинаров по разработке кода. Мы обсудим командную работу над проектами на платформе Github, научимся создавать воспроизводимые и качественные проекты, а также публиковать их на известных…
Привет!

Сегодня в 18:10 мы продолжаем наши вебинары.

Тема:
Структура ветвления в Git и GitHub. Механизм Pull Request. Проведение Code Review в проектах. Разные стратегии ветвления проектов. Процедуры воспроизведения проектов.

🖥 Где: zoom

А еще появилась ссылка на запись прошлого вебинара!
❤‍🔥10👍2
Forwarded from ODS Events
Привет!

VK RecSys Challenge: запустили соревнование с AI VK 🔥

To like or not to like? Вот в чем вопрос!
Приглашаем принять участие всех, кто занимается рексистемами и хочет еще лучше прокачать свои навыки в построении моделей на реальной задаче компании 😎

Соревнование длится до 22 декабря, можно участвовать как индивидуально, так и объединяться в команды.

Чтобы узнать все детали и стать участником — переходите на страницу соревнования ⬅️👀

🦜 Хаб VK на ods.ai
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Бесплатный онлайн-курс по Git

Центр непрерывного образования факультета компьютерных приглашает присоединиться к бесплатному онлайн-курсу «Введение в GIT» тех, кто начинает свой путь в программировании и разработке. 

Курс состоит из 5 уроков:
- Что такое Git?
- Добавление изменений в коммит и загрузка на удалённый репозиторий
- Управление изменениями, отмена операций, выбор определённого коммита
- Работа с ветками в репозитории
- Слияние веток, merge и rebase, политики работы с ветками

В Центре непрерывного образования в онлайн-формате можно освоить и другие навыки, необходимые для входа в IT: Python, SQL, инструменты бизнес-аналитики. У курсов есть бесплатные модули, к которым вы можете присоединиться уже сейчас. Подробная информация: в телеграм-канале Центра.


Присоединиться и начать изучать Git
9👍4🔥2
Truth-O-Meter

Разработанный на Python проект, позволяющий проверять достоверность сгенерированного большими языковыми моделями текста. Авторы приложения утверждают, что их метод позволяет детектировать галлюцинации и фактологические ошибки, производя веб-поиск по сгенерированному LLM тексту. После чего пользователь может получить скорректированный программой текст, подсвечивающий неточности и приводящий ссылки на достоверные источники в интернете. В серии работ авторы рассказывают о различных аспектах проекта, а так же проверяют состоятельность метода на датасете FEVER. Работа может быть полезна исследователям, работающими с генеративными и большими языковыми моделями, инженерам и Data Science специалистам.

статья|код|демо
9🔥3
Guide-and-rescale

Код, позволяющий тренировать и инференсить диффузионную модель, способную редактировать изображение по текстовому запросу. В своей работе авторы исследуют метод гайденса для модели, благодаря которой траектория, вдоль которой семплируюется шум в диффузионной модели, не выходит из реального распределения данных. Это, в свою очередь, позволяет получить качественные и реалистичные изображения. Для достижения результата авторы вводят специальные энергетические функции, сохраняющие локальные свойства объектов на изображениях. Исследователи утверждают, что их подход эффективен с точки зрения вычислений, а так же показывают в ряде экспериментов его состоятельность. Код может быть полезен DL-исследователям, Data Science специалистам и ML-инженерам.

статья | код
5👍3
Truck

Проект с открытым исходным кодом, посвященный созданию и развитию 2.5D автономного транспортного средства на основе модели рулевого управления Аккермана, рассчитанного на пользование внутри помещения. Для перемещения робот использует систему лидаров, данные с которых затем обрабатываются нейросетями на микрокомпьютере Jetson для точной и быстрой навигации. Для управления всей системой авторы сконструировали и запрограммировали контроллеры и микропроцессоры, учитывая кинематические и электротехнические особенности своего робота. Проект может быть интересен программистам микроконтроллеров, специалистам по робототехнике, инженерам-разработчикам беспилотного транспорта, специалистам по машинному и глубокому обучению, а так же студентам, заинтересованным в изучении этих дисциплин.

код
🔥41👍1
Открытый код ФКН ВШЭ
Вебинары по разработке кода для всех Приглашаем вас на серию открытых вебинаров по разработке кода. Мы обсудим командную работу над проектами на платформе Github, научимся создавать воспроизводимые и качественные проекты, а также публиковать их на известных…
Привет!

Сегодня в 18:10 у нас последний вебинар по разработке кода. Подключайтесь послушать и задать свои вопросы. Ждем вас!

Тема:
Основы контейнеризации проектов. Публикация проектов в Docker Registry, PyPi, CRAN.

🖥 Где: zoom

Все записи вебинаров выкладываем здесь!
🔥72
TensorNorm

Код на python, позволяющий считать и контролировать спектральную норму матрицы Якоби. Задача естественным образом возникает в обучении больших сверточных моделей. В своей работе авторы предлагают использовать тензоную спектральную норму для вычисления нормы всего сверточного слоя. Код вычисления нормы инвариантен к входному разрешению картинки и может быть эффективно вычислен во время обучения. В работе авторы выводят теоретическую верхнюю границу нормы, а в серии экспериментов показывают состоятельность метода, демонстрирую лучшую обобщающую способность моделей, регуляризированных с помощью данного подхода. Авторы также показывают, что их алгоритм показывает компромисс между точностью и скоростью вычисления. Код может быть полезен DL-исследователям разных областей и data-science специалистам.

код | статья
7🔥2🤔1
Forwarded from Yandex for Developers
🗂 14 декабря Яндекс проведёт Ночь опенсорс-библиотек для всех, кто интересуется открытым кодом

Вы станете частью открытого комьюнити и сможете познакомиться с разработчиками знаковых проектов и внести свой вклад в их развитие, даже если это ваш первый коммит.

Что вас ждёт:

🔴 Хакатоны, вокршопы и развлечения от мейнтейнеров наших опенсорс-проектов в разных стеках

🔴 Экскурсии и квесты по библиотеке, книжная лавка, концерт и сайлент-диско

Кого зовём:

🔴 Фронтендеров — познакомиться с разработкой функциональных интерфейсов в Gravity UI, научиться супербыстро кодить в HTML/CSS с Emmet и автоматизировать задачи с zx

🔴 Бэкендеров — узнать, как используют YDB для решения самых разных задач и как автоматизируют всю документацию в Diplodoc. А плюсовикам будет особенно интересно пообщаться с разработчиками userver

🔴 Мобильных разработчиков — задать все вопросы о кросс-платформенной разработке приложений создателям фреймворка DivKit

🔴 ML-специалистов — познакомиться с реальными кейсами оптимизации обучения с помощью CatBoost и YaFSDP

🔴 Аналитиков — построить дашборд с аналитикой по опенсорсным репозиториям Яндекса в DataLens

➡️ Узнать, как пройти в библиотеку (и зарегистрироваться), можно по ссылке.

💓 Приходите, если вы, как и мы, открыты для открытого кода.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь:
💬 @Yandex4Developers
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥81
DAIseg

Код, реализующий точный метод DAIseg для определения участков генома с древним происхождением, унаследованных современными людьми от неандертальцев и денисовцев. Новизной метода является одновременное использование “внешней группы” - неперемешанной популяции и образцов известных древних геномов в одной модели. Авторы утверждают, что их методы превосходят ранее разработанные аналоги, такие как метод HMMMix. Работа может быть полезна для дата аналитиков, data science специалистов и исследователей популяционной генетики.

статья | код
🔥5