Открытый код ФКН ВШЭ

11:13

Вебинары по разработке кода для всех Приглашаем вас на серию открытых вебинаров по разработке кода. Мы обсудим командную работу над проектами на платформе Github, научимся создавать воспроизводимые и качественные проекты, а также публиковать их на известных…

Привет!
Начинаем семинар сегодня в 18:10. Не пропустите 🙂

❤4👍2

976 views14:56

Открытый код ФКН ВШЭ

Forwarded from Научный опенсорс

До митапа всего 4 дня!

Напоминаем, что он состоится 8 октября в 19:00 в Loft Story (ул. Газовая, 10Ж), а зарегистрироваться можно здесь.

Митап пройдёт в рамках проекта «Научный Петербург». В программе будут доклады про китайский опенсорс от наших коллег из сообщества OpenScaler, питчи LLM-ассистента для проверки научных работ и библиотеки по обработке и генерации векторной графики, а ещё — безумные идеи хранения данных. Полная версия программы доступна здесь.

До встречи на митапе!

Митап организован при поддержке Центра научной коммуникации ИТМО, сообщества OpenScaler и исследовательского центра «Сильный ИИ в промышленности».
Проект поддержан Министерством науки и высшего образования РФ.
#десятилетиенауки #МинобрнаукиРоссии #популяризациянауки

👍6

963 views14:40

Открытый код ФКН ВШЭ

gen-simplicial-cycles

Код на python, в котором реализованы некоторые классические, а так же авторские алгоритмы, основанные на llm, позволяющие генерировать циклы в симплициальных группах. В частности, в симплициальной групповой настройке формулы Ву авторы переформулируют проблему генерации симплициальных циклов как проблему выборки из пересечения алгоритмических наборов данных, связанных с языками Дика. Исследователи представляют и оценивают подходы к языковому моделированию, которые используют многометковую информацию для входных последовательностей и большие языковые модели, вместе с необходимым теоретико-групповым инструментом и не нейросетевыми базовыми алгоритмами. Построенные на идее ансамблирования генераторов, дополнительная многометковая информация добавляется в обучающий набор данных, что позволяет одной модели работать как обобщение ансамбля. Полученные авторами модели, в отличие от базовых, масштабируемы и будут служить строительными блоками для будущих алгоритмов, специализированных на выборке из гомотопических групп пространств. Код может быть полезен математикам и DL-исследователям, работающим на стыке машинного обучения и топологии.

статья|код

GitHub

GitHub - ml-in-algebraic-topology/gen-simplicial-cycles: Code for 'Applying language models to algebraic topology: generating simplicial…

Code for 'Applying language models to algebraic topology: generating simplicial cycles using multi-labeling in Wu's formula' - ml-in-algebraic-topology/gen-simplicial-cycles

👍4🔥4🤔1

950 views09:22

Открытый код ФКН ВШЭ

Привет!

Сегодня в 18:10 мы продолжаем наши вебинары.

Тема:
Структура ветвления в Git и GitHub. Механизм Pull Request. Проведение Code Review в проектах. Разные стратегии ветвления проектов. Процедуры воспроизведения проектов.

🖥 Где: zoom

А еще появилась ссылка на запись прошлого вебинара!

❤‍🔥10👍2

1.17K viewsedited 14:24

Открытый код ФКН ВШЭ

Forwarded from ODS Events

Привет!

VK RecSys Challenge: запустили соревнование с AI VK 🔥

To like or not to like? Вот в чем вопрос!
Приглашаем принять участие всех, кто занимается рексистемами и хочет еще лучше прокачать свои навыки в построении моделей на реальной задаче компании 😎

Соревнование длится до 22 декабря, можно участвовать как индивидуально, так и объединяться в команды.

Чтобы узнать все детали и стать участником — переходите на страницу соревнования ⬅️👀

🦜

Хаб VK на ods.ai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7

786 views11:36

Открытый код ФКН ВШЭ

Бесплатный онлайн-курс по Git

Центр непрерывного образования факультета компьютерных приглашает присоединиться к бесплатному онлайн-курсу «Введение в GIT» тех, кто начинает свой путь в программировании и разработке.

Курс состоит из 5 уроков:
- Что такое Git?
- Добавление изменений в коммит и загрузка на удалённый репозиторий
- Управление изменениями, отмена операций, выбор определённого коммита
- Работа с ветками в репозитории
- Слияние веток, merge и rebase, политики работы с ветками

В Центре непрерывного образования в онлайн-формате можно освоить и другие навыки, необходимые для входа в IT: Python, SQL, инструменты бизнес-аналитики. У курсов есть бесплатные модули, к которым вы можете присоединиться уже сейчас. Подробная информация: в телеграм-канале Центра.

Присоединиться и начать изучать Git

❤9👍4🔥2

936 viewsedited 13:48

Открытый код ФКН ВШЭ

Truth-O-Meter

Разработанный на Python проект, позволяющий проверять достоверность сгенерированного большими языковыми моделями текста. Авторы приложения утверждают, что их метод позволяет детектировать галлюцинации и фактологические ошибки, производя веб-поиск по сгенерированному LLM тексту. После чего пользователь может получить скорректированный программой текст, подсвечивающий неточности и приводящий ссылки на достоверные источники в интернете. В серии работ авторы рассказывают о различных аспектах проекта, а так же проверяют состоятельность метода на датасете FEVER. Работа может быть полезна исследователям, работающими с генеративными и большими языковыми моделями, инженерам и Data Science специалистам.

статья|код|демо

GitHub

GitHub - bgalitsky/Truth-O-Meter-Making-ChatGPT-Truthful: fact checking of GPT and other LLMs

fact checking of GPT and other LLMs. Contribute to bgalitsky/Truth-O-Meter-Making-ChatGPT-Truthful development by creating an account on GitHub.

❤9🔥3

1.01K viewsedited 09:46

Открытый код ФКН ВШЭ

Привет!

Сегодня в 18:10 мы продолжаем наши вебинары.

Тема:
Автоматизация сборки проектов с использованием Github Actions. Инструменты проверки качества проекта.

🖥 Где: zoom

Все записи вебинаров выкладываем здесь!

❤3

1.06K views13:56

Открытый код ФКН ВШЭ

Guide-and-rescale

Код, позволяющий тренировать и инференсить диффузионную модель, способную редактировать изображение по текстовому запросу. В своей работе авторы исследуют метод гайденса для модели, благодаря которой траектория, вдоль которой семплируюется шум в диффузионной модели, не выходит из реального распределения данных. Это, в свою очередь, позволяет получить качественные и реалистичные изображения. Для достижения результата авторы вводят специальные энергетические функции, сохраняющие локальные свойства объектов на изображениях. Исследователи утверждают, что их подход эффективен с точки зрения вычислений, а так же показывают в ряде экспериментов его состоятельность. Код может быть полезен DL-исследователям, Data Science специалистам и ML-инженерам.

статья | код

GitHub

GitHub - MACderRu/Guide-and-Rescale: Official Implementation for "Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning…

Official Implementation for "Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing" - MACderRu/Guide-and-Rescale

❤5👍3

1.01K viewsedited 09:14

Открытый код ФКН ВШЭ

Привет!

Сегодня мы отдыхаем и вебинара не будет. Следующий будет 1 ноября.

Зато записи предыдущих можно посмотреть здесь!

❤9

1.15K viewsedited 14:04

Открытый код ФКН ВШЭ

Truck

Проект с открытым исходным кодом, посвященный созданию и развитию 2.5D автономного транспортного средства на основе модели рулевого управления Аккермана, рассчитанного на пользование внутри помещения. Для перемещения робот использует систему лидаров, данные с которых затем обрабатываются нейросетями на микрокомпьютере Jetson для точной и быстрой навигации. Для управления всей системой авторы сконструировали и запрограммировали контроллеры и микропроцессоры, учитывая кинематические и электротехнические особенности своего робота. Проект может быть интересен программистам микроконтроллеров, специалистам по робототехнике, инженерам-разработчикам беспилотного транспорта, специалистам по машинному и глубокому обучению, а так же студентам, заинтересованным в изучении этих дисциплин.

код

GitHub

GitHub - robotics-laboratory/truck: Self-driving truck

Self-driving truck. Contribute to robotics-laboratory/truck development by creating an account on GitHub.

🔥4❤1👍1

1K views09:22

Открытый код ФКН ВШЭ

Привет!

Сегодня в 18:10 у нас последний вебинар по разработке кода. Подключайтесь послушать и задать свои вопросы. Ждем вас!

Тема:
Основы контейнеризации проектов. Публикация проектов в Docker Registry, PyPi, CRAN.

🖥 Где: zoom

Все записи вебинаров выкладываем здесь!

🔥7❤2

2.34K views11:54

Открытый код ФКН ВШЭ

TensorNorm

Код на python, позволяющий считать и контролировать спектральную норму матрицы Якоби. Задача естественным образом возникает в обучении больших сверточных моделей. В своей работе авторы предлагают использовать тензоную спектральную норму для вычисления нормы всего сверточного слоя. Код вычисления нормы инвариантен к входному разрешению картинки и может быть эффективно вычислен во время обучения. В работе авторы выводят теоретическую верхнюю границу нормы, а в серии экспериментов показывают состоятельность метода, демонстрирую лучшую обобщающую способность моделей, регуляризированных с помощью данного подхода. Авторы также показывают, что их алгоритм показывает компромисс между точностью и скоростью вычисления. Код может быть полезен DL-исследователям разных областей и data-science специалистам.

код | статья

GitHub

GitHub - GrishKate/conv_norm

Contribute to GrishKate/conv_norm development by creating an account on GitHub.

❤7🔥2🤔1

921 views10:28

Открытый код ФКН ВШЭ

Forwarded from Yandex for Developers

🗂

14 декабря Яндекс проведёт Ночь опенсорс-библиотек для всех, кто интересуется открытым кодом

Вы станете частью открытого комьюнити и сможете познакомиться с разработчиками знаковых проектов и внести свой вклад в их развитие, даже если это ваш первый коммит.

Что вас ждёт:

🔴 Хакатоны, вокршопы и развлечения от мейнтейнеров наших опенсорс-проектов в разных стеках

🔴 Экскурсии и квесты по библиотеке, книжная лавка, концерт и сайлент-диско

Кого зовём:

🔴 Фронтендеров — познакомиться с разработкой функциональных интерфейсов в Gravity UI, научиться супербыстро кодить в HTML/CSS с Emmet и автоматизировать задачи с zx

🔴 Бэкендеров — узнать, как используют YDB для решения самых разных задач и как автоматизируют всю документацию в Diplodoc. А плюсовикам будет особенно интересно пообщаться с разработчиками userver

🔴 Мобильных разработчиков — задать все вопросы о кросс-платформенной разработке приложений создателям фреймворка DivKit

🔴 ML-специалистов — познакомиться с реальными кейсами оптимизации обучения с помощью CatBoost и YaFSDP

🔴 Аналитиков — построить дашборд с аналитикой по опенсорсным репозиториям Яндекса в DataLens

➡️ Узнать, как пройти в библиотеку (и зарегистрироваться), можно по ссылке.

💓 Приходите, если вы, как и мы, открыты для открытого кода.

⭐️

Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь:

💬

@Yandex4Developers

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8❤1

740 views14:30

Открытый код ФКН ВШЭ

DAIseg

Код, реализующий точный метод DAIseg для определения участков генома с древним происхождением, унаследованных современными людьми от неандертальцев и денисовцев. Новизной метода является одновременное использование “внешней группы” - неперемешанной популяции и образцов известных древних геномов в одной модели. Авторы утверждают, что их методы превосходят ранее разработанные аналоги, такие как метод HMMMix. Работа может быть полезна для дата аналитиков, data science специалистов и исследователей популяционной генетики.

статья | код

GitHub

GitHub - Genomics-HSE/DAIseg: DAIseg method

DAIseg method. Contribute to Genomics-HSE/DAIseg development by creating an account on GitHub.

🔥5

761 views09:01

Открытый код ФКН ВШЭ

Привет!
Мы собрали для вас материалы по прошедшим вебинарам по разработке кода от Павла Ахтямова.

❣️ Записи всех вебинаров можно посмотреть здесь.
ℹ️Слайды вебинаров можно скачать здесь.
👩‍💻А еще у нас есть репозиторий, который Павел использовал для демонстраций.

Смотрите и прокачивайтесь!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8🔥2

874 views15:48

Открытый код ФКН ВШЭ

Приглашаем всех на открытый семинар LAMBDA

Тема:
Linguacodus — фреймворк для генерации кода из текстовых описаний задач машинного обучения

Докладчик:
Трофимова Екатерина Алексеевна,
младший научный сотрудник LAMBDA

В статье представлен Linguacodus — фреймворк, разработанный для преобразования описаний задач машинного обучения на естественном языке в исполняемый код. Linguacodus использует динамический пайплайн, поэтапно переводя описания задач в высокоуровневые инструкции и затем в код.

Основой фреймворка является крупная языковая модель, дообученная для выбора наиболее подходящих решений для конкретных задач. В статье описаны этапы дообучения и подходы к переводу текстовых описаний в функциональный код. В ходе экспериментов на наборе кода с Kaggle мы продемонстрировали возможности Linguacodus для автоматизации задач в разных областях.

🔜 Когда: 18.11 в 14:40 МСК
🖥 Где: zoom

Если вам нравится код Linguacodus, ставьте свои ⭐️ на GitHub!

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5👍2❤1

864 views05:59

Открытый код ФКН ВШЭ

GNN-Tox

Код, позволяющий выполнить предобучение для графовой модели для прогноза свойств молекул. Предлагаемый авторами метод - Descriptor-base Graph Self-Supervised Learning - позволяет включать центры дескрипторов в задачу предобучения на уровне узлов, решая основные проблемы предшественников: отсутствие информации о домене во вспомогательных задачах на уровне узлов и высокая вычислительная сложность одновременного обучения для методов на основе мотивов и на уровне узлов. В серии экспериментов исследователи сравнивают свой подход с существующими бейзлайнами предобучения, демонстрируя существенно возросшее качество прогноза. Код может быть полезен исследователям графовых нейронных сетей, молекулярной биологии, DL-исследователям и DS-специалистам.

статья | код

GitHub

GitHub - li-xinze/GNN-Tox: Pytorch implementation of paper "Predicting Molecule Toxicity via Graph Neural Networks"

Pytorch implementation of paper "Predicting Molecule Toxicity via Graph Neural Networks" - li-xinze/GNN-Tox

🔥7

868 views10:05

Открытый код ФКН ВШЭ

understanding-largre-lrs

Репозиторий содержит код для обучения различных моделей компьютерного зрения в режиме предобучения с увеличенным learning rate (LR). Авторы работы исследуют влияние такого предобучения на финальное качество модели. Исследователи приходят к выводу, что предварительное обучение с умеренно большими LR, немного выше порога сходимости, позволяет получать наилучшие чекпоинты для последующего файнтюна или усреднения веса. С точки зрения геометрии обучение с этими значениями LR находит бассейн хорошо обобщающих решений в ландшафте функции потерь; с точки зрения обучения признаков эти решения соответствуют разреженному набору изученных признаков, которые наиболее полезны для задачи. Использование других значений LR может привести к неоптимальным результатам: либо нестабильным локальным минимумам, соответствующим плотному набору изученных признаков с меньшими LR, либо обширным областям с разнообразными минимумами и ухудшенным обучением признаков с большими LR. Код может быть полезен DL-исследователям, DS-специалистам и аналитикам данных.

статья | код

GitHub

GitHub - isadrtdinov/understanding-large-lrs: Source code for NeurIPS-2024 paper "Where Do Large Learning Rates Lead Us"

Source code for NeurIPS-2024 paper "Where Do Large Learning Rates Lead Us" - isadrtdinov/understanding-large-lrs

🔥7🤨2

952 views09:40

About

Blog

Apps

Platform