Открытый код ФКН ВШЭ

Вебинары по разработке кода для всех Приглашаем вас на серию открытых вебинаров по разработке кода. Мы обсудим командную работу над проектами на платформе Github, научимся создавать воспроизводимые и качественные проекты, а также публиковать их на известных…

Привет!

Сегодня мы отдыхаем и вебинара не будет. Следующий будет 1 ноября.

Зато записи предыдущих можно посмотреть здесь!

❤9

1.16K viewsedited 14:04

Открытый код ФКН ВШЭ

Truck

Проект с открытым исходным кодом, посвященный созданию и развитию 2.5D автономного транспортного средства на основе модели рулевого управления Аккермана, рассчитанного на пользование внутри помещения. Для перемещения робот использует систему лидаров, данные с которых затем обрабатываются нейросетями на микрокомпьютере Jetson для точной и быстрой навигации. Для управления всей системой авторы сконструировали и запрограммировали контроллеры и микропроцессоры, учитывая кинематические и электротехнические особенности своего робота. Проект может быть интересен программистам микроконтроллеров, специалистам по робототехнике, инженерам-разработчикам беспилотного транспорта, специалистам по машинному и глубокому обучению, а так же студентам, заинтересованным в изучении этих дисциплин.

код

GitHub

GitHub - robotics-laboratory/truck: Self-driving truck

Self-driving truck. Contribute to robotics-laboratory/truck development by creating an account on GitHub.

🔥4❤1👍1

1.01K views09:22

Открытый код ФКН ВШЭ

Привет!

Сегодня в 18:10 у нас последний вебинар по разработке кода. Подключайтесь послушать и задать свои вопросы. Ждем вас!

Тема:
Основы контейнеризации проектов. Публикация проектов в Docker Registry, PyPi, CRAN.

🖥 Где: zoom

Все записи вебинаров выкладываем здесь!

🔥7❤2

2.37K views11:54

Открытый код ФКН ВШЭ

TensorNorm

Код на python, позволяющий считать и контролировать спектральную норму матрицы Якоби. Задача естественным образом возникает в обучении больших сверточных моделей. В своей работе авторы предлагают использовать тензоную спектральную норму для вычисления нормы всего сверточного слоя. Код вычисления нормы инвариантен к входному разрешению картинки и может быть эффективно вычислен во время обучения. В работе авторы выводят теоретическую верхнюю границу нормы, а в серии экспериментов показывают состоятельность метода, демонстрирую лучшую обобщающую способность моделей, регуляризированных с помощью данного подхода. Авторы также показывают, что их алгоритм показывает компромисс между точностью и скоростью вычисления. Код может быть полезен DL-исследователям разных областей и data-science специалистам.

код | статья

GitHub

GitHub - GrishKate/conv_norm

Contribute to GrishKate/conv_norm development by creating an account on GitHub.

❤7🔥2🤔1

937 views10:28

Открытый код ФКН ВШЭ

Forwarded from Yandex for Developers

🗂

14 декабря Яндекс проведёт Ночь опенсорс-библиотек для всех, кто интересуется открытым кодом

Вы станете частью открытого комьюнити и сможете познакомиться с разработчиками знаковых проектов и внести свой вклад в их развитие, даже если это ваш первый коммит.

Что вас ждёт:

🔴 Хакатоны, вокршопы и развлечения от мейнтейнеров наших опенсорс-проектов в разных стеках

🔴 Экскурсии и квесты по библиотеке, книжная лавка, концерт и сайлент-диско

Кого зовём:

🔴 Фронтендеров — познакомиться с разработкой функциональных интерфейсов в Gravity UI, научиться супербыстро кодить в HTML/CSS с Emmet и автоматизировать задачи с zx

🔴 Бэкендеров — узнать, как используют YDB для решения самых разных задач и как автоматизируют всю документацию в Diplodoc. А плюсовикам будет особенно интересно пообщаться с разработчиками userver

🔴 Мобильных разработчиков — задать все вопросы о кросс-платформенной разработке приложений создателям фреймворка DivKit

🔴 ML-специалистов — познакомиться с реальными кейсами оптимизации обучения с помощью CatBoost и YaFSDP

🔴 Аналитиков — построить дашборд с аналитикой по опенсорсным репозиториям Яндекса в DataLens

➡️ Узнать, как пройти в библиотеку (и зарегистрироваться), можно по ссылке.

💓 Приходите, если вы, как и мы, открыты для открытого кода.

⭐️

Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь:

💬

@Yandex4Developers

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8❤1

750 views14:30

Открытый код ФКН ВШЭ

DAIseg

Код, реализующий точный метод DAIseg для определения участков генома с древним происхождением, унаследованных современными людьми от неандертальцев и денисовцев. Новизной метода является одновременное использование “внешней группы” - неперемешанной популяции и образцов известных древних геномов в одной модели. Авторы утверждают, что их методы превосходят ранее разработанные аналоги, такие как метод HMMMix. Работа может быть полезна для дата аналитиков, data science специалистов и исследователей популяционной генетики.

статья | код

GitHub

GitHub - Genomics-HSE/DAIseg: DAIseg method

DAIseg method. Contribute to Genomics-HSE/DAIseg development by creating an account on GitHub.

🔥5

770 views09:01

Открытый код ФКН ВШЭ

Привет!
Мы собрали для вас материалы по прошедшим вебинарам по разработке кода от Павла Ахтямова.

❣️ Записи всех вебинаров можно посмотреть здесь.
ℹ️Слайды вебинаров можно скачать здесь.
👩‍💻А еще у нас есть репозиторий, который Павел использовал для демонстраций.

Смотрите и прокачивайтесь!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8🔥2

885 views15:48

Открытый код ФКН ВШЭ

Приглашаем всех на открытый семинар LAMBDA

Тема:
Linguacodus — фреймворк для генерации кода из текстовых описаний задач машинного обучения

Докладчик:
Трофимова Екатерина Алексеевна,
младший научный сотрудник LAMBDA

В статье представлен Linguacodus — фреймворк, разработанный для преобразования описаний задач машинного обучения на естественном языке в исполняемый код. Linguacodus использует динамический пайплайн, поэтапно переводя описания задач в высокоуровневые инструкции и затем в код.

Основой фреймворка является крупная языковая модель, дообученная для выбора наиболее подходящих решений для конкретных задач. В статье описаны этапы дообучения и подходы к переводу текстовых описаний в функциональный код. В ходе экспериментов на наборе кода с Kaggle мы продемонстрировали возможности Linguacodus для автоматизации задач в разных областях.

🔜 Когда: 18.11 в 14:40 МСК
🖥 Где: zoom

Если вам нравится код Linguacodus, ставьте свои ⭐️ на GitHub!

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5👍2❤1

870 views05:59

Открытый код ФКН ВШЭ

GNN-Tox

Код, позволяющий выполнить предобучение для графовой модели для прогноза свойств молекул. Предлагаемый авторами метод - Descriptor-base Graph Self-Supervised Learning - позволяет включать центры дескрипторов в задачу предобучения на уровне узлов, решая основные проблемы предшественников: отсутствие информации о домене во вспомогательных задачах на уровне узлов и высокая вычислительная сложность одновременного обучения для методов на основе мотивов и на уровне узлов. В серии экспериментов исследователи сравнивают свой подход с существующими бейзлайнами предобучения, демонстрируя существенно возросшее качество прогноза. Код может быть полезен исследователям графовых нейронных сетей, молекулярной биологии, DL-исследователям и DS-специалистам.

статья | код

GitHub

GitHub - li-xinze/GNN-Tox: Pytorch implementation of paper "Predicting Molecule Toxicity via Graph Neural Networks"

Pytorch implementation of paper "Predicting Molecule Toxicity via Graph Neural Networks" - li-xinze/GNN-Tox

🔥7

877 views10:05

Открытый код ФКН ВШЭ

understanding-largre-lrs

Репозиторий содержит код для обучения различных моделей компьютерного зрения в режиме предобучения с увеличенным learning rate (LR). Авторы работы исследуют влияние такого предобучения на финальное качество модели. Исследователи приходят к выводу, что предварительное обучение с умеренно большими LR, немного выше порога сходимости, позволяет получать наилучшие чекпоинты для последующего файнтюна или усреднения веса. С точки зрения геометрии обучение с этими значениями LR находит бассейн хорошо обобщающих решений в ландшафте функции потерь; с точки зрения обучения признаков эти решения соответствуют разреженному набору изученных признаков, которые наиболее полезны для задачи. Использование других значений LR может привести к неоптимальным результатам: либо нестабильным локальным минимумам, соответствующим плотному набору изученных признаков с меньшими LR, либо обширным областям с разнообразными минимумами и ухудшенным обучением признаков с большими LR. Код может быть полезен DL-исследователям, DS-специалистам и аналитикам данных.

статья | код

GitHub

GitHub - isadrtdinov/understanding-large-lrs: Source code for NeurIPS-2024 paper "Where Do Large Learning Rates Lead Us"

Source code for NeurIPS-2024 paper "Where Do Large Learning Rates Lead Us" - isadrtdinov/understanding-large-lrs

🔥7🤨2

963 views09:40

Открытый код ФКН ВШЭ

Indecies-kmeans

Репозиторий содержит код для поиска оптимального количества кластеров К для алгоритма кластеризации k-средних. В своей работе авторы исследуют метод инерции, основанным на новом Elbow индексе для определения числа кластеров, валидируя результат по метрике Силуэт. Исследователи отмечают, что инерциальные индексы работают лучше всего при усреднении результатов нескольких запусков кластеризации, а не при выборе лучшего, как считалось ранее. В конце авторы замечают, что однозначно лучшего индекса для определения количества кластеров выявить не удалось. Индекс SW (ширина силуэта) обычно приводит к наиболее сбалансированным решениям. Тем не менее, индекс XU превосходит SW на синтетических данных с большими кластерными смесями, особенно для данных меньшей размерности. Код может быть полезен дата аналитикам и DS-специалистам, а так же исследователям в области машинного обучения.

статья | код

🔥4❤3

943 views09:42

Открытый код ФКН ВШЭ

tabgraphs

Бенчмарк для обучения на графах для табличных данных с гетерогенными признаками-вершинами. Авторы оценивают большое количество моделей, включая стандартные бейзлайны и нейросетевые модели для графовых и табличных задач. В экспериментальной части исследователи показывают, что несколько ранее упускаемых из виду модификаций моделей, таких как аугментация признаков-вершин на основе соседства графа для графонезависимых табличных моделей или числовые эмебддинги признаков для GNN, позволяют достичь наилучшей производительности на таких данных. Работа может быть полезна DS-специалистам, а так же ML-исследователям, фокусирующимся на табличных данных или графовых моделях.

статья | код

GitHub

GitHub - yandex-research/tabgraphs: A benchmark of meaningful graph datasets with tabular node features

A benchmark of meaningful graph datasets with tabular node features - yandex-research/tabgraphs

🔥7👍1

933 views09:30

Открытый код ФКН ВШЭ

reparameterized-volume-sampling

Имплементация end-to-end дифференцируемого метода по семплированию точек луча для задачи синтеза новых сцен из набора изображений. Метод основан на оценках Монте-Карло и позволяет улучшать иерархическую схему рендеринга, представленную в ставшей уже классической статье NeRF. В серии экспериментов авторы показывают превосходство подхода на этапе инференса, используя предобученную модель. Те же эксперименты выявляют проблемы метода при использовании во врем обучения модели. Исследователи утверждают, что их алгоритм семплинга улучшает реконструкцию сцен для иерархических моделей и упрощает процедуру обучения, позволяя избавиться от дополнительных слагаемых в функции потерь. Работа может быть полезна дизайнерам и DL-исследователям.

статья | код

GitHub

GitHub - GreatDrake/reparameterized-volume-sampling: Official code for Differentiable Rendering with Reparameterized Volume Sampling…

Official code for Differentiable Rendering with Reparameterized Volume Sampling (AISTATS 2024) - GreatDrake/reparameterized-volume-sampling

❤3🔥3

852 views09:02

Открытый код ФКН ВШЭ

TabM

Репозиторий, содержащий имплементацию TabM — модели, эффективно имитирующей ансамбль многослойных перцептронов для решения задач на табличных данных. Для этого вводятся специальные адаптеры - матрицы, чьи элементы равны ± 1. Эти адаптеры эффективно создают уникальные версии матрицы весов, за счет чего и имитируется ансамбль. В итоговой архитектуре такой адаптер применяется только ко всем копиям одного входа, которые затем подаются в линейные слои. В серии экспериментов авторы показывают существенное превосходство метода для задач на табличных данных по сравнению с другими классическими и нейросетевыми подходами, в том числе использующие механизм внимания. Модель также демонстрирует лучшую скорость обучения и инференса, уступая лишь стандартному MLP и XGBoost. Работа может быть полезна аналитикам, DS-специалистам и DL-исследователям.

статья | код

GitHub

GitHub - yandex-research/tabm: (ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling

(ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling - yandex-research/tabm

🔥7

998 views09:51

Открытый код ФКН ВШЭ

Поздравляем с 2025 годом! 🎄

🎆

Удачи и успеха вам в новом году, друзья! 🎁

Спасибо, что остаётесь с нами!

Please open Telegram to view this post

VIEW IN TELEGRAM

🎉13❤‍🔥2❤1👍1

814 views00:14

Открытый код ФКН ВШЭ

rtdl-num-embeddings

Библиотека на python, позволяющая получать эмбеддинги для непрерывных признаков в задачах для табличных данных. Используемые вместо скалярных признаков эмбеддинги улучшают итоговое качество моделей на специфических задачах, при этом не увеличивая вычислительную сложность. В своей работе авторы представляют несколько алгоритмов получения эбмеддингов, а в экспериментальной части показывают состоятельность метода. В частности, сравнивая DL-алгоритмы с классическими подходами, такими как GBDT, на задачах, заточенных под последние. В таком режиме DL методы без использования эмебеддингов уступают классическим, а при использовании обходят их. Библиотека может быть полезна DS-специалистам, дата аналитикам и ML-инженерам.

статья | код

GitHub

GitHub - yandex-research/rtdl-num-embeddings: (NeurIPS 2022) On Embeddings for Numerical Features in Tabular Deep Learning

(NeurIPS 2022) On Embeddings for Numerical Features in Tabular Deep Learning - yandex-research/rtdl-num-embeddings

🔥12

934 views11:16

Открытый код ФКН ВШЭ

RATANSunPy

Библиотека на python, разработанный для доступа, визуализации и анализа многополосных радионаблюдений Солнца с комплекса РАТАН-600. Эти данные представляют ценность для диагностики состояния солнечной плазмы и прогнозирования солнечной активности. Пакет предлагает комплексные функции обработки данных, включая прямой доступ к необработанным данным, основные этапы обработки, такие как калибровка и нормализация тихого Солнца, а также инструменты для анализа солнечной активности. Сюда входит автоматическое обнаружение локальных источников, идентификация их с активными областями NOAA и дальнейшее определение параметров для локальных источников и активных областей. Работа может быть полезна физикам, астрономам, и DS-специалистам.

статья | код

GitHub

GitHub - SpbfSAO/RATANSunPy: RATAN-600 radioastronomical solar data and methods Python library. Documentations below:

RATAN-600 radioastronomical solar data and methods Python library. Documentations below: - SpbfSAO/RATANSunPy

❤3👍1🔥1

842 views09:04

Открытый код ФКН ВШЭ

structural-graph-shifts

В работе рассматривается проблема оценки робастности моделей графовых нейронных сетей. Для оценки неопределенности прогноза в таких моделях используются различные подходы: общие, например, ансамблирование, и специфические, использующие свойства графовой структуры. Вне зависимости от метода оценки устойчивости модели, для его обучения необходимы данные, содержащие в себе различные источники неопределенностей, например, сдвиги распределений. Типичные датасеты для оценки робастности графовых нейронных сетей используют сдвиги на уровне признаков. Авторы предлагают более универсальный способ создания неопределенности в данных, основанный на особенностях графовых данных. В репозитории проекта содержится код, позволяющий получить подобные данные с различными видами неопределенности, а также имплементацию различных методов оценки неопределенности и улучшения робастности. В серии экспериментов авторы демонстрируют сложность, с которой сталкиваются модели в таком режиме обучения. При этом более простые модели часто превосходят в качестве прогноза продвинутые алгоритмы. Работа может быть полезна DL-исследователям, специалистам по графовым нейронным сетям, DS-специалистам и дата аналитикам.

статья | код

GitHub

GitHub - yandex-research/structural-graph-shifts: New structural distributional shifts for evaluating graph models

New structural distributional shifts for evaluating graph models - yandex-research/structural-graph-shifts

❤6👍2

785 views09:00

Открытый код ФКН ВШЭ

Первое исследование open source от СберТеха

Исследователи из СберТеха проанализировали тысячи профилей на GitHub и получили интересные результаты об open source в мире и в России.

Некоторые выводы исследования:
🟢 основные языки разработки — Python и JavaScript, в тренде —TypeScript, Rust и Lua;
🟢 самый популярный российский проект на GitHub — JavaScript-фреймворк core-js;
🟢 самая популярная у нас отечественная большая языковая модель — ruGPT3 (Сбер), а СУБД — YDB (Яндекс);
🟢 самые популярные категории open source проектов — JavaScript-, web- и css-фреймворки;
🟢 локальное китайское open source сообщество Gitee растет быстрее, чем на GitHub, и уже опережает его более чем в 1,5 раза по числу репозиториев.

Полный отчет можно посмотреть здесь.

🔥5❤1👍1

801 views13:18

Открытый код ФКН ВШЭ

DeepZ

Репозиторий содержит код и данные для обучения нейросетей для поиска и выявления паттернов в Z-ДНК генома человека и мышей. Вопрос о роли Z-ДНК в процессе транскрипции актуален для вычислительной биологии и медицины. Исследования роли Z-флипонов в процессе создания РНК-копий генов может помочь в разработке новых лекарств. При обучении учитывалась не только информация из линейной последовательности ДНК, но и данные из десятков тысяч омиксных экспериментов. Обученные модели - для человека и мыши - выявляют в последовательности ДНК участки, которые с наибольшей вероятностью являются Z-ДНК. Работа может быть полезна медикам, биологам, биоинженерам и фармакологам.

статья | код

GitHub

GitHub - Nazar1997/DeepZ_MM: DeepZ approach interpolated on mouse genome

DeepZ approach interpolated on mouse genome. Contribute to Nazar1997/DeepZ_MM development by creating an account on GitHub.

🔥12🤨4❤3🤔1

1.03K views09:21

Открытый код ФКН ВШЭ

Mr.Handy

Handy — проект с открытым исходным кодом на С++ и python, поддерживаемый HSE Robotics Group. Цель проекта — спроектировать и разработать роботизированный манипулятор, который сможет играть в настольный теннис. В репозитории есть код для считывания данных с камер, обучения и инференса модели для детекции шарика для тенниса, а так же для управления рукой-манипулятором. Весь код, наборы данных, модели и инструкции по разработке доступны и, как обещают авторы, всегда будут доступны онлайн. Следить за проектом можно в канале группы робототехники. Проект может быть полезен начинающим специалистам в области робототехники, машинного обучения и программирования микроконтроллеров.

код | канал

GitHub

GitHub - robotics-laboratory/handy: Robotics manipulator Mr. Handy

Robotics manipulator Mr. Handy. Contribute to robotics-laboratory/handy development by creating an account on GitHub.

🔥5❤1🐳1

1K views10:53

About

Blog

Apps

Platform