Big data world
2.36K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Код и модели PyTorch для самостоятельного обучения V-JEPA по видео.

V-JEPA — метод, позволяющий научить машины понимать и моделировать физический мир с помощью просмотра видео.

https://github.com/facebookresearch/jepa
Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python.

Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification.

В данной статье описан не только принцип работы популярных алгоритмов кластеризации от простых к более продвинутым, но а также представлены их упрощённые реализации с нуля на Python, отражающие основную идею. Помимо этого, в конце каждого раздела указаны дополнительные источники для более глубокого ознакомления.

Читать далее https://habr.com/ru/articles/798331
👍2
Чему я научился, просматривая 900 самых популярных инструментов искусственного интеллекта с открытым исходным кодом

https://huyenchip.com/2024/03/14/ai-oss.html
Media is too big
VIEW IN TELEGRAM
ScoreHMR представляет новый метод трехмерной реконструкции позы и формы человека, используя возможности диффузионных моделей

https://statho.github.io/ScoreHMR/
Неудивительно, что в этом году конференция разработчиков GTC, проводимая Nvidia в Сан-Хосе, почти полностью посвящена искусственному интеллекту. Но в перерывах между разработками в области искусственного интеллекта Nvidia также сделала несколько важных объявлений в области робототехники .

Во-первых, это Project GR00T (каждая буква и цифра произносятся индивидуально, чтобы не вызывать гнев Диснея), базовая модель гуманоидных роботов . И, во-вторых, Nvidia взяла на себя обязательство стать платиновым членом-основателем Альянса робототехники с открытым исходным кодом. https://nvidianews.nvidia.com/news/foundation-model-isaac-robotics-platform
7 бесплатных курсов Google, чтобы стать инженером по машинному обучению
Хотите стать инженером ML? Эти бесплатные курсы от Google помогут вам в этом.

https://www.kdnuggets.com/7-free-google-courses-to-become-a-machine-learning-engineer?
Is Fashion ML Profession?
 
Правильный ответ Lamoda Tech назовет на Data Science митапе 28 марта. Приходи обсудить ML-эксперименты и готовые решения «под капотом» крупнейшей модной платформы в России!
 
Раскроем все details: как адаптируем каталог под индивидуальный стиль пользователей, отвечаем на сложные запросы в поиске, подбираем образы на уровне стилистов и рекомендуем подходящие размеры.
 
Программа:
19:05 Data Science в Lamoda: особенности применения ML в Fashion E-commerce
Александр Желубенков, Head of Data Science
 
19:35 Рекомендация размера с помощью машинного обучения
Никита Чуркин, Teamlead of Personalisation
 
20:20 В поисках стиля: Deep Learning в fashion-индустрии
Илья Черников, Senior Data Scientist
Между выступлениями и после будем общаться за вкусными закусками и напитками, а еще поиграем в настольный теннис и кикер.
 
Ждем вас в нашем офисе или онлайн! Регистрация обязательна по ссылке
👍1
Встраивание текста, классификация и семантический поиск

Введение с примером кода Python
https://medium.com/towards-data-science/text-embeddings-classification-and-semantic-search-8291746220be
Создайте исчерпывающую сводку данных за считанные секунды.

https://datamantra.medium.com/you-will-never-use-pandas-describe-method-after-using-these-two-libraries-e29aca1488d1
👍1
Освоение Python для науки о данных: помимо основ
Эта статья служит подробным руководством о том, как освоить передовые методы Python для науки о данных. В нем рассматриваются такие темы, как эффективное манипулирование данными с помощью Pandas, параллельная обработка с помощью Python и способы превращения моделей в веб-сервисы.

https://www.kdnuggets.com/mastering-python-for-data-science-beyond-the-basics
Как использовать действия GitHub для автоматизации очистки данных.
В этом блоге мы рассмотрим, как автоматизировать процесс очистки данных в облаке с помощью действий GitHub.

https://medium.com/data-analytics-at-nesta/how-to-use-github-actions-to-automate-data-scraping-299690cd8bdb
Как устроено пространство, в котором думают языковые модели?

С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?

Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM). https://habr.com/ru/companies/airi/articles/804515/
Понимание искусственного интеллекта и нейронных сетей путем ручной настройки параметров

В этом курсе вы получите возможность самостоятельно настроить параметры сети, помогая автомобилю научиться управлять автомобилем на специальной игровой площадке. Этот курс отлично подходит как для новичков, так и для тех, кто хочет углубить свои знания в области искусственного интеллекта.
https://www.freecodecamp.org/news/understand-ai-and-neural-networks-by-manually-adjusting-paramaters

Глубокое обучение Python: PyTorch против Tensorflow

PyTorch против TensorFlow: в чем разница? Обе библиотеки Python с открытым исходным кодом используют графики для выполнения численных вычислений над данными. Оба широко используются в академических исследованиях и коммерческом коде. Оба расширены различными API, платформами облачных вычислений и репозиториями моделей. https://realpython.com/courses/deep-learning-pytorch-tensorflow
Дорожная карта разработчиков искусственного интеллекта на 2024 год
Иллюстрированное руководство о том, как стать инженером по искусственному интеллекту в 2024 году, со ссылками на соответствующие курсы.

https://medium.com/javarevisited/the-2024-ai-artificial-intelligence-developer-roadmap-3b81db65c22a
JS-Torch — PyTorch в JavaScript
Библиотека JavaScript, такая как PyTorch, созданная с нуля… JS-Torch — это библиотека JavaScript для глубокого обучения, созданная с нуля и точно повторяющая синтаксис PyTorch.

https://github.com/eduardoleao052/js-torch