Big data world
2.36K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Введение в линейную алгебру для машинного обучения. Это один из лучших ресурсов, которые я нашел для изучения алгебры, лежащей в основе машинного обучения. Это бесплатно, контент отличный, и все написано на Python.

https://pabloinsente.github.io/intro-linear-algebra
Бесплатные курсы Amazon для изучения генеративного искусственного интеллекта: для всех уровней
Повышайте квалификацию с помощью этих бесплатных курсов, чтобы освоить генеративный искусственный интеллект, независимо от вашей должности.

https://www.kdnuggets.com/free-amazon-courses-to-learn-generative-ai-for-all-levels
Алгоритм Monte Carlo Tree Search простыми словами


Можно ли научить ИИ играть в настольную игру и выигрывать в ней, если мы сами не знаем как это сделать? Да! И один из способов — использовать алгоритм Monte Carlo Tree Search (MCTS). Он актуален даже сейчас, в эпоху развития нейронных сетей.

У многих людей, в том числе и у меня, поначалу были сложности с пониманием алгоритма, как и с верой в то, что он может хорошо играть. В этой статье хочу рассказать об MCTS максимально просто и помочь разобраться в нем новичкам. В первой главе расскажу об основах, с которыми многие могут быть уже знакомы. Однако считаю, что они действительно важны для понимания. Подробности под катом! https://habr.com/ru/companies/selectel/articles/794658/
Высококачественные данные — это топливо для современного обучения моделей глубокого обучения данных. Большая часть помеченных данных для конкретной задачи поступает из аннотаций, выполняемых человеком

Многие методы машинного обучения, описанные в этой статье, могут помочь в повышении качества данных, но по сути сбор данных человеком предполагает внимание к деталям и тщательное выполнение. https://lilianweng.github.io/posts/2024-02-05-human-data-quality
Почему Адам — самый популярный оптимизатор в области глубокого обучения? Давайте разберемся в этом, углубившись в математику и воссоздав алгоритм.

https://towardsdatascience.com/the-math-behind-adam-optimizer-c41407efe59b

T-RAG = RAG + Точная настройка + Обнаружение объектов

https://cobusgreyling.medium.com/t-rag-rag-fine-tuning-entity-detection-9a5aaa01e437
Использование теории игр для повышения прозрачности моделей машинного обучения.

Интерпретация современных моделей машинного обучения может быть чрезвычайно сложным делом учитывая, что количество параметров и весовых коэффициентов может идти на тысячи и даже миллионы. Тем не менее это совершенно необходимо, для повышения качества, обеспечения стабильности и предсказуемости работы модели. В этом нам может помочь теория игр, математическая дисциплина позволяющая выделить из сложного взаимодействия факторов модели отдельный вклад каждого в конечное предсказание.

Читать далееhttps://habr.com/ru/articles/795957/
Введение в DSPy: прощайте, подсказки, здравствуйте, программирование!
Как платформа DSPy решает проблему нестабильности в приложениях на основе LLM, заменяя подсказки программированием и компиляцией

https://towardsdatascience.com/intro-to-dspy-goodbye-prompting-hello-programming-4ca1c6ce3eb9
Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле пытается добиться OpenAI с помощью этой модели, как связана генерация видео с самоездящими машинами и AGI, а также при чем здесь культовая «Матрица». https://habr.com/ru/articles/794566/
Код и модели PyTorch для самостоятельного обучения V-JEPA по видео.

V-JEPA — метод, позволяющий научить машины понимать и моделировать физический мир с помощью просмотра видео.

https://github.com/facebookresearch/jepa
Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python.

Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification.

В данной статье описан не только принцип работы популярных алгоритмов кластеризации от простых к более продвинутым, но а также представлены их упрощённые реализации с нуля на Python, отражающие основную идею. Помимо этого, в конце каждого раздела указаны дополнительные источники для более глубокого ознакомления.

Читать далее https://habr.com/ru/articles/798331
👍2
Чему я научился, просматривая 900 самых популярных инструментов искусственного интеллекта с открытым исходным кодом

https://huyenchip.com/2024/03/14/ai-oss.html
Media is too big
VIEW IN TELEGRAM
ScoreHMR представляет новый метод трехмерной реконструкции позы и формы человека, используя возможности диффузионных моделей

https://statho.github.io/ScoreHMR/