Big data world
2.36K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью

Всем привет! Буквально несколько дней назад была представлена новая модель семейства Yolo. Ее основная фишка заключается в том, что в отличие от своих старших братьев, она способна распознавать на изображении фактически любые объекты (которые интересуют человека) без предварительного обучения и делает все это в real-time режиме! Звучит неплохо, не так ли?

В этой статье мы попробуем разобраться, что же за магия скрывается внутри новой архитектуры. https://habr.com/ru/articles/791154/
Дни генеративных ИИ сочтены? Инструмент для «отравления» датасетов добился неожиданной популярности

Бесплатный инструмент Nightshade, созданный исследователями из Чикагского университета, скачали 250 000 раз за первые 5 дней его существования. Программа предназначена для цифровых художников, которые не хотят допустить использования своих изображений генеративными ИИ. Похоже, если инструмент будет настолько успешен, разработка следующих моделей может быть сильно усложнена. https://habr.com/ru/companies/first/articles/792042/
Откуда я знаю, что проект по науке о данных/ML потерпит неудачу еще до того, как вы начнете
С высокой вероятностью я могу сказать, что ваш проект по науке о данных или машинному обучению потерпит неудачу — еще до того, как вы начнете! За последние 10 с лишним лет мы видели сотни проектов обработки данных и выделили закономерности, которые коррелируют с успехом. https://www.jasongilbertson.com/how-i-know-your-data-science-ml-project-will-fail-before-you-even-begin

Введение в SQL для утомленных специалистов по обработке данных

https://gvwilson.github.io/sql-tutorial/

Почему Адам — самый популярный оптимизатор в области глубокого обучения? Давайте разберемся в этом, углубившись в математику и воссоздав алгоритм.

https://towardsdatascience.com/the-math-behind-adam-optimizer-c41407efe59b
1
Математика K-ближайших соседей
Почему K-Nearest Neighbours является одним из самых популярных алгоритмов машинного обучения? Давайте разберемся в этом, углубившись в математику и построив его с нуля.

https://towardsdatascience.com/the-math-behind-knn-3d34050efb71

Математика и код, лежащие в основе кластеризации K-средних
Почему K-Means является самым популярным алгоритмом в обучении без учителя? Давайте углубимся в его математику и построим его с нуля.

https://towardsdatascience.com/the-math-and-code-behind-k-means-clustering-795582423666
Введение в линейную алгебру для машинного обучения. Это один из лучших ресурсов, которые я нашел для изучения алгебры, лежащей в основе машинного обучения. Это бесплатно, контент отличный, и все написано на Python.

https://pabloinsente.github.io/intro-linear-algebra
Бесплатные курсы Amazon для изучения генеративного искусственного интеллекта: для всех уровней
Повышайте квалификацию с помощью этих бесплатных курсов, чтобы освоить генеративный искусственный интеллект, независимо от вашей должности.

https://www.kdnuggets.com/free-amazon-courses-to-learn-generative-ai-for-all-levels
Алгоритм Monte Carlo Tree Search простыми словами


Можно ли научить ИИ играть в настольную игру и выигрывать в ней, если мы сами не знаем как это сделать? Да! И один из способов — использовать алгоритм Monte Carlo Tree Search (MCTS). Он актуален даже сейчас, в эпоху развития нейронных сетей.

У многих людей, в том числе и у меня, поначалу были сложности с пониманием алгоритма, как и с верой в то, что он может хорошо играть. В этой статье хочу рассказать об MCTS максимально просто и помочь разобраться в нем новичкам. В первой главе расскажу об основах, с которыми многие могут быть уже знакомы. Однако считаю, что они действительно важны для понимания. Подробности под катом! https://habr.com/ru/companies/selectel/articles/794658/
Высококачественные данные — это топливо для современного обучения моделей глубокого обучения данных. Большая часть помеченных данных для конкретной задачи поступает из аннотаций, выполняемых человеком

Многие методы машинного обучения, описанные в этой статье, могут помочь в повышении качества данных, но по сути сбор данных человеком предполагает внимание к деталям и тщательное выполнение. https://lilianweng.github.io/posts/2024-02-05-human-data-quality
Почему Адам — самый популярный оптимизатор в области глубокого обучения? Давайте разберемся в этом, углубившись в математику и воссоздав алгоритм.

https://towardsdatascience.com/the-math-behind-adam-optimizer-c41407efe59b

T-RAG = RAG + Точная настройка + Обнаружение объектов

https://cobusgreyling.medium.com/t-rag-rag-fine-tuning-entity-detection-9a5aaa01e437
Использование теории игр для повышения прозрачности моделей машинного обучения.

Интерпретация современных моделей машинного обучения может быть чрезвычайно сложным делом учитывая, что количество параметров и весовых коэффициентов может идти на тысячи и даже миллионы. Тем не менее это совершенно необходимо, для повышения качества, обеспечения стабильности и предсказуемости работы модели. В этом нам может помочь теория игр, математическая дисциплина позволяющая выделить из сложного взаимодействия факторов модели отдельный вклад каждого в конечное предсказание.

Читать далееhttps://habr.com/ru/articles/795957/
Введение в DSPy: прощайте, подсказки, здравствуйте, программирование!
Как платформа DSPy решает проблему нестабильности в приложениях на основе LLM, заменяя подсказки программированием и компиляцией

https://towardsdatascience.com/intro-to-dspy-goodbye-prompting-hello-programming-4ca1c6ce3eb9
Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле пытается добиться OpenAI с помощью этой модели, как связана генерация видео с самоездящими машинами и AGI, а также при чем здесь культовая «Матрица». https://habr.com/ru/articles/794566/