Big data world

Направляйтесь к более чем 100 LLM с помощью одного быстрого и удобного API.

https://github.com/Portkey-AI/gateway

GitHub - Portkey-AI/gateway: A blazing fast AI Gateway with integrated guardrails. Route to 200+ LLMs, 50+ AI Guardrails with 1…

A blazing fast AI Gateway with integrated guardrails. Route to 200+ LLMs, 50+ AI Guardrails with 1 fast & friendly API. - Portkey-AI/gateway

840 views13:42

Big data world

YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью

Всем привет! Буквально несколько дней назад была представлена новая модель семейства Yolo. Ее основная фишка заключается в том, что в отличие от своих старших братьев, она способна распознавать на изображении фактически любые объекты (которые интересуют человека) без предварительного обучения и делает все это в real-time режиме! Звучит неплохо, не так ли?

В этой статье мы попробуем разобраться, что же за магия скрывается внутри новой архитектуры. https://habr.com/ru/articles/791154/

Хабр

YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью

Всем привет! Буквально несколько дней назад была представлена новая модель семейства Yolo. Ее основная фишка заключается в том, что в отличие от своих старших братьев, она способна распознавать на...

789 views08:15

Big data world

Мгновенное клонирование голоса с помощью MyShell.

https://github.com/myshell-ai/OpenVoice

GitHub

GitHub - myshell-ai/OpenVoice: Instant voice cloning by MIT and MyShell. Audio foundation model.

Instant voice cloning by MIT and MyShell. Audio foundation model. - myshell-ai/OpenVoice

627 views08:26

Big data world

Дни генеративных ИИ сочтены? Инструмент для «отравления» датасетов добился неожиданной популярности

Бесплатный инструмент Nightshade, созданный исследователями из Чикагского университета, скачали 250 000 раз за первые 5 дней его существования. Программа предназначена для цифровых художников, которые не хотят допустить использования своих изображений генеративными ИИ. Похоже, если инструмент будет настолько успешен, разработка следующих моделей может быть сильно усложнена. https://habr.com/ru/companies/first/articles/792042/

Хабр

Дни генеративных ИИ сочтены? Инструмент для «отравления» датасетов добился неожиданной популярности

Бесплатный инструмент Nightshade , созданный исследователями из Чикагского университета, скачали 250 000 раз за первые 5 дней его существования. Программа предназначена для цифровых художников,...

733 views08:37

Big data world

Откуда я знаю, что проект по науке о данных/ML потерпит неудачу еще до того, как вы начнете
С высокой вероятностью я могу сказать, что ваш проект по науке о данных или машинному обучению потерпит неудачу — еще до того, как вы начнете! За последние 10 с лишним лет мы видели сотни проектов обработки данных и выделили закономерности, которые коррелируют с успехом. https://www.jasongilbertson.com/how-i-know-your-data-science-ml-project-will-fail-before-you-even-begin

Введение в SQL для утомленных специалистов по обработке данных

https://gvwilson.github.io/sql-tutorial/

Почему Адам — самый популярный оптимизатор в области глубокого обучения? Давайте разберемся в этом, углубившись в математику и воссоздав алгоритм.

https://towardsdatascience.com/the-math-behind-adam-optimizer-c41407efe59b

❤1

835 views07:13

Big data world

Математика K-ближайших соседей
Почему K-Nearest Neighbours является одним из самых популярных алгоритмов машинного обучения? Давайте разберемся в этом, углубившись в математику и построив его с нуля.

https://towardsdatascience.com/the-math-behind-knn-3d34050efb71

Математика и код, лежащие в основе кластеризации K-средних
Почему K-Means является самым популярным алгоритмом в обучении без учителя? Давайте углубимся в его математику и построим его с нуля.

https://towardsdatascience.com/the-math-and-code-behind-k-means-clustering-795582423666

Medium

The Math Behind K-Nearest Neighbors

Why is KNN one of the most popular machine learning algorithm? Let’s understand it by diving into its math, and building it from scratch.

747 views10:48

Big data world

Введение в линейную алгебру для машинного обучения. Это один из лучших ресурсов, которые я нашел для изучения алгебры, лежащей в основе машинного обучения. Это бесплатно, контент отличный, и все написано на Python.

https://pabloinsente.github.io/intro-linear-algebra

849 views08:59

Big data world

Бесплатные курсы Amazon для изучения генеративного искусственного интеллекта: для всех уровней
Повышайте квалификацию с помощью этих бесплатных курсов, чтобы освоить генеративный искусственный интеллект, независимо от вашей должности.

https://www.kdnuggets.com/free-amazon-courses-to-learn-generative-ai-for-all-levels

KDnuggets

Free Amazon Courses to Learn Generative AI: For All Levels

Upskill with these free courses to master generative AI, regardless of your job title.

631 views13:07

Big data world

Алгоритм Monte Carlo Tree Search простыми словами

Можно ли научить ИИ играть в настольную игру и выигрывать в ней, если мы сами не знаем как это сделать? Да! И один из способов — использовать алгоритм Monte Carlo Tree Search (MCTS). Он актуален даже сейчас, в эпоху развития нейронных сетей.

У многих людей, в том числе и у меня, поначалу были сложности с пониманием алгоритма, как и с верой в то, что он может хорошо играть. В этой статье хочу рассказать об MCTS максимально просто и помочь разобраться в нем новичкам. В первой главе расскажу об основах, с которыми многие могут быть уже знакомы. Однако считаю, что они действительно важны для понимания. Подробности под катом! https://habr.com/ru/companies/selectel/articles/794658/

Хабр

Алгоритм Monte Carlo Tree Search простыми словами

Можно ли научить ИИ играть в настольную игру и выигрывать в ней, если мы сами не знаем как это сделать? Да! И один из способов — использовать алгоритм Monte Carlo Tree Search (MCTS). Он актуален даже...

605 views14:24

Big data world

3D -объект из 4 картинок (GitHub Repo) Всего лишь четыре изображения, чтобы получить высококачественный 3D-объект

https://github.com/gaussianobject/gaussianobject

GitHub

GitHub - GaussianObject/GaussianObject: Code for "GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with…

Code for "GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting" - GaussianObject/GaussianObject

629 views14:27

Big data world

Высококачественные данные — это топливо для современного обучения моделей глубокого обучения данных. Большая часть помеченных данных для конкретной задачи поступает из аннотаций, выполняемых человеком

Многие методы машинного обучения, описанные в этой статье, могут помочь в повышении качества данных, но по сути сбор данных человеком предполагает внимание к деталям и тщательное выполнение. https://lilianweng.github.io/posts/2024-02-05-human-data-quality

lilianweng.github.io

Thinking about High-Quality Human Data

[Special thank you to Ian Kivlichan for many useful pointers (E.g. the 100+ year old Nature paper “Vox populi”) and nice feedback. 🙏 ]
High-quality data is the fuel for modern data deep learning model training. Most of the task-specific labeled data comes…

726 views16:31

Big data world

Почему Адам — самый популярный оптимизатор в области глубокого обучения? Давайте разберемся в этом, углубившись в математику и воссоздав алгоритм.

https://towardsdatascience.com/the-math-behind-adam-optimizer-c41407efe59b

T-RAG = RAG + Точная настройка + Обнаружение объектов

https://cobusgreyling.medium.com/t-rag-rag-fine-tuning-entity-detection-9a5aaa01e437

Medium

The Math Behind the Adam Optimizer

Why is Adam the most popular optimizer in Deep Learning? Let’s understand it by diving into its math, and recreating the algorithm.

681 views18:05

Big data world

Использование теории игр для повышения прозрачности моделей машинного обучения.

Интерпретация современных моделей машинного обучения может быть чрезвычайно сложным делом учитывая, что количество параметров и весовых коэффициентов может идти на тысячи и даже миллионы. Тем не менее это совершенно необходимо, для повышения качества, обеспечения стабильности и предсказуемости работы модели. В этом нам может помочь теория игр, математическая дисциплина позволяющая выделить из сложного взаимодействия факторов модели отдельный вклад каждого в конечное предсказание.

Читать далееhttps://habr.com/ru/articles/795957/

Хабр

Использование теории игр для повышения прозрачности моделей машинного обучения

Проблема черных ящиков Отсутствие прозрачности это одна из ключевых проблем современного машинного обучения. Обученную модель больше невозможно представить в виде набора весовых коэффициентов,...

697 views06:19

Big data world

7 бесплатных курсов Гарвардского университета для развития ваших навыков

https://www.kdnuggets.com/7-free-harvard-university-courses-to-advance-your-skills

KDnuggets

7 Free Harvard University Courses to Advance Your Skills - KDnuggets

Transform your tech career with one of the best universities in the world!

569 views12:26

Big data world

Визуализация параметров градиентного спуска в Torch

https://towardsdatascience.com/visualizing-gradient-descent-parameters-in-torch-332a63d1e5c5

Medium

Visualizing Gradient Descent Parameters in Torch

Prying behind the interface to see the effects of SGD parameters on your model training

703 views12:48

Big data world

Сборник бесплатных курсов по изучению науки о данных, инженерии данных, машинного обучения, MLOps и LLMOps.

https://www.kdnuggets.com/collection-of-free-courses-to-learn-data-science-data-engineering-machine-learning-mlops-and-llmops

KDnuggets

Collection of Free Courses to Learn Data Science, Data Engineering, Machine Learning, MLOps, and LLMOps - KDnuggets

Begin your data professional journey from the basics of statistics to building a production-grade AI application.

713 views18:07

Big data world

Изучите генеративный искусственный интеллект за 30 часов

https://www.freecodecamp.org/news/learn-generative-ai-in

freeCodeCamp.org

Learn Generative AI in 30 Hours

In the ever-evolving landscape of artificial intelligence, staying ahead of the curve is important for both enthusiasts and professionals alike. And one of the most popular elements of AI right now is Generative AI. We just posted a comprehensive cou...

677 views05:30

Big data world

Введение в DSPy: прощайте, подсказки, здравствуйте, программирование!
Как платформа DSPy решает проблему нестабильности в приложениях на основе LLM, заменяя подсказки программированием и компиляцией

https://towardsdatascience.com/intro-to-dspy-goodbye-prompting-hello-programming-4ca1c6ce3eb9

Towards Data Science

Intro to DSPy: Goodbye Prompting, Hello Programming! | Towards Data Science

How the DSPy framework solves the fragility problem in LLM-based applications by replacing prompting with programming and compiling

673 views06:34

Big data world

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле пытается добиться OpenAI с помощью этой модели, как связана генерация видео с самоездящими машинами и AGI, а также при чем здесь культовая «Матрица». https://habr.com/ru/articles/794566/

Хабр

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле...

683 views13:07

Big data world

Изучите машинное обучение в 2024 году

https://www.freecodecamp.org/news/learn-machine-learning-in-2024

freeCodeCamp.org

Learn Machine Learning – Full Comprehensive Course

Are you curious about machine learning but don't know where to start? We just published a comprehensive Machine Learning course on the freeCodeCamp.org YouTube channel that will teach you how to get started in 2024. Whether you're aspiring to become ...

726 views07:48

About

Blog

Apps

Platform