Машиннное обучение | Наука о данных Библиотека

🖥 Полный справочник по SQL!

🔗 Ссылка: *клик*

@machinelearning_books

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍7❤3

4.02K viewsedited 15:56

Машиннное обучение | Наука о данных Библиотека

⚡️ Scala for machine learning

📕 Книга

@machinelearning_books

❤6

14.7K views11:20

Машиннное обучение | Наука о данных Библиотека

📖

Эта статья посвящена задаче токенизации, которая в данном контексте рассматривается как задача сжатия набора данных до определенного числа символов!

🌟 Исследователи доказали NP-полноту двух вариантов токенизации: первый — это прямая токенизация, при которой создается словарь для представления данных, второй — токенизация снизу вверх, где используется последовательность операций объединения элементов. Оба этих метода могут быть использованы для сжатия данных и определения минимального количества символов для представления данных в сокращенной форме.

🔗 Читать: *клик*

@machinelearning_books

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤3

4.45K viewsedited 20:34

Машиннное обучение | Наука о данных Библиотека

Thoughtful Machine Learning with Python

📚 book

@machinelearning_books

👍8🔥6❤1

3.94K views12:33

Машиннное обучение | Наука о данных Библиотека

Forwarded from Machinelearning

📌Роадмэп воспроизведения o1 от OpenAI с фокусом на RL.

Fundan University совместно с Shanghai AI Laboratory составили дорожную карту, как повторить возможности модели o1 от OpenAI.

Главное – обучение с подкреплением, есть 4 важных условия, которые нужно сделать, чтобы добиться такого же уровня, как у o1:

🟢Инициализация политики
🟢Разработка вознаграждения
🟢Поиск
🟢Обучение

Инициализация политики начинается с предварительного обучения LLM на больших текстовых датасетах. Они должны быть из разных областей и включать помимо классических задач NLP, примеры логического рассуждения, знаний о мире и демонстрировать паттерны навыка сравнения. Это позволит модели освоить базовое понимание языка и навыки рассуждения.

Последующая тонкая настройка на инструкциях преобразует модель из "предсказателя следующего токена" в полноценного агента, который может выполнять задачи. Тут важно добавить в процесс человекоподобных рассуждений через SFT или подсказки, чтобы научить модель исследовать пространство решений. Например, самооценке и самокоррекции, как это происходит у OpenAI o1.

Разработка вознаграждения дает модели четкую и понятную обратную связь не только в конце решения задачи, но и на промежуточных этапах. Правильно спроектированная система с использованием внутренних и внешних функций крайне важна, с ней модель учится лучше.

Поиск - решающий навык для генерации качественных решений на этапах обучения и тестирования. Использование методов Best-of-N, Beam Search, MCTS позволяет получить лучшие из возможных результатов. Например, MCTS подходит для более широкого исследования пространства решений.

Обучение использует данные, полученные в процессе поиска для улучшения политики модели. Чем больше параметров и объем поисковых данных - тем лучше производительность в итоге. По сути, обучение и поиск работают как "суперсила", способствуя развитию модели.

Выводы, сделанные в процессе исследования авторами сводятся к тому, что существующие открытые проекты, которые пытаются воспроизвести o1 - вариации такого метода обучения. Обучение с подкреплением - ключ к созданию "рассуждающей модели".

🟡

Arxiv

@ai_machinelearning_big_data

#AI #ML #LLM #Paper #RL

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥6❤3🤔2💘1

3.46K views10:17

Машиннное обучение | Наука о данных Библиотека

Mathematical Foundations of Machine Learning

📓 book

@machinelearning_books

👍9🔥5❤4💘2

4.1K viewsedited 12:02

Машиннное обучение | Наука о данных Библиотека

Lecture Notes on Principal Component Analysis by Laurenz Wiskott

📕

lectures

@datascienceiot

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍1

3.22K views09:05

Машиннное обучение | Наука о данных Библиотека

⚡️ LLMs for AGI

В книге подробно обсуждаются фундаментальные проблемы которые необходимо решать для того, чтобы LLM достигли общего интеллекта человеческого уровня.

Отличное чтение для всех, кто интересуется исследованиями в области AGI.

📌 Читать

🔥8❤3👏2🤔1🥴1

3.57K views05:04

Машиннное обучение | Наука о данных Библиотека

Forwarded from Machinelearning

🧠

Огромный гайд по по обучению с подкреплением

Свежее руководство по обучению с подкреплением, которое очень подробно объясняет всю теорию и детали реализации каждого алгоритма в этой области со множеством примеров и кодом.

Наслаждайтесь чтением)

📌 Читать

@ai_machinelearning_big_data

#ml #reinforcementlearning #rl #guiede

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤14👍4🔥2⚡1

4.01K views16:03

Машиннное обучение | Наука о данных Библиотека

Forwarded from Machinelearning

📕

Foundations of Large Language Models

Эта свежая бесплатная книга (и отлично чтиво на выходные) по LLM, которая только что появилась на arXiv.

Более 230 страница!

Книга состоит из четырех частей: предварительному обучению, генеративным моделям, промпт-инжинирингу и методам оптимизации LLM.

Это хорошее введение в большие языковые модели для разработчиков и студентов.

📌 Читать

@ai_machinelearning_big_data

#freebook #book #machinelearning #llm #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍5🥱3🔥1

3.38K views16:55

About

Blog

Apps

Platform