Машиннное обучение | Наука о данных Библиотека

Forwarded from Машинное обучение / ИИ Бибилиотека

📌 Введение в глубокое обучение

🖥

Github

@machinelearning_library

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍5❤4⚡1

3.75K views15:15

Машиннное обучение | Наука о данных Библиотека

Forwarded from Machinelearning

📌Книга "Обучение с подкреплением: Основы"

Хороших книг по обучению с подкреплением (Reinforcement Learning, RL) уже выпущено достаточно, однако есть пробел между продвинутыми учебниками, в которых основное внимание уделяется одному или нескольким аспектам, и более общими книгами, в которых предпочтение отдается удобочитаемости, а не сложности.

Авторы книги, люди с опытом работы в CS и инжиниринга, подают тему RL в строгом и академическом стиле. Книга основана на конспектах лекций для углубленного курса бакалавриата, который преподается авторами в Тель-Авивском университете.

К этой книге дополнительно идет брошюра с упражнениями и экзаменационными вопросами, которые помогут освоить материал книги на практике. Эти упражнения разрабатывались на протяжении нескольких лет.

Математическая модель книги - Марковский процесс принятия решений (Markov Decision Process, MDP). Основное внимание уделяется: последовательному принятию решений, выбору действий, долгосрочному эффекту от этих действий и разница между немедленным вознаграждением и долгосрочной выгодой.

Тематически книга состоит из двух частей – "Планирование" и "Обучение".

▶️

Раздел "Планирование" - основы принятия оптимальных решений в условиях неопределенности в соответствии с MDP.

🟢Глава 2. Обоснование модели MDP и ее связь с другими моделями.
🟢Глава 3. Основные алгоритмические идеи в детерминированной постановке.
🟢Глава 4. Цепи Маркова, на которых основана MDP.
🟢Глава 5. Модель MDP с конечным горизонтом и фундаментальный подход к динамическому программированию.
🟢Глава 6. Дисконтированная настройка с бесконечным горизонтом.
🟢Глава 7. Эпизодическая настройка.
🟢Глава 8. Альтернативный подход к решению MDP с использованием формулировки линейного программирования.

▶️

Раздел "Обучение" - принятие решений, когда модель MDP неизвестна заранее.

🟠Глава 9. Описание и мотивация модели обучения и ее связь с альтернативами при принятии решений.
🟠Глава 10. Подход, основанный на моделях, при котором агент явно изучает модель MDP на основе своего опыта и использует ее для принятия решений по планированию.
🟠Глава 11. Альтернативный подход без использования моделей, при котором решения принимаются без явного построения модели.
🟠Глава 12. Изучение приблизительно оптимальных решений крупных задач с использованием аппроксимации функции стоимости.
🟠Глава 13 Решение крупных задач с использованием методов градиентной политики.
🟠Глава 14. Особый случай на примере игровых автоматов, как MDP с единым состоянием и неизвестными наградами, и онлайн-характер принятия решений.

🟡

Сайт учебника

🟡

Читать

@ai_machinelearning_big_data

#AI #ML #RL #MDP #Book

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍7❤4

2.99K views11:45

Машиннное обучение | Наука о данных Библиотека

Introducing the Cookbook 📕

Коллекция гайдов и руководств с открытым исходным кодом для создания блюд с помощью AI SDK.

📚

Книги

@machinelearning_library

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤4🔥2

3.94K viewsedited 09:38

Машиннное обучение | Наука о данных Библиотека

Gaussian Processes for Machine Learning

📚

Книги

@machinelearning_library

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍7🔥2

3.85K views21:53

Машиннное обучение | Наука о данных Библиотека

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.iss.one/ai_machinelearning_big_data
C++ t.iss.one/cpluspluc
Python: t.iss.one/pythonl
Linux: t.iss.one/linuxacademiya
Хакинг: t.iss.one/linuxkalii
Devops: t.iss.one/DevOPSitsec
АНАЛИЗ Данных: t.iss.one/data_analysis_ml
Javascript: t.iss.one/javascriptv
C#: t.iss.one/csharp_ci
Java: t.iss.one/javatg
Базы данных: t.iss.one/sqlhub
Python собеседования: t.iss.one/python_job_interview
Мобильная разработка: t.iss.one/mobdevelop
Docker: t.iss.one/DevopsDocker
Golang: t.iss.one/golang_interview
React: t.iss.one/react_tg
Rust: t.iss.one/rust_code
ИИ: t.iss.one/vistehno
PHP: t.iss.one/phpshka
Android: t.iss.one/android_its
Frontend: t.iss.one/front
Big Data: t.iss.one/bigdatai
Собеседования МЛ: t.iss.one/machinelearning_interview
МАТЕМАТИКА: t.iss.one/data_math
Kubernets: t.iss.one/kubernetc
Разработка игр: https://t.iss.one/gamedev

💼 Папка с вакансиями: t.iss.one/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.iss.one/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.iss.one/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.iss.one/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.iss.one/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.iss.one/memes_prog
🇬🇧Английский: t.iss.one/english_forprogrammers
🧠ИИ: t.iss.one/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.iss.one/addlist/BkskQciUW_FhNjEy

❤4

4.29K views13:18

Машиннное обучение | Наука о данных Библиотека

📕 Cache-Oblivious Algorithms and Data Structures

🎓 Читать

@machinelearning_books

❤8👍2

3.78K viewsedited 14:40

Машиннное обучение | Наука о данных Библиотека

⚡️ Изучите создание промтов с помощью интерактивного руководства Anthropic по разработке подсказок.

👉 Ссылка на Google sheet

@machinelearning_books

❤11👍5🔥2💩2

3.76K viewsedited 10:19

Машиннное обучение | Наука о данных Библиотека

Calculus 1 for Honours Mathematics

🔗 Book

@machinelearning_books

👍6❤3🔥1

3.8K viewsedited 13:52

Машиннное обучение | Наука о данных Библиотека

🖥

t.iss.one/haskell_tg - Haskell входит в число наиболее востребованных функциональных языков программирования.

В нашем новом канале, вы найдете множество уроков, книг и гайдов для погружения в этот мощный язык с нуля.

Отличная возможность не только выучить новый язык, но и возможность прокачать свои навыки программирования.

t.iss.one/haskell_tg - стоит подписаться!

Please open Telegram to view this post

VIEW IN TELEGRAM

😁4👍2❤1

3.59K views14:35

Машиннное обучение | Наука о данных Библиотека

🔥 В репозитории на GitHub с более чем 12 тысячами звезд содержится интерактивная Google-таблица.

В нее нужно вставить свой токен от модели Claude, после чего можно приступить к обучению, выполняя уроки и задания. Помимо стандартных советов о выборе профессии, учебник охватывает такие важные темы, как:

— Форматирование результатов;
— Поэтапный анализ (Pre-cognition);
— Метод Few-shot-промптов;
— Проверка на ложные выводы и многое другое.

Ссылки для доступа:
▪ Github
▪ Docs

@machinelearning_books

👍6❤3🔥2

4.01K views16:01

Машиннное обучение | Наука о данных Библиотека

🔥 Огромная бесплатная книга по SQL! (500+ страниц!)

🔗 Ссылка: *клик*

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍5🔥3

10.6K views10:59

Машиннное обучение | Наука о данных Библиотека

В «Золотом Яблоке» можно создавать кастомные подарочные карты с дизайном от YandexART 🎨

«Золотое Яблоко» внедрило Yandex AI Rendering Technology — диффузионную нейросеть, которая создаёт изображения в ответ на текстовые запросы. Теперь она генерирует уникальные подарочные карты по запросам покупателей.
Пока генерация работает на сайте, а в декабре заработает и в приложении. С безопасностью, кстати, всё в порядке: сервис не делает дизайны на спорные темы.

Нейросеть можно использовать и в других сценариях:
генерировать материалы для сайта или брендбука;
придумывать маскотов;
создавать фирменные иконки и логотипы.

Тем, кто собирается решать с помощью нейросетей бизнес‑задачи, рекомендуем попробовать Playground в консоли Yandex Cloud.

🥴4❤3👍3🔥3

3.64K views07:44

Машиннное обучение | Наука о данных Библиотека

📖 Разработчик из DeepMind выпустил бесплатное руководство по обучению нейросетей с использованием методов подкрепления (Reinforcement Learning, RL).

Для специалистов в области машинного обучения (ML) оно станет настоящей находкой для ближайшего вечера:

- Введение — основные принципы RL и примеры применения.
- Value-based RL — базовые концепции метода.
- Policy-based RL — ключевые стратегии оптимизации действий.
- Model-based RL — техники планирования решений.
- Другие аспекты RL — использование в языковых моделях (LLM), пути к созданию общего искусственного интеллекта (AGI), разработка функций вознаграждения, иерархия задач и многое другое.

📌 Читать

@machinelearning_books

❤11👍5🔥2💩1

3.45K views10:00

Машиннное обучение | Наука о данных Библиотека

Forwarded from Machinelearning

📌Интерактивное руководство по Prompt Engineering для Ollama.

Репозиторий на Github c набором ipynb-туториалов по Prompt Engineering для освоения методов создания оптимальных промптов для модели Qwen2.5-14B.

Руководство разделено на 9 глав с практическими упражнениями и приложением с "продвинутыми" методами. В каждой главе есть "Example Playground" для экспериментов с примерами и наблюдения за изменениями в инференсе Ollama.

Руководство использует модель Qwen 2.5-14B, но все материалы подходят и для модели Qwen 2.5-7B.

▶️Содержание:

Начальный уровень

🟢Глава 1: Базовая структура промпта.
🟢Глава 2: Ясность и прямота.
🟢Глава 3: Назначение ролей.

Средний уровень

🟢Глава 4: Отделение данных от инструкций.
🟢Глава 5: Форматы данных инференса и речь для Ollama.
🟢Глава 6: Рассуждение (шаг за шагом).
🟢Глава 7: Использование примеров.

Продвинутый уровень

🟠Глава 8: Избегание галлюцинаций.
🟠Глава 9: Создание сложных промптов (примеры использования для реальных задач):

🟢Сложные промпты с нуля - чатбот;
🟢Сложные промпты с нуля по юридическим услугам;
🟢Упражнение: Сложные промпты для финансовых услуг;
🟢Упражнение: Сложные промпты для программирования.

Приложение: За пределами стандартных подсказок

🟠Цепочка промптов.
🟠Использование инструментов.

📌Лицензирование: MIT License.

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #Github #Tutorial #Ollama

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍1🔥1💩1

3.08K views15:00

Машиннное обучение | Наука о данных Библиотека

Forwarded from Haskell

🖥

Учебник по Haskell

Добро пожаловать в мир функционального программирования, строгой типизации, чистых функций, ленивых вычислений и классов типов.

Всё это вы найдёте в замечательном языке программирования Haskell.

Если вы просто где-то слышали о Haskell, и пока это описание ни о чём не говорит, ничего, об этом и о многом другом вы узнаете со страниц этой книги.

Haskell был основан на исходе восьмидесятых, как общий язык для программистов, интересующихся функциональным программированием и ленивой стратегией вычислений.

Это свободный язык, он разрабатывается комитетом разработчиков, программистов, математиков, информатиков, и просто увлечённых программированием людей. Основной компилятор языка GHC разрабатывается в Microsoft Research, но несмотря на это легко доступен в интернет. Вы можете установить его через Haskell Platform (для начинающих) или напрямую с сайта GHC (для гиков и любителей квестов). Ещё нам понадобится редактор с подсветкой синтаксиса Haskell.

Подойдёт простой gedit или более тяжёлые vim и Emacs. Есть и IDE для Haskell. Это Leksah, но пока ещё она совсем юная.

Итак, устанавливаем компилятор GHC подбираем редактор по вкусу и в добрый путь!

📚 Учебник

@haskell_tg

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤4🔥1

4.17K views15:38

Машиннное обучение | Наука о данных Библиотека

🖥 Полный справочник по SQL!

🔗 Ссылка: *клик*

@machinelearning_books

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍7❤3

4.06K viewsedited 15:56

Машиннное обучение | Наука о данных Библиотека

⚡️ Scala for machine learning

📕 Книга

@machinelearning_books

❤6

14.9K views11:20

Машиннное обучение | Наука о данных Библиотека

📖

Эта статья посвящена задаче токенизации, которая в данном контексте рассматривается как задача сжатия набора данных до определенного числа символов!

🌟 Исследователи доказали NP-полноту двух вариантов токенизации: первый — это прямая токенизация, при которой создается словарь для представления данных, второй — токенизация снизу вверх, где используется последовательность операций объединения элементов. Оба этих метода могут быть использованы для сжатия данных и определения минимального количества символов для представления данных в сокращенной форме.

🔗 Читать: *клик*

@machinelearning_books

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤3

4.5K viewsedited 20:34

Машиннное обучение | Наука о данных Библиотека

Thoughtful Machine Learning with Python

📚 book

@machinelearning_books

👍8🔥6❤1

3.98K views12:33

Машиннное обучение | Наука о данных Библиотека

Forwarded from Machinelearning

📌Роадмэп воспроизведения o1 от OpenAI с фокусом на RL.

Fundan University совместно с Shanghai AI Laboratory составили дорожную карту, как повторить возможности модели o1 от OpenAI.

Главное – обучение с подкреплением, есть 4 важных условия, которые нужно сделать, чтобы добиться такого же уровня, как у o1:

🟢Инициализация политики
🟢Разработка вознаграждения
🟢Поиск
🟢Обучение

Инициализация политики начинается с предварительного обучения LLM на больших текстовых датасетах. Они должны быть из разных областей и включать помимо классических задач NLP, примеры логического рассуждения, знаний о мире и демонстрировать паттерны навыка сравнения. Это позволит модели освоить базовое понимание языка и навыки рассуждения.

Последующая тонкая настройка на инструкциях преобразует модель из "предсказателя следующего токена" в полноценного агента, который может выполнять задачи. Тут важно добавить в процесс человекоподобных рассуждений через SFT или подсказки, чтобы научить модель исследовать пространство решений. Например, самооценке и самокоррекции, как это происходит у OpenAI o1.

Разработка вознаграждения дает модели четкую и понятную обратную связь не только в конце решения задачи, но и на промежуточных этапах. Правильно спроектированная система с использованием внутренних и внешних функций крайне важна, с ней модель учится лучше.

Поиск - решающий навык для генерации качественных решений на этапах обучения и тестирования. Использование методов Best-of-N, Beam Search, MCTS позволяет получить лучшие из возможных результатов. Например, MCTS подходит для более широкого исследования пространства решений.

Обучение использует данные, полученные в процессе поиска для улучшения политики модели. Чем больше параметров и объем поисковых данных - тем лучше производительность в итоге. По сути, обучение и поиск работают как "суперсила", способствуя развитию модели.

Выводы, сделанные в процессе исследования авторами сводятся к тому, что существующие открытые проекты, которые пытаются воспроизвести o1 - вариации такого метода обучения. Обучение с подкреплением - ключ к созданию "рассуждающей модели".

🟡

Arxiv

@ai_machinelearning_big_data

#AI #ML #LLM #Paper #RL

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥6❤3🤔2💘1

3.5K views10:17

About

Blog

Apps

Platform