Машиннное обучение | Наука о данных Библиотека
16.9K subscribers
764 photos
10 videos
21 files
659 links
админ - @workakkk

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram - 🔥лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

№ 5037635661
Download Telegram
Forwarded from Data Science
Prompt Engineering Techniques: Comprehensive Repository for Development and Implementation 🖋️

📓 Github

@datascienceiot
5🔥1
Практическая статистика для специалистов Data Science

📖 Книга

@machinelearning_books
👍137😁3
LLM Engineer's Handbook: Master the art of engineering Large Language Models from concept to production.

🖥 Github

@machinelearning_books
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥2
Tutorial on Diffusion Models for Imaging and Vision

📚 Book

@machinelearning_books
7👍2🔥1
An Infinite Descent into Pure Mathematics

📚 Book

@machinelearning_books
52👍2
NotebookLlama: An Open Source version of NotebookLM

📚 Book

@machinelearning_books
5👍21
💡 Yandex ML Prize 2024: кто получил награду в этом году

Яндекс в шестой раз наградил исследователей, которые развивают ИИ и машинное обучение. Вот некоторые из лауреатов:

Николай Никитин (ИТМО) — эксперт в автоматическом машинном обучении и генеративном дизайне, развивает open-source экосистему инструментов для применения AI в науке. Его работы делают AI более доступным и удобным для исследователей, автоматизируя сложные задачи и ускоряя процессы.

Александр Колесов (Сколтех) занимается алгоритмами на базе оптимального транспорта, которые помогают нейросетям передавать стиль и содержание при переносе данных из одной области в другую – например, при генерации изображений по тексту.

Алексей Скрынник (AIRI) разрабатывает алгоритмы для многоагентной навигации, где роботы или другие агенты могут взаимодействовать автономно даже при отключении связи.

Помимо премии, лауреаты получат доступ к Яндекс 360 и грант на использование Yandex Cloud для выполнения объёмных вычислений и обработки данных.
7👍4
🖥🖥 Python tutorials for SQL machine learning

Github

@machinelearning_books
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤‍🔥4🥰21
📕 Machine Learning for Absolute Beginners

▪️Книга

@machinelearning_books
💩84🔥3🤔2👎1
Financial Statement Analysis with Large Language Models (LLMs)

📕 Book

@machinelearning_books
6👍2🔥1
Forwarded from Data Science. SQL hub
🖥 Книга по работе с SQL! (62 главы!)

🔗 Ссылка: *клик*

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥2
Forwarded from Machinelearning
📌 Практические упражнения и дополнительные материалы к книге "Build a Large Language Model (From Scratch)"

Репозиторий на Github c прикладными упражнениями, ноутбуками с кодом для разработки, предварительной подготовки и тонкой настройке LLM-модели типа GPT по одной из лучших книг о построении LLM с нуля.

▶️ О книге:
В книге вы узнаете и поймете, как работают большие языковые модели изнутри, создавая собственную LLM шаг за шагом, c подробным объяснением каждого этапа понятным языком, диаграммами и примерами.

Метод, описанный в книге демонстрирует подход, используемый при создании крупных фундаментальных моделей, таких как те, что лежат в основе ChatGPT.

В репозитории к каждой главе книги соответствуют несколько (3-4) прикладных примеров в формате ipynb или в виде исполняемого python-скрипта. Код ориентирован на широкую аудиторию, разработан для запуска на обычных ноутбуках и не требует специализированного оборудования.

▶️Главная ценность репозитория - дополнительные практические материалы, которые помогут глубже изучить тонкости и нюансы процесса настройки и обучения LLM:

Настройка

🟢Советы на настройке Python
🟢Установка пакетов и библиотек Python
🟢Руководство по настройке среды Docker

Глава 2: Работа с текстовыми данными

🟠Сравнение различных реализаций Byte Pair Encoding (BPE)
🟠Понимание разницы между embedding и линейными слоями
🟠Dataloader Intuition с простыми числами

Глава 3: Код механизмов внимания

🟢Сравнение эффективных реализаций Multi-Head Attention
🟢Буферы PyTorch

Глава 4: Реализация модели GPT с нуля

🟠Анализ FLOPS

Глава 5: Предварительное обучение на немаркированных данных

🟢Альтернативная загрузка весов с HuggingFace с использованием Transformers
🟢Предварительное обучение GPT на наборе данных проекта Gutenberg
🟢Добавление дополнительных функций в цикл обучения
🟢Оптимизация гиперпараметров для предварительного обучения
🟢Создание пользовательского интерфейса для взаимодействия с LLM
🟢Преобразование GPT в Llama
🟢Llama 3.2 с нуля
🟢Memory-efficient загрузка модели

Глава 6: Тонкая настройка для классификации

🟠Дополнительные эксперименты по точной настройке различных слоев и использованию более крупных моделей
🟠Тонкая настройка различных моделей на основе датасета обзоров фильмов IMDB объемом 50 тыс. строк.
🟠Создание пользовательского интерфейса для взаимодействия с классификатором спама на основе GPT

Глава 7: Тонкая настройка для следования инструкциям

🟢Утилиты набора данных для поиска близких дубликатов и создания записей в пассивном залоге
🟢Оценка ответов на инструкции с использованием API OpenAI и Ollama
🟢Создание датасета для точной настройки инструкций
🟢Улучшение набора данных для точной настройки инструкций
🟢Создание набора данных предпочтений с помощью Llama 3.1 70B и Ollama
🟢DPO для процедуры LLM Alignment
🟢Создание пользовательского интерфейса для взаимодействия с моделью GPT с тонкой настройкой инструкций


🖥Github


@ai_machinelearning_big_data

#AI #ML #LLM #Tutorial #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥21💘1
Reinforcement Learning An Introduction, 2nd Edition

📕 Book

@machinelearning_books
52👎2🔥1💔1
📌Machine Learning cheatsheet

Шпаргалка по ML от Стэнфорда, здесь даны метрики классификации, метрики регрессии, описывается кросс-валидация, регуляризация и не только

📎 Шпаргалка
🟡 PDF-версия

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥521