Python Portal
55.9K subscribers
2.43K photos
391 videos
51 files
989 links
Всё самое интересное из мира Python

Связь: @devmangx

РКН: https://clck.ru/3GMMF6
Download Telegram
Тюнинг LLM больше не обязательно должен быть медленным, дорогим и прожорливым к GPU.

Открытые инструменты сильно прокачались.

Теперь можно дообучать мощные LLM без корпоративного железа.

Вот 4 библиотеки, которые стоит знать, чтобы тюнинг был быстрее и дешевле:

1. Unsloth

Наверняка самый быстрый способ дообучения LLM на сегодня.

До 2× быстрее
~70% меньше использования VRAM
Работает с Gemma, Qwen, LLaMA, Mistral и другими
Запускается на потребительских GPU (даже Colab/Kaggle с ~3GB VRAM 🤯)

2. LLaMA Factory

Полный набор для дообучения.

Поддержка 100+ моделей
CLI + WebUI (подходит новичкам)
LoRA, QLoRA, полный и замороженный FT (2–8 бит)
Встроенные датасеты, мониторинг тренировки и экспорт моделей

3. DeepSpeed

Если идёте на большие масштабы.

ZeRO и FSDP для масштабного обучения
Оптимизация под multi-GPU и multi-node
Проверен в продакшн-LLM тренировках

Если вы масштабируете серьёзные модели → это ваш выбор.

4. Axolotl

Конфигурационно-ориентированное дообучение, сделанное правильно.

Workflow на YAML
Поддержка LoRA, QLoRA, DPO, GRPO и мультимодальных моделей
Оптимизация памяти на уровне ядра
Плавная интеграция с Hugging Face

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
8
Media is too big
VIEW IN TELEGRAM
9 ключевых концепций искусственного интеллекта, объясненных за 7 минут

- Tokenization
- Text Decoding
- Prompt Engineering
- Multi Step AI Agents
- RAGs
- RLHF
- VAE
- Diffusion Models
- LoRA

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8