227K subscribers
3.8K photos
632 videos
17 files
4.45K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🌟 Introduction to Granite Code Models

IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода

Все модели Granite Code выпущены под лицензией Apache 2.0.

Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь.

Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода.

- Размер моделей варьируется от 3B до 34B параметров
- Обученных на 3-4 триллионах токенах, полученных из 116 языков программирования

Github: https://github.com/ibm-granite/granite-code-models
Paper: https://arxiv.org/abs/2405.04324
HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330

#llm #codegeneration

@ai_machinelearning_big_data
👍31🔥107🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 ​GemmaCoder3-12B — это дообученная версию Gemma-3 на датасете codeforces-cots.

После файнтюнинга демонстрирует значительное улучшение результатов на бенчмарке LiveCodeBench, увеличивая точность с 21,9% до 32,9% по сравнению с базовой моделью.

​GemmaCoder3-12B принимает текстовые запросы, связанные с программированием, и генерирует готовый код.​
В 8 бит отлично работает на 32 ГБ
Длина контекста 128k

В целом, проект подчёркивает простую истин - дообучение моделей на специализированных датасетах может значительно повысить их эффективность в узкоспециализированных задачах.

Подхходит для:
😶Генерации кода: Написание фрагментов кода или целых функций по текстовому описанию.
😶Автодополнения кода: Предложение вариантов завершения строки или блока кода (по аналогии с IntelliSense или GitHub Copilot, но на базе этой модели).
😶Объяснения кода: Генерация описания того, что делает заданный фрагмент кода, на естественном языке.
😶Перевода кода: Конвертация кода с одного языка программирования на другой (с переменным успехом в зависимости от сложности и языков).
😶 Помощь в поиске багов или предложение вариантов их исправления.
😶Ответов на вопросы по коду: Предоставление информации по синтаксису, библиотекам, алгоритмам.

🟡HF
🟡Статья

@ai_machinelearning_big_data


#codegeneration #ml #gemma
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍3718🔥9