304K subscribers
4.02K photos
712 videos
17 files
4.59K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🦾 Free Course: The Hands-on Reinforcement Learning course 🚀

🔗 Для начинающих вот ссылка на обучаюущую платформу c ЗАДАЧАМИ С НУЛЯ - https://code-basics.com/ru

Обучение с подкреплением — один из способов машинного обучения, в ходе которого испытуемая система обучается, взаимодействуя с некоторой средой.

Это пошаговый практический курс, который поможет вам пройти изучить RL с сымых основ.

💻 Course

🖥 Github

#бесплаьныекурсы

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍336🔥4
🖥 Transformers From Scratch
PYTHON

In this notebook we have built a transformer model based on the Attention Is All You Need paper following along with Andrej Karpathy’s fantastic YouTube video: Let’s build GPT.

В этом блоге показн процесс создания и обучения трансформеров с нуля.

Шаг за шагом рассмотрен каждый основополагающий элемент с объяснением, что происходит на каждом этапе.

Этот блог написан в блокноте Jupyter, который вы можете скачать и использовать для самостоятельного выполнения кода по ходу работы.

📌 Notebook

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥116
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 BakedAvatar: Baking Neural Fields for Real-Time Head Avatar Synthesis

Рендеринг в реальном времени управляемых аватаров с 4D-головой на различных устройствах, включая мобильные.

BakedAvatar использует видеозаписи человека для создания качественных управляемых аватаров.

git clone https://github.com/buaavrcg/BakedAvatar
cd BakedAvatar


🖥 Code: https://github.com/buaavrcg/BakedAvatar

📚 Paper: https://dl.acm.org/doi/10.1145/3618399

⚡️ Page: https://buaavrcg.github.io/BakedAvatar/

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍245🔥4😱2
⚡️ The SwiftInfer project combines StearmingLLM with TesorR-LLM to make the inference efficiency and productivity much higher.

Сегодня состоялся новый большой релиз от команды Colossal-AI!

Они выложили в открытый доступ новый алгоритм SwiftInfer.

Алгоритм позволяет на 46% улучшить производительность LLM!

Этот проект объединяет инновации из двух недавних проектов, таких как StreamingLLM и TensoRT-LLM, чтобы обеспечить лучшую производильность и низкую задержку при выводе LLM.

Как StreamingLLM решает эту проблему

📌 StreamingLLM решает проблему 'attentional sink' (поглощения внимания) , когда начальные лексемы в тексте получают непропорционально большое внимание алгоритма. В традиционных методах, производительность модели значительно снижается, как только эти начальные лексемы исключаются из окна внимания.

StreamingLLM решает эту проблему, обеспечивая постоянное включение этих важных начальных лексем в окно внимания, тем самым стабилизируя генерацию и поддерживая высокое качество без необходимости дополнительной тонкой настройки.

Очень интересный проект!

git clone https://github.com/hpcaitech/SwiftInfer.git
cd SwiftInfer
pip install.


🖥 Github

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥62
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Physics-based Text-to-Motion🔥

InsActor - генеративный фреймворк, использующий последние достижения в области диффузионных моделей движения человека для создания управляемых промптами анимаций персонажей, основанных на физике.

🖥 Code: github.com/jiawei-ren/insactor

📚 Paper: arxiv.org/abs/2312.17135

⚡️ Project: https://jiawei-ren.github.io/projects/insactor/

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥112🥰1🤔1
⚡️ SigLIP: a better CLIP model

SigLIP от Google теперь доступен в 🤗 Transformers!


Он улучшает CLIP с помощью функции сигмоидальной потери.

SOTA для пары изображение в текст и наоборот.

🖥 Github: https://github.com/NielsRogge/Transformers-Tutorials/blob/master/SigLIP/Inference_with_(multilingual)_SigLIP%2C_a_better_CLIP_model.ipynb

📚 Paper: https://arxiv.org/abs/2303.15343

⚡️HF: https://huggingface.co/docs/transformers/main/en/model_doc/siglip

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍255🔥5
💊 AMIE: A research AI system for diagnostic medical reasoning and conversations

149 актеров, играющих пациентов, общались в прямом эфире с одним из 20 врачей, отобранных для теста и новым медицинским LLM от Google, AMIE.

После врачи-специалисты и пациенты оценивали качество обслуживания. AMIE обошел врачей.

💡 Blog: https://blog.research.google/2024/01/amie-research-ai-system-for-diagnostic_12.html

📚 Paper: https://arxiv.org/abs/2401.05654

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥52
This media is not supported in your browser
VIEW IN TELEGRAM
🖼️ DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders 🔥

DDColor - инструмент для естественной колоризации изображений.

Обширные эксперименты показывают, что DDColor превосходит все существующие современные разработки на бенчмарках.

🖥 Code: github.com/piddnad/DDColor

📚 Paper: arxiv.org/abs/2212.11613

🌟 Colab: https://github.com/camenduru/DDColor-colab

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍136
This media is not supported in your browser
VIEW IN TELEGRAM
🔉 MAGNeT: Masked Audio Generation using a Single Non-Autoregressive Transformer

Мощная система преобразования текста в звук от FAIR.

И да, она с открытым исходным кодом.

🖥 Code: https://github.com/facebookresearch/audiocraft/blob/main/docs/MAGNET.md#api

🚀 HF: https://huggingface.co/collections/facebook/magnet-659ef0ceb62804e6f41d1466

📚 Paper: https://arxiv.org/abs/2401.04577

🌟 Project: https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/

⚛️ Datasets: https://github.com/facebookresearch/audiocraft/blob/main/docs/DATASETS.md

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
16🔥12👍6
📐 AlphaGeometry: An Olympiad-level AI system for geometry

Deepmind представили AlphaGeometry: систему искусственного интеллекта, которая решает олимпиадные задачи по геометрии на уровне, приближающемся к уровню золотого медалиста.
Система была обучена исключительно на синтетических данных и знаменует собой прорыв ИИ в области математики.

🖥 Code: https://github.com/google-deepmind/alphageometry

🚀 Deepmind: https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/

📚 Paper: https://www.nature.com/articles/s41586-023-06747-5

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
43👍12🤔11🥰3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
💃 (Moore) Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

Animate Anyone: новая модель синтеза изображения в видео для качественно анимации персонажей.

🖥 Code: https://github.com/MooreThreads/Moore-AnimateAnyone

🚀 Colab: github.com/camenduru/Moore-AnimateAnyone-colab

📚 Paper: arxiv.org/abs/2311.17117

🌟 Project: humanaigc.github.io/animate-anyone/

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥248👍3❤‍🔥1
🥈 Kandinsky от Сбера стала второй по популярности нейросетью среди разработчиков по версии Hugging Face

AI-ресурс с лучшими open-source решениями выпустил рейтинг, где нейросеть Kandinsky от Сбера стала лидером по темпам роста, но уступила первое место Stable Diffusion по популярности среди разработчиков.

Разработчики Kandinsky отметили, что по итогам 2023 года аудитория нейросети выросла до 12 млн человек, а число сгенерированных в прошлом году изображений превысило 200 млн.

📚 Paper

@ai_machinelearning_big_data
26👍9😁6🥱6🔥3👏3🤪2❤‍🔥1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Introducing ASPIRE for selective prediction in LLMs

Google представили ASPIRE - фреймворк, который расширяет возможности предсказания больших языковых моделей, позволяя им выдавать ответ в паре с оценкой уверенности.

Узнайте, почему он превосходит современные методы на различных наборах данных QA.

https://blog.research.google/2024/01/introducing-aspire-for-selective.html

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥6👍3🥰2
🦾 Hard skills ML-разработчиков: Яндекс составил карту технических навыков для специалистов по Machine Learning

На ней можно найти, какие навыки тесно связаны между собой и к каким инструментам интерес особенно вырос за последний год.

Чем больше надпись на карте, тем чаще разработчики искали информацию по тегу. Чем ближе два навыка друг к другу, тем ближе контекст, в котором они применяются.

Можно побродить по карте, а ещё заполнить чек-лист на основе трендов 2023 года. Полезное.

@ai_machinelearning_big_data
🔥28👍5😁52🥰1🤓1
🚀 The newly released DeciCoder-6B model is one of the most capable and advanced multi-language code LLMs.

Недавно выпущенная модель DeciCoder-6B - одна из самых способных и продвинутых мультиязычных LLM модели для работы с кодом в классе параметров 7B.

Модель DeciCoder-6B демонстрирует исключительное мастерство владения яп, га руовне или превосходя конкурирующие модели в своем классе 🔥

Модель обучена на коде Python, Java, Javascript, Rust, C++, C и C# из Starcoder Training Dataset, DeciCoder-6B демонстрирует исключительное мастерство владения этими языками.

В бенчмарке HumanEval он превосходит такие модели, как CodeGen 2.5 7B и StarCoder 7B, практически на всех поддерживаемых языках.

На языке Python DeciCoder лидирует с преимуществом в 3 балла над моделями вдвое большего размера, например StarCoderBase 15.5B!

🚀 HF: https://huggingface.co/Deci/DeciCoder-6B

📚 Blog: https://deci.ai/blog/decicoder-6b-the-best-multi-language-code-generation-llm-in-its-class/

🌟 Colab: https://colab.research.google.com/drive/1QRbuser0rfUiFmQbesQJLXVtBYZOlKpB

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍6🔥61
🎉 Stability AI выпустили Stable LM 2 1.6B

Первая языковая модель из новой серии Stable LM 2: базовую модель с 1,6 миллиардами параметров. Базовая модель обучена примерно на 2 триллионах лексем в течение двух эпох и включает в себя многоязычные данные.

Используя последние алгоритмические достижения в области языкового моделирования, удалось найти оптимальный баланс между скоростью и производительностью, что позволило быстро проводить эксперименты и итерации при умеренных затратах.

демо: https://huggingface.co/spaces/stabilityai/stablelm-2-1_6b-zephyr
база моделей: https://huggingface.co/stabilityai/stablelm-2-1_6b
инструкции: https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b

@ai_machinelearning_big_data
24👍13🔥2
Media is too big
VIEW IN TELEGRAM
🤳 Vlogger - система искусственного интеллекта для генерации коротких влогов из текста.

В отличие от коротких видеороликов длительностью в несколько секунд, влог часто содержит сложную сюжетную линию с разнообразными сценами, что является сложной задачей для большинства существующих подходов к созданию видео.

Vlogger может генерировать видео на несколько минут из текста по сценарию без потери связности.

🖥 Code: https://github.com/zhuangshaobin/vlogger

🚀 Colab: github.com/camenduru/Moore-AnimateAnyone-colab

📚 Paper: https://arxiv.org/abs/2401.09414v1

🌟 Dataset: https://paperswithcode.com/dataset/ucf101

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍196😐5🔥4🍌2🥰1
🖥 Intel® Extension for Transformers

Инновационный набор инструментов на основе трансформеров для ускорения GenAI/LLM.

pip install intel-extension-for-transformers

#intelai #intelgpu

🖥 Code: https://github.com/intel/intel-extension-for-transformers

🚀 Docs: https://intel.github.io/intel-extension-for-transformers/latest/docs/Welcome.html

🌟 Dataset: https://huggingface.co/datasets/Intel/orca_dpo_pairs

🚀Release notes: https://github.com/intel/intel-extension-for-transformers/releases/tag/v1.3.1

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍12🥰1🍌1
InstantID : Zero-shot Identity-Preserving Generation in Seconds

InstantID - новая модель, которая может генерировать индивидуальные изображения с различными позами или стилями на основе одного эталонного изображения без какого-либо обучения!

🖥 Code: https://github.com/InstantID/InstantID

🚀 Project: https://instantid.github.io/

📚 Paper: https://arxiv.org/abs/2401.07519

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍187🔥4