304K subscribers
4.01K photos
710 videos
17 files
4.59K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
💊 AMIE: A research AI system for diagnostic medical reasoning and conversations

149 актеров, играющих пациентов, общались в прямом эфире с одним из 20 врачей, отобранных для теста и новым медицинским LLM от Google, AMIE.

После врачи-специалисты и пациенты оценивали качество обслуживания. AMIE обошел врачей.

💡 Blog: https://blog.research.google/2024/01/amie-research-ai-system-for-diagnostic_12.html

📚 Paper: https://arxiv.org/abs/2401.05654

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥52
This media is not supported in your browser
VIEW IN TELEGRAM
🖼️ DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders 🔥

DDColor - инструмент для естественной колоризации изображений.

Обширные эксперименты показывают, что DDColor превосходит все существующие современные разработки на бенчмарках.

🖥 Code: github.com/piddnad/DDColor

📚 Paper: arxiv.org/abs/2212.11613

🌟 Colab: https://github.com/camenduru/DDColor-colab

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍136
This media is not supported in your browser
VIEW IN TELEGRAM
🔉 MAGNeT: Masked Audio Generation using a Single Non-Autoregressive Transformer

Мощная система преобразования текста в звук от FAIR.

И да, она с открытым исходным кодом.

🖥 Code: https://github.com/facebookresearch/audiocraft/blob/main/docs/MAGNET.md#api

🚀 HF: https://huggingface.co/collections/facebook/magnet-659ef0ceb62804e6f41d1466

📚 Paper: https://arxiv.org/abs/2401.04577

🌟 Project: https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/

⚛️ Datasets: https://github.com/facebookresearch/audiocraft/blob/main/docs/DATASETS.md

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
16🔥12👍6
📐 AlphaGeometry: An Olympiad-level AI system for geometry

Deepmind представили AlphaGeometry: систему искусственного интеллекта, которая решает олимпиадные задачи по геометрии на уровне, приближающемся к уровню золотого медалиста.
Система была обучена исключительно на синтетических данных и знаменует собой прорыв ИИ в области математики.

🖥 Code: https://github.com/google-deepmind/alphageometry

🚀 Deepmind: https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/

📚 Paper: https://www.nature.com/articles/s41586-023-06747-5

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
43👍12🤔11🥰3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
💃 (Moore) Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

Animate Anyone: новая модель синтеза изображения в видео для качественно анимации персонажей.

🖥 Code: https://github.com/MooreThreads/Moore-AnimateAnyone

🚀 Colab: github.com/camenduru/Moore-AnimateAnyone-colab

📚 Paper: arxiv.org/abs/2311.17117

🌟 Project: humanaigc.github.io/animate-anyone/

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥248👍3❤‍🔥1
🥈 Kandinsky от Сбера стала второй по популярности нейросетью среди разработчиков по версии Hugging Face

AI-ресурс с лучшими open-source решениями выпустил рейтинг, где нейросеть Kandinsky от Сбера стала лидером по темпам роста, но уступила первое место Stable Diffusion по популярности среди разработчиков.

Разработчики Kandinsky отметили, что по итогам 2023 года аудитория нейросети выросла до 12 млн человек, а число сгенерированных в прошлом году изображений превысило 200 млн.

📚 Paper

@ai_machinelearning_big_data
26👍9😁6🥱6🔥3👏3🤪2❤‍🔥1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Introducing ASPIRE for selective prediction in LLMs

Google представили ASPIRE - фреймворк, который расширяет возможности предсказания больших языковых моделей, позволяя им выдавать ответ в паре с оценкой уверенности.

Узнайте, почему он превосходит современные методы на различных наборах данных QA.

https://blog.research.google/2024/01/introducing-aspire-for-selective.html

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥6👍3🥰2
🦾 Hard skills ML-разработчиков: Яндекс составил карту технических навыков для специалистов по Machine Learning

На ней можно найти, какие навыки тесно связаны между собой и к каким инструментам интерес особенно вырос за последний год.

Чем больше надпись на карте, тем чаще разработчики искали информацию по тегу. Чем ближе два навыка друг к другу, тем ближе контекст, в котором они применяются.

Можно побродить по карте, а ещё заполнить чек-лист на основе трендов 2023 года. Полезное.

@ai_machinelearning_big_data
🔥28👍5😁52🥰1🤓1
🚀 The newly released DeciCoder-6B model is one of the most capable and advanced multi-language code LLMs.

Недавно выпущенная модель DeciCoder-6B - одна из самых способных и продвинутых мультиязычных LLM модели для работы с кодом в классе параметров 7B.

Модель DeciCoder-6B демонстрирует исключительное мастерство владения яп, га руовне или превосходя конкурирующие модели в своем классе 🔥

Модель обучена на коде Python, Java, Javascript, Rust, C++, C и C# из Starcoder Training Dataset, DeciCoder-6B демонстрирует исключительное мастерство владения этими языками.

В бенчмарке HumanEval он превосходит такие модели, как CodeGen 2.5 7B и StarCoder 7B, практически на всех поддерживаемых языках.

На языке Python DeciCoder лидирует с преимуществом в 3 балла над моделями вдвое большего размера, например StarCoderBase 15.5B!

🚀 HF: https://huggingface.co/Deci/DeciCoder-6B

📚 Blog: https://deci.ai/blog/decicoder-6b-the-best-multi-language-code-generation-llm-in-its-class/

🌟 Colab: https://colab.research.google.com/drive/1QRbuser0rfUiFmQbesQJLXVtBYZOlKpB

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍6🔥61
🎉 Stability AI выпустили Stable LM 2 1.6B

Первая языковая модель из новой серии Stable LM 2: базовую модель с 1,6 миллиардами параметров. Базовая модель обучена примерно на 2 триллионах лексем в течение двух эпох и включает в себя многоязычные данные.

Используя последние алгоритмические достижения в области языкового моделирования, удалось найти оптимальный баланс между скоростью и производительностью, что позволило быстро проводить эксперименты и итерации при умеренных затратах.

демо: https://huggingface.co/spaces/stabilityai/stablelm-2-1_6b-zephyr
база моделей: https://huggingface.co/stabilityai/stablelm-2-1_6b
инструкции: https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b

@ai_machinelearning_big_data
24👍13🔥2
Media is too big
VIEW IN TELEGRAM
🤳 Vlogger - система искусственного интеллекта для генерации коротких влогов из текста.

В отличие от коротких видеороликов длительностью в несколько секунд, влог часто содержит сложную сюжетную линию с разнообразными сценами, что является сложной задачей для большинства существующих подходов к созданию видео.

Vlogger может генерировать видео на несколько минут из текста по сценарию без потери связности.

🖥 Code: https://github.com/zhuangshaobin/vlogger

🚀 Colab: github.com/camenduru/Moore-AnimateAnyone-colab

📚 Paper: https://arxiv.org/abs/2401.09414v1

🌟 Dataset: https://paperswithcode.com/dataset/ucf101

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍196😐5🔥4🍌2🥰1
🖥 Intel® Extension for Transformers

Инновационный набор инструментов на основе трансформеров для ускорения GenAI/LLM.

pip install intel-extension-for-transformers

#intelai #intelgpu

🖥 Code: https://github.com/intel/intel-extension-for-transformers

🚀 Docs: https://intel.github.io/intel-extension-for-transformers/latest/docs/Welcome.html

🌟 Dataset: https://huggingface.co/datasets/Intel/orca_dpo_pairs

🚀Release notes: https://github.com/intel/intel-extension-for-transformers/releases/tag/v1.3.1

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍12🥰1🍌1
InstantID : Zero-shot Identity-Preserving Generation in Seconds

InstantID - новая модель, которая может генерировать индивидуальные изображения с различными позами или стилями на основе одного эталонного изображения без какого-либо обучения!

🖥 Code: https://github.com/InstantID/InstantID

🚀 Project: https://instantid.github.io/

📚 Paper: https://arxiv.org/abs/2401.07519

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍187🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 Awesome AI Agents

Новый 🌟Кураторский списко AI-агентов🌟!.

150+ ИИ-агентов и фреймворков.
Фильтр по сценариям использования.
Фильтр по открытому/закрытому исходному коду.
Фильтр новых продуктов ИИ
Возможность получать обновления о конкретном агенте ИИ.

🖥 Github
🎮 Project

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍11🔥2👾2🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
Prompt Engineering with Llama 2— an interactive guide

Большой интерактивный гайд промпт-инжиниринг с Llama 2" - руководство по проектированию промптов с лучшими практиками для разработчиков, исследователей и энтузиастов, работающих с большими языковыми моделями.

https://github.com/facebookresearch/llama-recipes/blob/main/examples/Prompt_Engineering_with_Llama_2.ipynb

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1910🎉6🔥5🎅1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Depth Anything is now available

Monocular depth estimation is the task of estimating the depth value (distance relative to the camera) of each pixel given a single (monocular) RGB image.

Монокулярная оценка глубины - это задача определения значения глубины (расстояния относительно камеры) каждого пикселя по одному (монокулярному) RGB-изображению.

Depth Anything - это новая интересная модель от Университета Гонконга/TikTok, которая берет существующую архитектуру нейронной сети для монокулярной оценки глубины (а именно модель DPT с основой DINOv2) и увеличивает набор данных для обучения на ней.

Авторы разработтали "движок данных" для сбора и автоматического аннотирования масштабных немаркированных данных (~62 миллиона изображений), что значительно расширяет охват данных и позволяет снизить ошибку обобщения.

🖥 Code: https://github.com/NielsRogge/Transformers-Tutorials/blob/master/Depth%20Anything/Predicting_depth_in_an_image_with_Depth_Anything.ipynb

🚀 HF: https://huggingface.co/docs/transformers/v4.28.0/tasks/monocular_depth_estimation

📚 Paper: https://huggingface.co/papers/2401.10891

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍14🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
⭐️ ComfyUI-3D-Pack

Модель, генерации 3D-объектов с помощью передовых алгоритмов (3DGS, NeRF, Differentiable Rendering, SDS/VSD Optimization, и др).

ComfyUI-3D-Pack: https://github.com/MrForExample/ComfyUI-3D-Pack

TGS: https://github.com/VAST-AI-Research/TriplaneGaussian

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍8🔥5🤔3