305K subscribers
4K photos
708 videos
17 files
4.59K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🎓 Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot.

Multi-HMR
- это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет 3D-реконструкцию нескольких людей в пространстве.

Github
Paper
Dataset

ai_machinelearning_big_data
🔥23👍126🍌4
This media is not supported in your browser
VIEW IN TELEGRAM
🩳 👚 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on 👖

Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.

Github: https://github.com/levihsu/OOTDiffusion
Demo: https://ootd.ibot.cn
Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter

ai_machinelearning_big_data
🔥37👍255🍌2
Media is too big
VIEW IN TELEGRAM
🔥 Новый бесплатный курс: Prompt Engineering with Llama 2 от Andrew YNg and и DeepLearning.AI

Llama 2 стала очень важной моделью для всего мира ИИ.

Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.

Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.

Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.

Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например Code Llama, помогающую писать, анализировать и улучшать код, и Llama Guard, которая проверяет промпты и ответы моделей на наличие вредоносного содержимого.

В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.

📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2

ai_machinelearning_big_data
👍30🔥86🍌2😁1
⚡️ 7 самых важных релизов недели из мира ИИ:

Это была важная неделя для мира ИИ: анонсы от Alibaba, Lightricks, Ideogram, Apple, Adobe, OpenAI и многих других.

1. Исследователи Alibaba представили EMO - ИИ, который качетсвенно анимирует статическое изображение человека с синхронизацей движения губ и лица.

2. Компания
Lightricks представила LTX Studio - студию для создания фильмов с помощью ИИ.

Новинка позволяет креативщикам автоматически генерировать сценарии, редактируемые раскадровки и короткие видеоклипы.
Создание видео с помощью искусственного интеллекта становится все более продвинутым с каждым днем.

3. Компания Ideogram выпустила новую версию своей модели преобразования текста в изображение.

В первую очередь, это невероятная детализация текста, сгенерированного искусственным интеллектом и новая функция Magic Prompt, кооораяподскажет, как их написать и получить максимально качественный результат.

4. Apple незаметно анонсировала ИИ обновления для iOS.

Судя по тому, как продвигаются исследования в области ИИ, скоро мы увидим крупное обновление ИИ для Siri.
Возможно, это будет следующий "ChatGPT" от Apple.

5. Компания Klarna только что опубликовала блог, в котором говорится, что с помощью искусственного интеллекта они заменят 700 сотрудников службы поддержки клиентов.

Сумасшедшая статистика:
- За последний месяц чатбот обработал 2,3 млн разговоров.
- Среднее время решения проблемы сократилось на 9 минут
- 40 млн долларов дополнительной прибыли в 2024 году

6. Adobe выпустила Project Music GenAI Control.

Этот инструмент, названный "музыкальным фотошопом", позволяет легко генерировать и редактировать аудио с помощью искусственного интеллекта, позволяя авторам создавать собственные музыкальные треки с помощью текстовых промптов.

7. Компания Pika Labs представила новую функцию синхронизации губ в своем генераторе видео с искусственным интеллектом.

Новая технология позволяет создавать крайне реалистичноные анимации на базе ElevenLabs.

ai_machinelearning_big_data
👍359🔥3🥰1😱1🍌1
🎓 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement

Самосовершенствующийся диалоговый агент, который интегрируется в операционную систему для автоматизации повседневных задач.

OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС.

Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи.

Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями.

Github
Project
Статья

ai_machinelearning_big_data
👍305🔥2
Media is too big
VIEW IN TELEGRAM
⚡️OpenCodeInterpreter

OpenCodeInterpreter — семейство моделей с открытым исходным кодом, предназначенных для генерации, выполнения и итеративного уточнения кода.
OpenCodeInterpreter, поддерживаемый Code-Feedback, набором данных, включающим 68 тыс. многошаговых взаимодействий, объединяет выполнение и обратную связь с человеком для уточнения кода.
Оценка OpenCodeInterpreter в таких тестах, как HumanEval, MBPP показывает его исключительную производительность с точностью 83,2 (76,4) в среднем (и в плюс версии), что близко к точности GPT-4 — 84,2 (76,2).
При этом точность может быть повышена до 91,6 (84,6).

🔗 Описание и сами модели OpenCodeInterpreter

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥53🤔1🤣1
🧬 Evo: DNA foundation modeling from molecular to genome scale

Эволюция геномного проектирования: роль нейросетей в биологической революции.

Ученые достигли значительного прорыва в биологии с разработкой нейросети Evo-1, которая способна моделировать ДНК, РНК и белки.
Этот инновационный продукт открывает новые горизонты в моделировании биологических последовательностей на различных масштабах, начиная от молекулярного уровня и до полногеномного анализа.

Искусственный интеллект Evo-1 обладает огромным потенциалом для создания новых модификаций CRISPR, предназначенных для лечения различных заболеваний. Эта технология также позволяет создавать материалы с заданными свойствами и тестировать гены в симуляциях, что в свою очередь значительно ускоряет научные исследования и открывает новые перспективы в области генетики.

Одним из ключевых преимуществ Evo-1 является его способность оперативно анализировать генетические последовательности и предсказывать их влияние на организм. Это делает нейросеть эффективным инструментом для исследований в области медицины, агропромышленности и биотехнологий.

Благодаря Evo-1 значительно расширяются возможности генетического проектирования и манипулирования ДНК. Ученые могут более точно изучать структуру генома различных организмов, выявлять гены, ответственные за конкретные болезни, и разрабатывать индивидуализированные подходы к лечению.

Таким образом, нейросеть Evo-1 представляет собой значительный шаг вперед в области генетического инжиниринга и биомедицины. Ее использование обещает революционизировать множество областей науки и привнести новые возможности в борьбе с генетическими заболеваниями и создании инновационных биологических материалов.

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍167
📹 ML-инженер Яндекса рассказал, как в Браузер встроили модель YandexGPT, которая умеет пересказывать видео

В статье на Хабре объяснили, почему суммаризация статей не то же самое, что суммаризация видео, как научить YandexGPT пересказывать даже очень длинные видео, и сравнили подходы p-tune, LoRa и fine-tune.

ai_machinelearning_big_data
18🔥8🥰2👍1😁1
🖼 Differential Diffusion: Giving Each Pixel Its Strength 🔥

Новый фреймворк, который позволяет настраивать количество изменений на сгенерированных изображениях на пиксель или на область изображения.

Фреймворк может быть интегрирован в любую существующую модель генерация, расширяя ее за счет этой возможности.

Такой детальный контроль количества изменений открывает широкий спектр новых возможностей редактирования, таких как контроль степени модификации отдельных объектов или возможность вносить постепенные пространственные изменения.

Фремворк не требует обучения или тонкой настройки.

code: github.com/exx8/differential-diffusion
page: differential-diffusion.github.io
paper: arxiv.org/abs/2306.00950

ai_machinelearning_big_data
🔥26👍82
🔥 SOTA: Stable Diffusion 3:вышла! 🔥

Stable Diffusion 3 - это новая технология преобразования текста в изображение SOTA.

Новая архитектура Multimodal Diffusion Transformer (MM Bit) использует отдельные наборы весов для изображений и языка, улучшая возможности понимания текста / правописания.

Новая масштабируемая архитектура для синтеза текста в изображение
Двунаправленное смешивание потоков токенов текста и изображений
Самые крупные модели превосходят открытые модели SOTA, такие как SDXL

Blog: https://stability.ai/news/stable-diffusion-3-research-paper
Paper: https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf

ai_machinelearning_big_data
👍32🔥85🎉1🥴1