304K subscribers
4.04K photos
715 videos
17 files
4.6K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🔝 ByteDance presents SDXL-Lightning: a lightning fast 1024px text-to-image generation model

SDXL-Lightning - это молниеносная генеративная модель преобразования текста в изображение. Она позволяет генерировать высококачественные изображения размером 1024px за несколько шагов.

HF: https://huggingface.co/ByteDance/SDXL-Lightning

ai_machinelearning_big_data
👍2710🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
💫 Gemini великолепно анализирует входные данные и работает с ними.

Нейросети скормили видео с записью экрана по поиску квартиры на сайте Zillow. ИИ смог сгенерировать Selenium-код для автоматизации этой задачи и пошагово описал все, что делал.

Вот, что выдал Gemini, посмотрев видео по поиску квартиры:

"This code will open a Chrome browser, navigate to Zillow, enter "Cupertino, CA" in the search bar, click on the "For Rent" tab, set the price range to "Up to $3K", set the number of bedrooms to "2+", select the "Apartments/Condos/Co-ops" checkbox, click on the "Apply" button, wait for the results to load, print the results, and close the browser."

Посмотрите видео!

Gemini
Gemma opensource на основе Gemini.
DeepMind Gemini 1.5 - An AI That Remembers!

ai_machinelearning_big_data
38👍19🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SOTA🚀 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

🎉 Вышел YOLOv9 🎉

Новый SOTA для обнаружения объектов в реальном времени.

Github
Paper
Hugging face

ai_machinelearning_big_data
👍56🔥13😁54🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 NVIDIA AI Foundation Models

Вы можете тестировать модели с открытым исходным кодом, используя NVIDIAAI.

Взаимодействуйте с новейшими современными API моделей ИИ, оптимизированными на базе ускоренных вычислений NVIDIA, прямо из браузера.

Gemma 7B, Llama 2 70B, Kosmos-2, Mixtral 8x7B Instruct, Stable Diffusion XL и многое другое 🥳

https://catalog.ngc.nvidia.com/ai-foundation-models

ai_machinelearning_big_data
👍40🔥136
🎓 Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot.

Multi-HMR
- это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет 3D-реконструкцию нескольких людей в пространстве.

Github
Paper
Dataset

ai_machinelearning_big_data
🔥23👍126🍌4
This media is not supported in your browser
VIEW IN TELEGRAM
🩳 👚 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on 👖

Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.

Github: https://github.com/levihsu/OOTDiffusion
Demo: https://ootd.ibot.cn
Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter

ai_machinelearning_big_data
🔥37👍255🍌2
Media is too big
VIEW IN TELEGRAM
🔥 Новый бесплатный курс: Prompt Engineering with Llama 2 от Andrew YNg and и DeepLearning.AI

Llama 2 стала очень важной моделью для всего мира ИИ.

Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.

Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.

Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.

Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например Code Llama, помогающую писать, анализировать и улучшать код, и Llama Guard, которая проверяет промпты и ответы моделей на наличие вредоносного содержимого.

В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.

📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2

ai_machinelearning_big_data
👍30🔥86🍌2😁1
⚡️ 7 самых важных релизов недели из мира ИИ:

Это была важная неделя для мира ИИ: анонсы от Alibaba, Lightricks, Ideogram, Apple, Adobe, OpenAI и многих других.

1. Исследователи Alibaba представили EMO - ИИ, который качетсвенно анимирует статическое изображение человека с синхронизацей движения губ и лица.

2. Компания
Lightricks представила LTX Studio - студию для создания фильмов с помощью ИИ.

Новинка позволяет креативщикам автоматически генерировать сценарии, редактируемые раскадровки и короткие видеоклипы.
Создание видео с помощью искусственного интеллекта становится все более продвинутым с каждым днем.

3. Компания Ideogram выпустила новую версию своей модели преобразования текста в изображение.

В первую очередь, это невероятная детализация текста, сгенерированного искусственным интеллектом и новая функция Magic Prompt, кооораяподскажет, как их написать и получить максимально качественный результат.

4. Apple незаметно анонсировала ИИ обновления для iOS.

Судя по тому, как продвигаются исследования в области ИИ, скоро мы увидим крупное обновление ИИ для Siri.
Возможно, это будет следующий "ChatGPT" от Apple.

5. Компания Klarna только что опубликовала блог, в котором говорится, что с помощью искусственного интеллекта они заменят 700 сотрудников службы поддержки клиентов.

Сумасшедшая статистика:
- За последний месяц чатбот обработал 2,3 млн разговоров.
- Среднее время решения проблемы сократилось на 9 минут
- 40 млн долларов дополнительной прибыли в 2024 году

6. Adobe выпустила Project Music GenAI Control.

Этот инструмент, названный "музыкальным фотошопом", позволяет легко генерировать и редактировать аудио с помощью искусственного интеллекта, позволяя авторам создавать собственные музыкальные треки с помощью текстовых промптов.

7. Компания Pika Labs представила новую функцию синхронизации губ в своем генераторе видео с искусственным интеллектом.

Новая технология позволяет создавать крайне реалистичноные анимации на базе ElevenLabs.

ai_machinelearning_big_data
👍359🔥3🥰1😱1🍌1
🎓 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement

Самосовершенствующийся диалоговый агент, который интегрируется в операционную систему для автоматизации повседневных задач.

OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС.

Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи.

Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями.

Github
Project
Статья

ai_machinelearning_big_data
👍305🔥2
Media is too big
VIEW IN TELEGRAM
⚡️OpenCodeInterpreter

OpenCodeInterpreter — семейство моделей с открытым исходным кодом, предназначенных для генерации, выполнения и итеративного уточнения кода.
OpenCodeInterpreter, поддерживаемый Code-Feedback, набором данных, включающим 68 тыс. многошаговых взаимодействий, объединяет выполнение и обратную связь с человеком для уточнения кода.
Оценка OpenCodeInterpreter в таких тестах, как HumanEval, MBPP показывает его исключительную производительность с точностью 83,2 (76,4) в среднем (и в плюс версии), что близко к точности GPT-4 — 84,2 (76,2).
При этом точность может быть повышена до 91,6 (84,6).

🔗 Описание и сами модели OpenCodeInterpreter

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥53🤔1🤣1
🧬 Evo: DNA foundation modeling from molecular to genome scale

Эволюция геномного проектирования: роль нейросетей в биологической революции.

Ученые достигли значительного прорыва в биологии с разработкой нейросети Evo-1, которая способна моделировать ДНК, РНК и белки.
Этот инновационный продукт открывает новые горизонты в моделировании биологических последовательностей на различных масштабах, начиная от молекулярного уровня и до полногеномного анализа.

Искусственный интеллект Evo-1 обладает огромным потенциалом для создания новых модификаций CRISPR, предназначенных для лечения различных заболеваний. Эта технология также позволяет создавать материалы с заданными свойствами и тестировать гены в симуляциях, что в свою очередь значительно ускоряет научные исследования и открывает новые перспективы в области генетики.

Одним из ключевых преимуществ Evo-1 является его способность оперативно анализировать генетические последовательности и предсказывать их влияние на организм. Это делает нейросеть эффективным инструментом для исследований в области медицины, агропромышленности и биотехнологий.

Благодаря Evo-1 значительно расширяются возможности генетического проектирования и манипулирования ДНК. Ученые могут более точно изучать структуру генома различных организмов, выявлять гены, ответственные за конкретные болезни, и разрабатывать индивидуализированные подходы к лечению.

Таким образом, нейросеть Evo-1 представляет собой значительный шаг вперед в области генетического инжиниринга и биомедицины. Ее использование обещает революционизировать множество областей науки и привнести новые возможности в борьбе с генетическими заболеваниями и создании инновационных биологических материалов.

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍167
📹 ML-инженер Яндекса рассказал, как в Браузер встроили модель YandexGPT, которая умеет пересказывать видео

В статье на Хабре объяснили, почему суммаризация статей не то же самое, что суммаризация видео, как научить YandexGPT пересказывать даже очень длинные видео, и сравнили подходы p-tune, LoRa и fine-tune.

ai_machinelearning_big_data
18🔥8🥰2👍1😁1