🔝 ByteDance presents SDXL-Lightning: a lightning fast 1024px text-to-image generation model
SDXL-Lightning - это молниеносная генеративная модель преобразования текста в изображение. Она позволяет генерировать высококачественные изображения размером 1024px за несколько шагов.
▪HF: https://huggingface.co/ByteDance/SDXL-Lightning
ai_machinelearning_big_data
SDXL-Lightning - это молниеносная генеративная модель преобразования текста в изображение. Она позволяет генерировать высококачественные изображения размером 1024px за несколько шагов.
▪HF: https://huggingface.co/ByteDance/SDXL-Lightning
ai_machinelearning_big_data
👍27❤10🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
💫 Gemini великолепно анализирует входные данные и работает с ними.
Нейросети скормили видео с записью экрана по поиску квартиры на сайте Zillow. ИИ смог сгенерировать Selenium-код для автоматизации этой задачи и пошагово описал все, что делал.
Вот, что выдал Gemini, посмотрев видео по поиску квартиры:
"This code will open a Chrome browser, navigate to Zillow, enter "Cupertino, CA" in the search bar, click on the "For Rent" tab, set the price range to "Up to $3K", set the number of bedrooms to "2+", select the "Apartments/Condos/Co-ops" checkbox, click on the "Apply" button, wait for the results to load, print the results, and close the browser."
Посмотрите видео!
•Gemini
•Gemma opensource на основе Gemini.
•DeepMind Gemini 1.5 - An AI That Remembers!
ai_machinelearning_big_data
Нейросети скормили видео с записью экрана по поиску квартиры на сайте Zillow. ИИ смог сгенерировать Selenium-код для автоматизации этой задачи и пошагово описал все, что делал.
Вот, что выдал Gemini, посмотрев видео по поиску квартиры:
"This code will open a Chrome browser, navigate to Zillow, enter "Cupertino, CA" in the search bar, click on the "For Rent" tab, set the price range to "Up to $3K", set the number of bedrooms to "2+", select the "Apartments/Condos/Co-ops" checkbox, click on the "Apply" button, wait for the results to load, print the results, and close the browser."
Посмотрите видео!
•Gemini
•Gemma opensource на основе Gemini.
•DeepMind Gemini 1.5 - An AI That Remembers!
ai_machinelearning_big_data
❤38👍19🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SOTA🚀 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
🎉 Вышел YOLOv9 🎉
Новый SOTA для обнаружения объектов в реальном времени.
• Github
• Paper
• Hugging face
ai_machinelearning_big_data
🎉 Вышел YOLOv9 🎉
Новый SOTA для обнаружения объектов в реальном времени.
• Github
• Paper
• Hugging face
ai_machinelearning_big_data
👍56🔥13😁5❤4🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 NVIDIA AI Foundation Models
Вы можете тестировать модели с открытым исходным кодом, используя NVIDIAAI.
Взаимодействуйте с новейшими современными API моделей ИИ, оптимизированными на базе ускоренных вычислений NVIDIA, прямо из браузера.
https://catalog.ngc.nvidia.com/ai-foundation-models
ai_machinelearning_big_data
Вы можете тестировать модели с открытым исходным кодом, используя NVIDIAAI.
Взаимодействуйте с новейшими современными API моделей ИИ, оптимизированными на базе ускоренных вычислений NVIDIA, прямо из браузера.
Gemma 7B, Llama 2 70B, Kosmos-2, Mixtral 8x7B Instruct, Stable Diffusion X
L и многое другое 🥳 https://catalog.ngc.nvidia.com/ai-foundation-models
ai_machinelearning_big_data
👍40🔥13❤6
🎓 Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot.
Multi-HMR - это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет
▪Github
▪Paper
▪Dataset
ai_machinelearning_big_data
Multi-HMR - это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет
3D-реконструкцию
нескольких людей в пространстве.▪Github
▪Paper
▪Dataset
ai_machinelearning_big_data
🔥23👍12❤6🍌4
This media is not supported in your browser
VIEW IN TELEGRAM
🩳 👚 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on 👖
Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.
▪Github: https://github.com/levihsu/OOTDiffusion
▪Demo: https://ootd.ibot.cn
▪Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter
ai_machinelearning_big_data
Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.
▪Github: https://github.com/levihsu/OOTDiffusion
▪Demo: https://ootd.ibot.cn
▪Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter
ai_machinelearning_big_data
🔥37👍25❤5🍌2
Media is too big
VIEW IN TELEGRAM
🔥 Новый бесплатный курс: Prompt Engineering with Llama 2 от Andrew YNg and и DeepLearning.AI
Llama 2 стала очень важной моделью для всего мира ИИ.
Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.
▪Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.
▪Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.
▪Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например
В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.
📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2
ai_machinelearning_big_data
Llama 2 стала очень важной моделью для всего мира ИИ.
Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.
▪Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.
▪Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.
▪Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например
Code Llama,
помогающую писать, анализировать и улучшать код, и Llama Guard
, которая проверяет промпты и ответы моделей на наличие вредоносного содержимого. В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.
📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2
ai_machinelearning_big_data
👍30🔥8❤6🍌2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ 7 самых важных релизов недели из мира ИИ:
Это была важная неделя для мира ИИ: анонсы от
1. Исследователи Alibaba представили EMO - ИИ, который качетсвенно анимирует статическое изображение человека с синхронизацей движения губ и лица.
2. Компания Lightricks представила LTX Studio - студию для создания фильмов с помощью ИИ.
Новинка позволяет креативщикам автоматически генерировать сценарии, редактируемые раскадровки и короткие видеоклипы.
Создание видео с помощью искусственного интеллекта становится все более продвинутым с каждым днем.
3. Компания Ideogram выпустила новую версию своей модели преобразования текста в изображение.
В первую очередь, это невероятная детализация текста, сгенерированного искусственным интеллектом и новая функция
4. Apple незаметно анонсировала ИИ обновления для iOS.
Судя по тому, как продвигаются исследования в области ИИ, скоро мы увидим крупное обновление ИИ для Siri.
Возможно, это будет следующий "ChatGPT" от Apple.
5. Компания Klarna только что опубликовала блог, в котором говорится, что с помощью искусственного интеллекта они заменят 700 сотрудников службы поддержки клиентов.
Сумасшедшая статистика:
- За последний месяц чатбот обработал 2,3 млн разговоров.
- Среднее время решения проблемы сократилось на 9 минут
- 40 млн долларов дополнительной прибыли в 2024 году
6. Adobe выпустила Project Music GenAI Control.
Этот инструмент, названный "музыкальным фотошопом", позволяет легко генерировать и редактировать аудио с помощью искусственного интеллекта, позволяя авторам создавать собственные музыкальные треки с помощью текстовых промптов.
7. Компания Pika Labs представила новую функцию синхронизации губ в своем генераторе видео с искусственным интеллектом.
Новая технология позволяет создавать крайне реалистичноные анимации на базе ElevenLabs.
ai_machinelearning_big_data
Это была важная неделя для мира ИИ: анонсы от
Alibaba, Lightricks, Ideogram, Apple, Adobe, OpenAI
и многих других.1. Исследователи Alibaba представили EMO - ИИ, который качетсвенно анимирует статическое изображение человека с синхронизацей движения губ и лица.
2. Компания Lightricks представила LTX Studio - студию для создания фильмов с помощью ИИ.
Новинка позволяет креативщикам автоматически генерировать сценарии, редактируемые раскадровки и короткие видеоклипы.
Создание видео с помощью искусственного интеллекта становится все более продвинутым с каждым днем.
3. Компания Ideogram выпустила новую версию своей модели преобразования текста в изображение.
В первую очередь, это невероятная детализация текста, сгенерированного искусственным интеллектом и новая функция
Magic Prompt,
кооораяп
одскажет, как их написать и получить максимально качественный результат.4. Apple незаметно анонсировала ИИ обновления для iOS.
Судя по тому, как продвигаются исследования в области ИИ, скоро мы увидим крупное обновление ИИ для Siri.
Возможно, это будет следующий "ChatGPT" от Apple.
5. Компания Klarna только что опубликовала блог, в котором говорится, что с помощью искусственного интеллекта они заменят 700 сотрудников службы поддержки клиентов.
Сумасшедшая статистика:
- За последний месяц чатбот обработал 2,3 млн разговоров.
- Среднее время решения проблемы сократилось на 9 минут
- 40 млн долларов дополнительной прибыли в 2024 году
6. Adobe выпустила Project Music GenAI Control.
Этот инструмент, названный "музыкальным фотошопом", позволяет легко генерировать и редактировать аудио с помощью искусственного интеллекта, позволяя авторам создавать собственные музыкальные треки с помощью текстовых промптов.
7. Компания Pika Labs представила новую функцию синхронизации губ в своем генераторе видео с искусственным интеллектом.
Новая технология позволяет создавать крайне реалистичноные анимации на базе ElevenLabs.
ai_machinelearning_big_data
👍35❤9🔥3🥰1😱1🍌1
🎓 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement
Самосовершенствующийся диалоговый агент, который интегрируется в операционную систему для автоматизации повседневных задач.
OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС.
Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи.
Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями.
▪Github
▪Project
▪Статья
ai_machinelearning_big_data
Самосовершенствующийся диалоговый агент, который интегрируется в операционную систему для автоматизации повседневных задач.
OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС.
Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи.
Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями.
▪Github
▪Project
▪Статья
ai_machinelearning_big_data
👍30❤5🔥2
Media is too big
VIEW IN TELEGRAM
OpenCodeInterpreter — семейство моделей с открытым исходным кодом, предназначенных для генерации, выполнения и итеративного уточнения кода.
OpenCodeInterpreter, поддерживаемый Code-Feedback, набором данных, включающим 68 тыс. многошаговых взаимодействий, объединяет выполнение и обратную связь с человеком для уточнения кода.
Оценка OpenCodeInterpreter в таких тестах, как HumanEval, MBPP показывает его исключительную производительность с точностью 83,2 (76,4) в среднем (и в плюс версии), что близко к точности GPT-4 — 84,2 (76,2).
При этом точность может быть повышена до 91,6 (84,6).
🔗 Описание и сами модели OpenCodeInterpreter
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥5❤3🤔1🤣1
🧬 Evo: DNA foundation modeling from molecular to genome scale
Эволюция геномного проектирования: роль нейросетей в биологической революции.
Ученые достигли значительного прорыва в биологии с разработкой нейросети Evo-1, которая способна моделировать ДНК, РНК и белки.
Этот инновационный продукт открывает новые горизонты в моделировании биологических последовательностей на различных масштабах, начиная от молекулярного уровня и до полногеномного анализа.
Искусственный интеллект Evo-1 обладает огромным потенциалом для создания новых модификаций CRISPR, предназначенных для лечения различных заболеваний. Эта технология также позволяет создавать материалы с заданными свойствами и тестировать гены в симуляциях, что в свою очередь значительно ускоряет научные исследования и открывает новые перспективы в области генетики.
Одним из ключевых преимуществ Evo-1 является его способность оперативно анализировать генетические последовательности и предсказывать их влияние на организм. Это делает нейросеть эффективным инструментом для исследований в области медицины, агропромышленности и биотехнологий.
Благодаря Evo-1 значительно расширяются возможности генетического проектирования и манипулирования ДНК. Ученые могут более точно изучать структуру генома различных организмов, выявлять гены, ответственные за конкретные болезни, и разрабатывать индивидуализированные подходы к лечению.
Таким образом, нейросеть Evo-1 представляет собой значительный шаг вперед в области генетического инжиниринга и биомедицины. Ее использование обещает революционизировать множество областей науки и привнести новые возможности в борьбе с генетическими заболеваниями и создании инновационных биологических материалов.
🖥 GitHub
@ai_machinelearning_big_data
Эволюция геномного проектирования: роль нейросетей в биологической революции.
Ученые достигли значительного прорыва в биологии с разработкой нейросети Evo-1, которая способна моделировать ДНК, РНК и белки.
Этот инновационный продукт открывает новые горизонты в моделировании биологических последовательностей на различных масштабах, начиная от молекулярного уровня и до полногеномного анализа.
Искусственный интеллект Evo-1 обладает огромным потенциалом для создания новых модификаций CRISPR, предназначенных для лечения различных заболеваний. Эта технология также позволяет создавать материалы с заданными свойствами и тестировать гены в симуляциях, что в свою очередь значительно ускоряет научные исследования и открывает новые перспективы в области генетики.
Одним из ключевых преимуществ Evo-1 является его способность оперативно анализировать генетические последовательности и предсказывать их влияние на организм. Это делает нейросеть эффективным инструментом для исследований в области медицины, агропромышленности и биотехнологий.
Благодаря Evo-1 значительно расширяются возможности генетического проектирования и манипулирования ДНК. Ученые могут более точно изучать структуру генома различных организмов, выявлять гены, ответственные за конкретные болезни, и разрабатывать индивидуализированные подходы к лечению.
Таким образом, нейросеть Evo-1 представляет собой значительный шаг вперед в области генетического инжиниринга и биомедицины. Ее использование обещает революционизировать множество областей науки и привнести новые возможности в борьбе с генетическими заболеваниями и создании инновационных биологических материалов.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍16❤7
📹 ML-инженер Яндекса рассказал, как в Браузер встроили модель YandexGPT, которая умеет пересказывать видео
В статье на Хабре объяснили, почему суммаризация статей не то же самое, что суммаризация видео, как научить YandexGPT пересказывать даже очень длинные видео, и сравнили подходы p-tune, LoRa и fine-tune.
ai_machinelearning_big_data
В статье на Хабре объяснили, почему суммаризация статей не то же самое, что суммаризация видео, как научить YandexGPT пересказывать даже очень длинные видео, и сравнили подходы p-tune, LoRa и fine-tune.
ai_machinelearning_big_data
❤18🔥8🥰2👍1😁1