Технозаметки Малышева

VASA-1: Прорыв в генерации реалистичных видео с виртуальными персонажами

Исследователи из Microsoft Research Asia представили новый фреймворк VASA-1 для генерации реалистичных говорящих лиц виртуальных персонажей на основе одного статического изображения и аудиозаписи речи.
Ключевые особенности VASA-1:
- Точная синхронизация движений губ с аудио
- Реалистичная мимика лица, отражающая широкий спектр эмоций и нюансов
- Естественные движения головы
- Генерация видео высокого качества (512x512) в режиме реального времени (до 40 кадров/с) с минимальной задержкой
Основные инновации включают целостную модель генерации динамики лица и движений головы в скрытом пространстве, а также разработку такого выразительного скрытого пространства с помощью обучения на видео.
Метод значительно превосходит предыдущие подходы по различным показателям и позволяет управлять направлением взгляда, расстоянием до головы и эмоциональной окраской.
VASA-1 демонстрирует хорошую работу на данных, выходящих за рамки обучающей выборки (художественные фото, пение, речь на других языках).
Разделение скрытого представления на внешность, 3D позу головы и динамику лица дает возможность раздельно редактировать эти атрибуты в сгенерированном видео.

#VASA1 #VirtualAvatars #VideoGeneration

🔥3❤1

118 views07:21

Технозаметки Малышева

Forwarded from Сиолошная

Ждём LLAMA 3 сегодня? 🚨

Уже на двух площадках засветились новые модели — сайт Replicate для развёртывания моделей и Microsoft Azure, один из крупнейших облачных провайдеров. На обоих указана версия модели на 8B параметров (против общепринятых 7), а на первом ещё есть 70B версия. Согласно утечкам, планируется сначала выпустить две модели «меньшего размера» — 70B не очень-то в это вписывается! Или, быть может, они готовят титана 150B+? Поживём - увидим.

Сейчас в Калифорнии почти 8 утра 🚬 возможно, официальный анонс будет в ближайшие 4 часа.

Главных вопроса два:
— будут ли эти модели хоть как-то лучше оных от Mistral и Cohere?
— будет ли опубликована статья с техническими деталями процесса обучения?

В опросе ниже можно делать ставки!

Please open Telegram to view this post

VIEW IN TELEGRAM

94 views14:46

Технозаметки Малышева

Llama 3: передовая открытая языковая модель

Представлена Llama 3 - новое поколение мощных открытых языковых моделей с 8 и 70 миллиардами параметров.
Цель - создать лучшие открытые модели, сравнимые с ведущими проприетарными решениями.
Улучшения: усовершенствованный токенизатор, групповое внимание запросов (GQA), обучение на длинных последовательностях.
Обучение на более 15 триллионах токенов, включая данные на 30+ языках, с масштабированием на 24576 ГПУ H100.
Применена инструкционная настройка с управляемой тонкой настройкой и оптимизацией политики.
Внедрена система ответственного развертывания с инструментами безопасности и доверия.
Llama 3 доступна на всех основных платформах, включая облачных провайдеров и API.
Планируется выпуск более крупных моделей Llama 3 с мультимодальностью, мультиязычностью и длинным контекстным окном.

https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6

https://llama3.replicate.dev/

Теперь нужно железо, которое это вытащит

#Llama3 #OpenSource #LLM
-------
@tsingular

148 viewsedited 16:46

Технозаметки Малышева

Forwarded from Dealer.AI

106 views17:25

Технозаметки Малышева

24тысячи видеокарт по цене 3млн. р каждая примерно. это на круг порядка $1млрд за модель по мощности равной GPT4.
при этом сейчас инвестируют в модели по $100млрд.
пока построят, пока обучат, - пару лет пройдет и будут у нас модели в х100 мощнее.
за это время Альтман таки найдёт свои $7млрд и как раз к 2029му будет у нас ASI.

———
@tsingular

109 viewsedited 17:31

Технозаметки Малышева

0:13

Media is too big

VIEW IN TELEGRAM

Клодопус умеет красивые штуки в пару запросов делать. :)

Исходник
↑↓ - скорость фона
←→ - скорость движения времени
space - управлять временем :)

#Matrix #Claude #Opus
———
@tsingular

🔥1

102 viewsedited 19:53

Технозаметки Малышева

Forwarded from Tensor Banana

llama-3 gguf
Затестил Meta-Llama-3-8B.Q5_0.gguf в кобольде - полет нормальный. Русский лучше чем в мистрале, но хуже чем в вихре. На интеллект на русском пока не оценивал. И пока не понял, там base или chat версия у llama-3-8b без пометки instruct.

llama-3-8b base or chat?: https://huggingface.co/QuantFactory/Meta-Llama-3-8B-GGUF/tree/main
llama-3-8b instruct: https://huggingface.co/QuantFactory/Meta-Llama-3-8B-Instruct-GGUF/tree/main
llama-3-70b instruct: https://huggingface.co/MaziyarPanahi/Meta-Llama-3-70B-Instruct-GGUF

106 views20:35

Технозаметки Малышева

Воспитание ребенка,- это 18 лет промпт инжиниринга :)

#Musk
------
@tsingular

😁2❤1

150 views04:17

Технозаметки Малышева

1:02

This media is not supported in your browser

VIEW IN TELEGRAM

Reka Core: еще одна мультимодальная модель

Компания Reka AI представила свою самую крупную и высокопроизводительную мультимодальную модель - Reka Core. 🚀
Ключевые характеристики Reka Core:
- Близка по уровню к: GPT-4, Claude-3 Opus и Gemini Ultra
- Превосходные возможности распознавания изображений, видео и аудио 📷🎥🎧
- Контекстное окно - 128K.
- Способности к рассуждению в том числе в математическом анализе и написании кода.
- Предобучена на 32 языках, свободно владеет английским и несколькими азиатскими и европейскими языками 🌍
Доступна по API или локально (через подтверждение у разработчиков в ручном режиме).

Пробовать можно тут без VPN:
https://chat.reka.ai/chat

+1 игрок в копилку.

#RekaAI #MultimodalAI #LanguageModel
-------
@tsingular

114 viewsedited 05:00

Технозаметки Малышева

NVIDIA форсирует Llama 3

NVIDIA оптимизировала свои платформы для ускорения Llama 3.

Llama 3 обучалась на кластере с 24 576 GPU NVIDIA H100 Tensor Core. Планируется масштабирование до 350 000 GPU H100.

Новые версии Llama 3 доступны в облаке, ЦОД, на периферии и ПК.

Разработчики могут опробовать Llama 3 через ai.nvidia.com.
Бизнес может настраивать модель с помощью NVIDIA NeMo.

Llama 3 работает как на NVIDIA Jetson Orin для роботов и периферийных устройств, так и на GPU NVIDIA RTX.

Сервер NVIDIA HGX с 8 GPU H200 может обслуживать более 2400 пользователей одновременно.

Llama3 в Nvidia Orin - это значит можно уже делать очень разумных роботов самостоятельно.
(Llama 3 8B generated up to 40 tokens/second on Jetson AGX Orin)

#Llama3 #NVIDIA #acceleration
-------
@tsingular

112 viewsedited 05:22

Технозаметки Малышева

1:33

Media is too big

VIEW IN TELEGRAM

Adobe Express с ИИ Firefly мобильный контент на ходу

Новое мобильное приложение Adobe Express с ИИ Firefly доступно миллионам пользователей.
Оно позволяет быстро создавать качественный контент: посты, видео, флаеры, логотипы и др.
Приложение объединяет инструменты Adobe для фото, дизайна, видео и ИИ в одном редакторе.
Firefly автоматизирует генерацию изображений по тексту, замену фонов, анимацию из аудио, создание субтитров.
Ускоряет публикацию благодаря функциям создания дизайнов, редактирования медиа, планирования постов.
Интегрировано с TikTok, ChatGPT, Kajabi. Синхронизирует рабочие процессы для подписчиков Creative Cloud.

Мобильное приложение «всё в одном» для создания контента. Маркетинг оценит :).

#AdobeExpress #Firefly #ContentCreation
-------
@tsingular

128 viewsedited 05:44

Технозаметки Малышева

Новые "ИИ тигры" Китая

Группа китайских стартапов в области ИИ, включая Baichuan, Zhipu AI, Moonshot AI и MiniMax, выделяется как самые перспективные компании, работающие над технологиями, подобными ChatGPT. 🚀

Baichuan (百川智能):
- Разработала собственные ИИ-модели, последняя версия которых превзошла GPT-4 по возможностям работы с китайским языком.
- Привлекла инвестиции от Tencent, Xiaomi и Alibaba Group.
- Основана Ван Сяочуанем, бывшим главой Sogou.

Zhipu AI (智谱 AI):
- Создает фундаментальные модели на базе исследований Университета Цинхуа.
- Привлекла инвестиции от государственных фондов, Alibaba, Tencent, Meituan и венчурных инвесторов.
- Основана Чжан Пэном, выпускником факультета компьютерных наук Университета Цинхуа.

Moonshot AI (Пекин):
- Разработала чат-бот Kimi, способный обрабатывать до 2 млн китайских иероглифов в одном запросе.
- Привлекла инвестиции в размере $1 млрд.

MiniMax (Шанхай):
- Ожидает привлечения инвестиций в размере не менее $600 млн под руководством Alibaba.
- Оценочная стоимость компании превышает $2,5 млрд.

#China #AI #startups
-------
@tsingular

127 viewsedited 06:02

Технозаметки Малышева

Forwarded from Анализ данных (Data analysis)

📌

Сверхполезный открытый учебник по Machine Learning

Здесь собрана коллекция задачек о нейросетях, параллельно даётся необходимая теория с объяснением
Очень годно, рекомендую

Что внутри?
├╼ всего лишь функция
├╼ градиентный спуск
├╼ алгоритм обратного распространения ошибки
├╼ что выплёвывает нейросеть
├╼ свёрточные сети
├╼ нейросети – конструктор LEGO
├╼ рекуррентные сети
╰╼ матричное дифференцирование

📎

Учебник

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

128 views08:47

Технозаметки Малышева

GPTshop.ai - конфигуратор настольного суперкомпьютера GH200

На сайте GPTshop.ai доступен конфигуратор для сборки настольного суперкомпьютера GH200.
Пользователи могут выбирать компоненты, такие как процессор, оперативную память, накопители и графические процессоры.
Цены указаны в долларах США.
Конфигуратор позволяет подобрать оптимальную конфигурацию под свои задачи и бюджет.

Если нужно запустить Llama3 405B локально.

#GPTshop #GH200 #supercomputer #ПК #компьютер

136 viewsedited 18:23

Технозаметки Малышева

В общем, чтобы попробовать Llama 3 локально без регистрации, смс и VPN достаточно лишь...

обновить LM Studio или скачать, если вы ещё не.
https://lmstudio.ai/

дальше в поиске моделей забиваете
lmstudio llama 3
и качаете на что хватит видеокарты.

результаты вполне приличные для локальной модели.

#LMStuidio #Llama3
———
@tsingular

151 viewsedited 19:46

About

Blog

Apps

Platform