Дмитрий Савостьянов Вещает
733 subscribers
299 photos
84 videos
1 file
232 links
Про AI в играх, стартапы, переезд в Лос-Анджелес и немножко мемов.

ЛС: https://t.iss.one/KPACAB4NK_PELLIAET_BOTTPOCbl
Download Telegram
Forwarded from Сиолошная
Anthropic раскаляет AI-гонку, выпуская Claude 3 в трёх версиях: Opus, Sonnet, и Haiku.

На всех достаточно важных бенчмарках Opus показывают существенный прирост относительно GPT-4.

Opus, наша самая интеллектуальная модель, достигает возможностей понимания, близких к человеческому. Она может ловко обрабатывать широко сформулированные запросы и решать сложные задачи.

— Добавили новую модальность, модель принимает на вход картинки (а значит и видеоряд — как последовательность кадров)
— Лучше понимает языки, отличные от английского (в частности испанский, японский и фрацузский)
— Контекст всё еще 200к токенов
— Цена Opus $15/$75 за 1M токенов на вход и на выход соответственно. Для сравнения GPT-4-turbo стоит $10/$30
— Также обещают, что самая мощная модель имеет «more advanced agentic capabilities», что бы это ни значило :)
— Вдобавок, к модели подключили интерпретатор кода и возможность добавлять свои собственные инструменты
— Самый большой прирост метрик — на задачах, связанных с математикой. Даже без примеров в промпте модель показывает себя лучше, чем Gemini Ultra / GPT-4. Круто, если не переобучение, особенно в контексте того, что модели — НАПОМНЮ, ЭТО МНОГИЕ УПУСКАЮТ — будут использоваться для АВТОМАТИЗАЦИИ научных исследований.

Модели доступны по API сегодня всем, никакого листа ожидания больше нет. Для подписчиков Pro на сайте уже должна быть доступна модель Opus, а Sonet достанется бесплатным пользователям. Заходите: claude.ai

Ночью ждём релиза GPT-4.5 как симметричный ответ, видимо 😐 Почему? Потому что релиз Арракиса (кодовое название проекта в OpenAI) отложили до выпуска Дюны 2 😀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Срач между Илоном Маском и OpenAI набирает обороты. Последние в ответ на иск выложили часть переписки в паблик

https://openai.com/blog/openai-elon-musk
😁3
This media is not supported in your browser
VIEW IN TELEGRAM
С 2021 года не катался на BMX. А тут взял и раздал. Держу вас в курсе, не благодарите.
🔥33
This media is not supported in your browser
VIEW IN TELEGRAM
В Вильнюсе народ вышел погулять в воскресный полдень. Голосуют что ли против кого-то?😏
8🔥2👏1🖕1
Дмитрий Савостьянов Вещает
Photo
Внезапно мем становится снова актуальным ))
😁5
Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation

Китайци подвезли СОТУ по монокулярному Pose and Shape estimation. То есть по одному кадру предсказывается 3D поза и форма человека. Покадрово можо применить к любому видео-потоку.

Тут как всегда зарешал масштаб модели и данных. Взяли трансоформер ViT-H на 662M параметров и тренировали на 32 датасетах с 4.5М фреймов, что как бы тоже дохрена для этой задачи.

ViT-H по меркам современного CV не такой уж и большой, но больше чем, все что пробовали на задаче Shape&Pose Estimation до этого, да и довольно шустрый. Скорость инференса даже почти риалтаймовая получилась - 17.5 FPS на Nvidia V100.

Код и веса на гитхабе
Сайт проекта
Статья
Demo на HF

@ai_newz
👍1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
VastGaussian — SOTA по реконструкции огромных 3D сцен

Гауссовские сплаты конкретно заняли поляну Нерфов в 3D реконструкции. До этого момента были проблемы с использованием сплатов для больших сцен, но теперь и их решили. Получается рендеринг посто высочайшей детализации. Ещё и real-time! Смотрите видео.

Сайт проекта с деталями

@ai_newz
👍3
Сегодня наблюдал ситуацию, чел выпилил очередь на Redis + RQ и реализовал на триггерах в PostreSQL.
😁5
Бывает так открываешь календарь в понедельник и думаешь "Ёб твою мать". А потом понимаешь, что это прошлая неделя и становится чуточку легче.
😁72🔥1
OpenAI без страха, без уважения.
Forwarded from 42 секунды
NYT: OpenAI расшифровала миллионы видео на YouTube для обучения модели GPT-4

– OpenAI перестало хватать авторитетных источников около 2022
– Ей потребовалось больше англоязычных текстов для обучения
– OpenAI создала сервис распознавания речи из видео Whisper
– Whisper расшифровывал речь из миллионов видео на YouTube
– При этом подобное решение противоречило правилам сервиса
– Все же OpenAI расшифровала 1+ млн часов видео на YouTube
– Затем тексты расшифровки загружались для модели GPT-4
– Об этом знали часть сотрудников Google, но не остановили ее
– Они боялись, что шумиха покажет, что Google тоже так делает
– Google также использовал видео на YouTube для своего ИИ
– Это потенциально нарушало авторские права их создателей
– Исследователи Цукерберга также думали про обход правил
– Они согласились собирать данные под авторским правом
– Переговоры про права заняли бы слишком много времени

@ftsec
😱4😁3
Паша Дуров анонсировал годные криптофичи в Telegram

- CEO Tether официально анонсировал запуск USDT на блокчейне TON
- В Telegram появится возможность покупать цифровые товары за криптовалюту.
- Telegram собирается токенизировать стикеры и эмоджи
- С сегодняшнего дня владельцы каналов начнут получать первые выплаты в TON с рекламы
👏9
Там Meta выкатили real-time text-to-image — мое уважение
Forwarded from эйай ньюз
Принес еще несколько примеров как работает наш Imagine Flash.

Попробовать можно на meta.ai под американским VPN-ом.

@ai_newz
9
Вакансия ML Engineer в Artifactory

Ищу крепкого Middle ML Engineer в проект по генерации анимаций. Фокус на 3D-персонажах в играх.

Работать предстоит непосредственно со мной над задачами:
- Изучение кода статей
- Ретаргетинг — перенос анимаций между скелетами различных персонажей
- Пайплайны подготовки данных и обучения моделей
- Интеграция результатов в прод
- Эксперименты с LLM для ускорения вышеперечисленного

ML:
- VQ-VAE
- Transformers
- Reinforcement Learning
- Diffusion Models

Стэк:
- PyTorch, SciPy, Numpy, Matplotlib
- ClearML, Google Cloud
- Flask, GraphQL
- PostgreSQL, Redis

Необязательно иметь опыт во всем, достаточно иметь хорошую базу и огонь в глазах.

Зарплата в евро или USDT. Можно парт-тайм.

За успешную рекомендацию шлю лучи добра и $200, либо играю с вами пару каток в дотку/кс 😏

Пишите в лс: @KPACAB4NK_PELLIAET_BOTTPOCbl
🔥12
Forwarded from AbstractDL
This media is not supported in your browser
VIEW IN TELEGRAM
StoryDiffusion: генерация консистентных наборов изображений без дообучения

Если вам нужно сгенерировать последовательную историю из фотографий, чтобы везде чётко прослеживалась единая локация, а главные персонажи не меняли одежду и причёску от фото к фото, то StoryDiffusion — именно то, что вам нужно.

Идея гениальна в своей простоте — ничего даже учить не нужно, только заменить блок self-attention на версию, которая "смотрит" на соседние фотографии в батче. Оказалось, этого более чем достаточно, чтобы генерации стали согласованными между собой.

StoryDiffusion идеально подходит для создания комиксов и даже видео (нужно только интерполировать сгенерированные ключевые кадры, что авторы и делают). Код уже в открытом доступе! Должно работать почти с любыми обученными диффузионными моделями.

Статья, GitHub, HuggingFace
🔥10
Forwarded from Denis Sexy IT 🤖
Примеры возможностей нового GPT4o ассистента – серьезно, фильм "Her" теперь реальность
4🔥3😱2