Дмитрий Савостьянов Вещает – Telegram

Дмитрий Савостьянов Вещает

@savostyanov_dmitry

733 subscribers

299 photos

84 videos

1 file

232 links

Про AI в играх, стартапы, переезд в Лос-Анджелес и немножко мемов.

ЛС: https://t.iss.one/KPACAB4NK_PELLIAET_BOTTPOCbl

Download Telegram

About

Blog

Apps

Platform

Дмитрий Савостьянов Вещает

733 subscribers

Дмитрий Савостьянов Вещает

Forwarded from Сиолошная

Anthropic раскаляет AI-гонку, выпуская Claude 3 в трёх версиях: Opus, Sonnet, и Haiku.

На всех достаточно важных бенчмарках Opus показывают существенный прирост относительно GPT-4.

Opus, наша самая интеллектуальная модель, достигает возможностей понимания, близких к человеческому. Она может ловко обрабатывать широко сформулированные запросы и решать сложные задачи.

— Добавили новую модальность, модель принимает на вход картинки (а значит и видеоряд — как последовательность кадров)
— Лучше понимает языки, отличные от английского (в частности испанский, японский и фрацузский)
— Контекст всё еще 200к токенов
— Цена Opus $15/$75 за 1M токенов на вход и на выход соответственно. Для сравнения GPT-4-turbo стоит $10/$30
— Также обещают, что самая мощная модель имеет «more advanced agentic capabilities», что бы это ни значило :)
— Вдобавок, к модели подключили интерпретатор кода и возможность добавлять свои собственные инструменты
— Самый большой прирост метрик — на задачах, связанных с математикой. Даже без примеров в промпте модель показывает себя лучше, чем Gemini Ultra / GPT-4. Круто, если не переобучение, особенно в контексте того, что модели — НАПОМНЮ, ЭТО МНОГИЕ УПУСКАЮТ — будут использоваться для АВТОМАТИЗАЦИИ научных исследований.

Модели доступны по API сегодня всем, никакого листа ожидания больше нет. Для подписчиков Pro на сайте уже должна быть доступна модель Opus, а Sonet достанется бесплатным пользователям. Заходите: claude.ai

Ночью ждём релиза GPT-4.5 как симметричный ответ, видимо 😐 Почему? Потому что релиз Арракиса (кодовое название проекта в OpenAI) отложили до выпуска Дюны 2 😀

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6

933 views16:11

Дмитрий Савостьянов Вещает

Срач между Илоном Маском и OpenAI набирает обороты. Последние в ответ на иск выложили часть переписки в паблик

https://openai.com/blog/openai-elon-musk

😁3

842 views15:15

Дмитрий Савостьянов Вещает

This media is not supported in your browser

VIEW IN TELEGRAM

С 2021 года не катался на BMX. А тут взял и раздал. Держу вас в курсе, не благодарите.

🔥33

877 views14:12

Дмитрий Савостьянов Вещает

This media is not supported in your browser

VIEW IN TELEGRAM

В Вильнюсе народ вышел погулять в воскресный полдень. Голосуют что ли против кого-то?😏

❤8🔥2👏1🖕1

796 views11:39

Дмитрий Савостьянов Вещает

Дмитрий Савостьянов Вещает

Внезапно мем становится снова актуальным ))

😁5

773 views11:56

Дмитрий Савостьянов Вещает

Forwarded from эйай ньюз

Media is too big

VIEW IN TELEGRAM

SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation

Китайци подвезли СОТУ по монокулярному Pose and Shape estimation. То есть по одному кадру предсказывается 3D поза и форма человека. Покадрово можо применить к любому видео-потоку.

Тут как всегда зарешал масштаб модели и данных. Взяли трансоформер ViT-H на 662M параметров и тренировали на 32 датасетах с 4.5М фреймов, что как бы тоже дохрена для этой задачи.

ViT-H по меркам современного CV не такой уж и большой, но больше чем, все что пробовали на задаче Shape&Pose Estimation до этого, да и довольно шустрый. Скорость инференса даже почти риалтаймовая получилась - 17.5 FPS на Nvidia V100.

Код и веса на гитхабе
Сайт проекта
Статья
Demo на HF

@ai_newz

👍1

808 views18:06

Дмитрий Савостьянов Вещает

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

VastGaussian — SOTA по реконструкции огромных 3D сцен

Гауссовские сплаты конкретно заняли поляну Нерфов в 3D реконструкции. До этого момента были проблемы с использованием сплатов для больших сцен, но теперь и их решили. Получается рендеринг посто высочайшей детализации. Ещё и real-time! Смотрите видео.

Сайт проекта с деталями

@ai_newz

👍3

982 views18:11

Дмитрий Савостьянов Вещает

Сегодня наблюдал ситуацию, чел выпилил очередь на Redis + RQ и реализовал на триггерах в PostreSQL.

😁5

867 views19:23

Дмитрий Савостьянов Вещает

Бывает так открываешь календарь в понедельник и думаешь "Ёб твою мать". А потом понимаешь, что это прошлая неделя и становится чуточку легче.

😁7❤2🔥1

765 views08:29

Дмитрий Савостьянов Вещает

OpenAI без страха, без уважения.

765 views16:37

Дмитрий Савостьянов Вещает

Forwarded from 42 секунды

NYT: OpenAI расшифровала миллионы видео на YouTube для обучения модели GPT-4

– OpenAI перестало хватать авторитетных источников около 2022
– Ей потребовалось больше англоязычных текстов для обучения
– OpenAI создала сервис распознавания речи из видео Whisper
– Whisper расшифровывал речь из миллионов видео на YouTube
– При этом подобное решение противоречило правилам сервиса
– Все же OpenAI расшифровала 1+ млн часов видео на YouTube
– Затем тексты расшифровки загружались для модели GPT-4
– Об этом знали часть сотрудников Google, но не остановили ее
– Они боялись, что шумиха покажет, что Google тоже так делает
– Google также использовал видео на YouTube для своего ИИ
– Это потенциально нарушало авторские права их создателей
– Исследователи Цукерберга также думали про обход правил
– Они согласились собирать данные под авторским правом
– Переговоры про права заняли бы слишком много времени

@ftsec

😱4😁3

975 views16:37

Дмитрий Савостьянов Вещает

Подъехала LLAMA-3

https://ai.meta.com/blog/meta-llama-3/

794 views20:32

Дмитрий Савостьянов Вещает

Паша Дуров анонсировал годные криптофичи в Telegram

- CEO Tether официально анонсировал запуск USDT на блокчейне TON
- В Telegram появится возможность покупать цифровые товары за криптовалюту.
- Telegram собирается токенизировать стикеры и эмоджи
- С сегодняшнего дня владельцы каналов начнут получать первые выплаты в TON с рекламы

👏9

875 views12:22

Дмитрий Савостьянов Вещает

Там Meta выкатили real-time text-to-image — мое уважение

739 views12:00

Дмитрий Савостьянов Вещает

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Принес еще несколько примеров как работает наш Imagine Flash.

Попробовать можно на meta.ai под американским VPN-ом.

@ai_newz

❤9

780 views12:00

Дмитрий Савостьянов Вещает

Вакансия ML Engineer в Artifactory

Ищу крепкого Middle ML Engineer в проект по генерации анимаций. Фокус на 3D-персонажах в играх.

Работать предстоит непосредственно со мной над задачами:
- Изучение кода статей
- Ретаргетинг — перенос анимаций между скелетами различных персонажей
- Пайплайны подготовки данных и обучения моделей
- Интеграция результатов в прод
- Эксперименты с LLM для ускорения вышеперечисленного

ML:
- VQ-VAE
- Transformers
- Reinforcement Learning
- Diffusion Models

Стэк:
- PyTorch, SciPy, Numpy, Matplotlib
- ClearML, Google Cloud
- Flask, GraphQL
- PostgreSQL, Redis

Необязательно иметь опыт во всем, достаточно иметь хорошую базу и огонь в глазах.

Зарплата в евро или USDT. Можно парт-тайм.

За успешную рекомендацию шлю лучи добра и $200, либо играю с вами пару каток в дотку/кс 😏

Пишите в лс: @KPACAB4NK_PELLIAET_BOTTPOCbl

🔥12

762 views15:16

Дмитрий Савостьянов Вещает

Forwarded from AbstractDL

This media is not supported in your browser

VIEW IN TELEGRAM

StoryDiffusion: генерация консистентных наборов изображений без дообучения

Если вам нужно сгенерировать последовательную историю из фотографий, чтобы везде чётко прослеживалась единая локация, а главные персонажи не меняли одежду и причёску от фото к фото, то StoryDiffusion — именно то, что вам нужно.

Идея гениальна в своей простоте — ничего даже учить не нужно, только заменить блок self-attention на версию, которая "смотрит" на соседние фотографии в батче. Оказалось, этого более чем достаточно, чтобы генерации стали согласованными между собой.

StoryDiffusion идеально подходит для создания комиксов и даже видео (нужно только интерполировать сгенерированные ключевые кадры, что авторы и делают). Код уже в открытом доступе! Должно работать почти с любыми обученными диффузионными моделями.

Статья, GitHub, HuggingFace

🔥10

630 views08:07

Дмитрий Савостьянов Вещает

Forwarded from Denis Sexy IT 🤖

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Примеры возможностей нового GPT4o ассистента – серьезно, фильм "Her" теперь реальность

❤4🔥3😱2

791 views17:40