Дмитрий Савостьянов Вещает
736 subscribers
299 photos
84 videos
1 file
234 links
Про AI в играх, стартапы, переезд в Лос-Анджелес, отъезд из него в Дубай и немножко мемов.

ЛС: https://t.iss.one/KPACAB4NK_PELLIAET_BOTTPOCbl
Download Telegram
Text-To-Speech

Работаю над проектом, где надо было сравнить различные модели и сервисы для генерации речи по тексту. Интересным открытием стала open source нейросеть Kokoro. В ней всего 82М параметров, при этом она входит в топ-10 TTS Arena и выдает солидное качество.

На выходных расчехлил cursor и под пивас накидал библиотеку, чтобы можно было через единый интерфейс тестировать разных провайдеров. Выложил в открытый доступ, может кому-нибудь пригодится.

Проще всего попробовать в Colab.
Код: https://github.com/arch1baald/utts

pip install utts
🔥13
Посмотрел на днях подкаст с CEO Cursor. Он рассказывал, что изначально компания делала продукт для mechanical engineering. Затем они пивотнулись в инструмент для кодинга, вдохновившись GitHub Copilot. Причём сначала пытались писать свою IDE с нуля, и только после второго пивота решили сделать форк VSCode.

Ответ на вопрос о конкурентных преимуществах не особо впечатлил: ставка на кастомные модели, команду и то, что они смогут деливерить быстрее и лучше всех.

Пару дней назад OpenAI купили Windsurf за $3B. Google и Meta явно делают подобные инструменты внутри. Интересно, останется ли Cursor в нашей жизни через 2–3 года — или канет в небытие.

https://youtu.be/En5cSXgGvZM?si=a5n8VGplxH5RtXbm
👌2
В Штатах у всех есть личные сайты.

В рунете разработчики пишут статьи на Хабр и приземляют трафик в свои телеграм-каналы. Дальше телега начинает расти за счёт репостов, а с какого-то момента можно уже запускать коллаборации.

В США я пока не до конца разобрался, но складывается ощущение, что там разработчики публикуют статьи на своих персональных блогах, кидают ссылки на Hacker News и Reddit, а потом приземляют трафик в email-рассылки, Twitter и LinkedIn.

Короче, я решил тоже завести сайт. А чтобы было совсем трушно — писать его самостоятельно. На заре карьеры опытные линуксоиды говорили мне: «Хочешь распечатать документ — напиши драйвер для принтера». Теперь вспоминаю эту фразу каждый раз, когда оказывается, что мне нужно реализовать базовую фичу: превью картинок, воспроизведение медиа в статье, поддержку формул, которые в условном Notion доступны из коробки.

Иногда закрадывается мысль, что вместо создания контента, я имитирую бурную деятельность, зато с полным контролем над кодом!
😁11
Forwarded from эйай ньюз
Veo 3 — новая лучша модель для генерации видео

Похоже, новая SOTA для видео. Кроме видео может генерить ещё и звуки, в том числе и диалоги! Все видосы в посте были сгенерены чисто через Veo 3. Будет доступна уже сегодня.

@ai_newz
🔥6
$6B на устройства от Джони Айва + $3B на windsurf для кода. Такое ощущение, что Альтман, отказавшись от идеи коммерциализации OpenAI, включил режим “бабки — не проблема”
🤣8
OpenAI купила компанию Джони Айва за $6.5 миллиардов

Сэм Альтман и ключевой дизайнер Apple Джони Айв представили компанию io, приобретенную OpenAI.

Io создает новые устройства для взаимодействия с искусственным интеллектом. Первый продукт может быть представлен публике в 2026 году.

https://www.wsj.com/tech/ai/former-apple-design-guru-jony-ive-to-take-expansive-role-at-openai-5787f7da
Купил себе новую игрушку — очки Meta & Ray Ban. Теперь могу фотографировать глазами. Из интересного, они выводят звук куда-то над ухом и это неплохо работает. Внутри есть Meta AI, пытаюсь попросить его позвонить ChatGPT, но пока не выходит. Приходится тыкать руками.
🔥62👀1
агенты ускоряют разработку в 10тки раз
🤪13😁4🤣1
Я и сам своего рода ученый.

Наш доклад одобрили на SIGGRAPH 2025. Будем рассказывать про диффузионную модель для анимирования персонажей, которая может работать в реальном времени в игровом движке.

Хотя я и написал всю ML-часть, в Ванкувер не поеду — сказывается увлекательная иммиграционная политика США, от которой у меня уже седые волосы лезут.

Основной вклад скорее инженерный, а не научный, поэтому пока не знаю, будем ли пытаться высосать из пальца пэйпер или ограничимся слайдами.
🔥121
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на туториал по Veo 3 от автора ролика с бегемотом.

https://youtu.be/SHjnb-JtKvw
🤯6
От любви до ненависти за 9 месяцев.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Слили телефонный разговор Трампа и Маска после перепалки в Twitter

#мемес

НЕ МОРГЕНШТЕРН
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤣71
Наткнулся на офис Blizzard.

Катался с дочкой на велосипеде по городу. В какой-то момент решил съехать с привычного маршрута и увидел офис близов.

Это интересное чувство: в детстве проводишь годы в Варкрафте, а потом оказывается, что их головная компания находится в 15 минутах езды на велосипеде от дома.

Было воскресенье, поэтому контора была закрыта. Но вообще было бы интересно найти контакты внутри и сходить на экскурсию.
🔥174😱1😍1
Media is too big
VIEW IN TELEGRAM
Вышел прогуляться, увидел SpaceX — восторг.
1🔥19