Дмитрий Савостьянов Вещает

Я уже думал он бессмертный и сможет вынести всё. Грустно...

😢23😭6😁2

901 views12:54

Дмитрий Савостьянов Вещает

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Подъехало сравнение качества генерируемых видео от Runway Gen-2 и OpenAI Sora на одинаковых промптах.

Тред в твиттере

👍8

15.7K views15:48

Дмитрий Савостьянов Вещает

Game Assistant

Пишу себе на досуге голосового помощника для игр. Идея простая, всегда приятнее играть в компании товарища-задрота, который может подсказать по игре. Типа заходишь такой в абилити драфт в дотке, спрашиваешь как работают скиллы после патча, что с чем закомбинить, а он тебе выдает имбу.

Прототип написал за пару присестов. Далеко ходить не стал, для распознавания речи использую Whisper, для ответов GPT, для синтеза речи OpenAI text-to-speech.

На бекенде в ChatGPT зарядил задачи по написанию конфигов для GCP, Docker, Nginx. Самому оставалось только апишку накидать, и даже здесь мне помогал Copilot, который явно лучше меня знает FastAPI.

На фронте позвал товарища, который написал апку на Overwolf — аналог Electron.js, только с фичами для игр типа оверлея и доступа к данным.

На выходе получилось приложение под Windows, которому можно задавать вопросы в играх по нажатию push-to-talk хоткея. Ответ возвращает голосом + субтитрами поверх игры.

Поигравшись с прототипом 5 минут, стали очевидны следующие шаги:

- GPT-4 тратит по 20 сек на генерацию ответа, что вообще не user friendly, потому что пользователь в это время тупо ждёт. Повод посмотреть че там новенького в open source
- LLM допускает ошибки, например выдает неправильный урон или поведение из прошлых патчей. Повод прикрутить поиск по игровым wiki
- OpenAI TTS на русском языке звучит кринжово. Благо есть куча стартапов на эту тему, надо будет посмотреть аналоги

Самое приятное во всей истории с AI, LLM, ко-ко-ко, что за выходные успеваешь и прототип сделать, и в дотку покатать, вместо того чтобы документацию штудировать.

👍5🔥3

838 viewsedited 08:13

Дмитрий Савостьянов Вещает

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Will Smith зарофлил в тиктоке по поводу Sora и прогресса в text-to-video.

😁18👍2

866 views12:33

Дмитрий Савостьянов Вещает

0:43

Media is too big

VIEW IN TELEGRAM

Между делом совершаю подходы к YouTube. Уже начинает получаться что-то похожее на правду, хотя геморрой с производством пока что перевешивает🫠

🔥10👍4

665 views09:27

Дмитрий Савостьянов Вещает

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Субботний контент 👻

На видео юный охотник за приведениями (со звуком). Между вылазками любит приходить ко мне на колени и долбить по клавиатуре, чиста Copilot.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7😁4🥰3👍1

712 views09:30

Дмитрий Савостьянов Вещает

Через пару часов думаю подрубить стрим. Буду писать код, болтать за жизнь.

А чтобы не скучать, держите балдёжное видео про диффуры в доте.

https://youtu.be/1CC9NnX8AJo?si=Jf97i-XZZs3NAJ3P

YouTube

Шиз поясняет. Дифференциальные уравнения в Dota 2

В данном видео будет показано, как составлять дифференциальные уравнения на примере способности Midnight Pulse героя Enigma в видеоигре Dota 2. Также продемонстрировано, как решать линейные неоднородные дифференциальные уравнения первого порядка. Проведено…

❤3

953 views13:43

Дмитрий Савостьянов Вещает

Подрубаю рубрику "1 зритель". Код писать мне уже впадлу, поэтому буду играть в Dota 2.

Чат трансляции под этим постом.

896 views19:14

Дмитрий Савостьянов Вещает

Live stream started

19:20

Дмитрий Савостьянов Вещает

Live stream finished (2 hours)

22:08

Дмитрий Савостьянов Вещает

Game Assistant Пишу себе на досуге голосового помощника для игр. Идея простая, всегда приятнее играть в компании товарища-задрота, который может подсказать по игре. Типа заходишь такой в абилити драфт в дотке, спрашиваешь как работают скиллы после патча,…

Сейчас подрублю очередной спонтанный стрим. Потыкаюсь в код игрового ассистента. На фоне могу рассказать про поход в посольство сша.

Чат трансляции будет под этим постом.

1.04K views12:10

Дмитрий Савостьянов Вещает

Live stream started

12:19

Дмитрий Савостьянов Вещает

Live stream finished (2 hours)

14:21

Дмитрий Савостьянов Вещает

😁10👾2

1.01K views14:35

Дмитрий Савостьянов Вещает

0:30

Media is too big

VIEW IN TELEGRAM

Ускоряем Game Assistant

На выходных прикрутил стриминг из ChatGPT в Text-to-speech. UX ощутимо улучшился, теперь бот начинает произносить ответ через пару секунд после того, как пользователь задал вопрос, а не через 15 сек, как было раньше. Бывают моменты, когда он запинается, но для прототипа сойдет.

Теперь стоит вопрос, как соблюдать фактологическую точность. Например, на видео ассистент говорит, что 3-й скилл Queen of Pain наносит 410 урона, хотя на самом деле 300 (400 с талантом). Иногда модель ошибается и дает урон для других скиллов. Может давать описания механик из старых патчей и тд.

Комменты от опытных NLP'шников приветствуются.

👍3

848 views11:14

Дмитрий Савостьянов Вещает

Чет в голос, извините )))

🤣13

728 views14:04

About

Blog

Apps

Platform