FSCP – Telegram

Я скорее отношу себя к техно-позитивным людям. То есть не вижу угрозы в каждой первой технологии, и привык видеть в прогрессе прогресс, в первую очередь.

Но вот такие милые ролики меня иногда немного пугают. Наверное, это идет из научной фантастики, когда корпорации зла наивнейшим способом втираются в доверие пользователей.

В реальном мире уровень такой легкой тревоги от рекламы продукта растет:

1. чем больше эта корпорация
2. чем больше данных собирает продукт
3. чем больше AI в этом продукте
4. чем милее фортепьянный перебор в саундтреке ролика

В этом ролике бинго!

(хотя вообще в AI-консультантах в ближайшем будущем вижу массу пользы, особенно, как раз, в health-секторе).
_______
Источник | #TochkiNadAI
@F_S_C_P
-------
поддержи канал
-------

1.7K views05:32

FSCP

1:23

This media is not supported in your browser

VIEW IN TELEGRAM

В Китае появился конкурент Sora

Модель называется Vidu, она позволяет генерировать 16-секундные видео с разрешением 1080 из промптов.

Проект использует архитектуру Universal Vision Transformer (U-ViT), которая объединяет в себе лучшее из Diffusion и Transformer моделей.

Видно в некоторых местах отставание от Sora, но если все будет даже так, как в этих роликах, – это все равно высокая планка.

#videoGenerative
_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

1.6K views19:42

FSCP

ElevenLabs открыли возможность генерации любых звуков

Саунд дизайн становится менее сложной задачей. Звуки генерит качественные.
Не поймите меня неправильно, но я тестировал его на промпте про шлепки по лысине с последующим мужским криком.

По просьбе друга, разумеется есть пруфы.

Всем классной пятницы😁

#sounddesign
_______
Источник | #TochkiNadAI
@F_S_C_P

-------
поддержи канал
-------

1.3K views05:39

FSCP

Недавно подруга записывала голосовое сообщение, и при его расшифровке появились слова, которых не было в исходном сообщении.

Оказалось что эта аномалия встречается довольно часто.
При использовании распознавания голоса в Telegram и не только можно наткнуться на некого DimaTorzok.

Обычно пишется что-то вроде "Субтитры создавал/сделал/предоставил DimaTorzok".

Эту фразу можно встретить не только в Telegram, но и на случайных сайтах, связанных с распознаванием речи.

GPT сказал:
Имя "DimaTorzok" может появляться в распознавании голосовых сообщений из-за ошибки в алгоритме распознавания речи или из-за шумов и искажений в аудиозаписи.

По некоторым данным это просто баг Whisper, который выдает эту фразу, когда в записи слишком много шума, но от этого все это звучит не менее таинственно.

Вам когда-нибудь попадался DimaTorzok? 🧐
_______
Источник | #TochkiNadAI
@F_S_C_P

Генерируй картинки с ⛵️MIDJOURNEY в Telegram

1.5K views22:05

FSCP

This media is not supported in your browser

VIEW IN TELEGRAM

Тот единственный случай, когда человек отнял работу у AI.

Это было создано ручками в Blender😬
_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

1.2K views16:51

FSCP

This media is not supported in your browser

VIEW IN TELEGRAM

Вот так выглядит быстрая сегментация / ротоскопинг в сервисе DeepMake

Помню несколько лет назад громко пошумел китайский стартап, нацеленный на похожую работу с прокатным кино и контекстной рекламой.

То есть представьте, вы смотрите Титаник на своем ПК, и в вашей версии кино пассажиры третьего класса танцуют и пьют кока-колу, в то время как в Титанике вашего друга они будут пить red-bull.

Сейчас есть все для того чтобы развернуть такую надстройку и продавать рекламу, но я пока не слышал ни об одном примере внедрения. Даже Netflix пока что не обзавелись таким. Или я чего-то не знаю?

#computerVision
_______
Источник | #TochkiNadAI
@F_S_C_P

-------
поддержи канал
-------

1.3K views03:20

FSCP

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

За последнее время, в рамках подготовки к одному тендеру, пришлось (не без интереса) изучить много решений по технологическому сопровождению спортивных ивентов.

В основном это были простые аналитические данные в AR-формате с развлекательной частью, но были и более сложные кейсы с анализом большого количества игровых показетелей с Computer Vision.

Посмотрите сколько всего анализируют и визуализируют во время теннисного матча в риалтайме.

Поймал себя на мысли, что иногда хочется отключить весь этот визуальный шум и просто посмотреть матч. Наверное, со мной такое впервые за 11 лет в индустрии 😅
_______
Источник | #TochkiNadAI | #хроникицифровизации
@F_S_C_P

Стань спонсором!

1.3K views19:50

FSCP

1:34

This media is not supported in your browser

VIEW IN TELEGRAM

Только на днях обсуждали MiniMax, а Денис Семенов уже запилил на ней клип для французского репера Chipo.

Все по Text-to-Image. Ну класс же!
_______
Источник | #TochkiNadAI
@F_S_C_P

-------
Секретики!
-------

1.4K views10:59

FSCP

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

А вот так работает MIMO от Alibaba

Этот инструмент позволяет генерировать реалистичные видео персонажей в сценах, поддающихся контролю и кастомизации.

Главное преимущество MIMO в том, что для её работы не нужны сложные многокамерные съёмки. Достаточно простых промптов, чтобы выбрать внешний вид персонажа, движения и окружение.

Секрет MIMO — в «разложении» видео на три слоя: персонаж, сцена и объекты на переднем плане. Это позволяет добиться гибкости, реалистичности движения и взаимодействия с окружением.

#motionCapture

_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

1.1K views14:42

FSCP

Чувствую следующий год будет очень интересным

Появляется все больше примеров "симуляций мира". Простое объяснение: это управление движением в реальном времени на уровне кадров в генеративной модели.

Все это про создание реалистичных миров с бесконечным генеративным контентом, создание симуляций в научных и развлекательных целях.

Пример в посте – проект The Matrix. Проект направлен на создание бесконечно генерируемого мира с реалистичной графикой и возможностью взаимодействия в реальном времени. Система обеспечивает точное управление на уровне кадров, высококачественные визуальные эффекты и бесконечные возможности для исследования. Она обучена на данных из AAA-игр, таких как Forza Horizon 5 и Cyberpunk 2077, а также на реальных видеоматериалах, что позволяет пользователям исследовать разнообразные ландшафты, включая пустыни, города и леса, в непрерывных видеороликах.

Скоро у них выйдет демка. Очень жду. Пока что визуально это одна из самых "не галлюционирующих" моделей мира.

_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

1:00

Точки над ИИ

Чувствую следующий год будет очень интересным

Появляется все больше примеров "симуляций мира". Простое объяснение: это управление движением в реальном времени на уровне кадров в генеративной модели.

Все это про создание реалистичных миров с бесконечным…

1.1K views22:04

About

Blog

Apps

Platform