FSCP
17.3K subscribers
30.6K photos
3.56K videos
863 files
78K links
another filter bubble канал изначально созданный несколькими друзьями чтобы делиться копипастой, иногда оценочным суждением

технологии, деньги, социум

редакция @id9QGq_bot
реклама @johneditor
в будущее возьмут не всех
выводы самостоятельно

мир меняется
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Я скорее отношу себя к техно-позитивным людям. То есть не вижу угрозы в каждой первой технологии, и привык видеть в прогрессе прогресс, в первую очередь.

Но вот такие милые ролики меня иногда немного пугают. Наверное, это идет из научной фантастики, когда корпорации зла наивнейшим способом втираются в доверие пользователей.

В реальном мире уровень такой легкой тревоги от рекламы продукта растет:

1. чем больше эта корпорация
2. чем больше данных собирает продукт
3. чем больше AI в этом продукте
4. чем милее фортепьянный перебор в саундтреке ролика

В этом ролике бинго!

(хотя вообще в AI-консультантах в ближайшем будущем вижу массу пользы, особенно, как раз, в health-секторе).
_______
Источник | #TochkiNadAI
@F_S_C_P
-------
поддержи канал
-------
This media is not supported in your browser
VIEW IN TELEGRAM
В Китае появился конкурент Sora

Модель называется Vidu, она позволяет генерировать 16-секундные видео с разрешением 1080 из промптов.

Проект использует архитектуру Universal Vision Transformer (U-ViT), которая объединяет в себе лучшее из Diffusion и Transformer моделей.

Видно в некоторых местах отставание от Sora, но если все будет даже так, как в этих роликах, – это все равно высокая планка.

#videoGenerative
_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
ElevenLabs открыли возможность генерации любых звуков

Саунд дизайн становится менее сложной задачей. Звуки генерит качественные.
Не поймите меня неправильно, но я тестировал его на промпте про шлепки по лысине с последующим мужским криком.

По просьбе друга, разумеется есть пруфы.

Всем классной пятницы😁

#sounddesign
_______
Источник | #TochkiNadAI
@F_S_C_P

-------
поддержи канал
-------
Недавно подруга записывала голосовое сообщение, и при его расшифровке появились слова, которых не было в исходном сообщении.

Оказалось что эта аномалия встречается довольно часто.
При использовании распознавания голоса в Telegram и не только можно наткнуться на некого DimaTorzok.

Обычно пишется что-то вроде "Субтитры создавал/сделал/предоставил DimaTorzok".

Эту фразу можно встретить не только в Telegram, но и на случайных сайтах, связанных с распознаванием речи.

GPT сказал:
Имя "DimaTorzok" может появляться в распознавании голосовых сообщений из-за ошибки в алгоритме распознавания речи или из-за шумов и искажений в аудиозаписи.

По некоторым данным это просто баг Whisper, который выдает эту фразу, когда в записи слишком много шума, но от этого все это звучит не менее таинственно.

Вам когда-нибудь попадался DimaTorzok? 🧐
_______
Источник | #TochkiNadAI
@F_S_C_P

Генерируй картинки с ⛵️MIDJOURNEY в Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Тот единственный случай, когда человек отнял работу у AI.

Это было создано ручками в Blender😬
_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
This media is not supported in your browser
VIEW IN TELEGRAM
Вот так выглядит быстрая сегментация / ротоскопинг в сервисе DeepMake

Помню несколько лет назад громко пошумел китайский стартап, нацеленный на похожую работу с прокатным кино и контекстной рекламой.

То есть представьте, вы смотрите Титаник на своем ПК, и в вашей версии кино пассажиры третьего класса танцуют и пьют кока-колу, в то время как в Титанике вашего друга они будут пить red-bull.

Сейчас есть все для того чтобы развернуть такую надстройку и продавать рекламу, но я пока не слышал ни об одном примере внедрения. Даже Netflix пока что не обзавелись таким. Или я чего-то не знаю?

#computerVision
_______
Источник | #TochkiNadAI
@F_S_C_P

-------
поддержи канал
-------
This media is not supported in your browser
VIEW IN TELEGRAM
За последнее время, в рамках подготовки к одному тендеру, пришлось (не без интереса) изучить много решений по технологическому сопровождению спортивных ивентов.

В основном это были простые аналитические данные в AR-формате с развлекательной частью, но были и более сложные кейсы с анализом большого количества игровых показетелей с Computer Vision.

Посмотрите сколько всего анализируют и визуализируют во время теннисного матча в риалтайме.

Поймал себя на мысли, что иногда хочется отключить весь этот визуальный шум и просто посмотреть матч. Наверное, со мной такое впервые за 11 лет в индустрии 😅
_______
Источник | #TochkiNadAI | #хроникицифровизации
@F_S_C_P

Стань спонсором!
This media is not supported in your browser
VIEW IN TELEGRAM
Только на днях обсуждали MiniMax, а Денис Семенов уже запилил на ней клип для французского репера Chipo.

Все по Text-to-Image. Ну класс же!
_______
Источник | #TochkiNadAI
@F_S_C_P

-------
Секретики!
-------
This media is not supported in your browser
VIEW IN TELEGRAM
А вот так работает MIMO от Alibaba

Этот инструмент позволяет генерировать реалистичные видео персонажей в сценах, поддающихся контролю и кастомизации.

Главное преимущество MIMO в том, что для её работы не нужны сложные многокамерные съёмки. Достаточно простых промптов, чтобы выбрать внешний вид персонажа, движения и окружение.

Секрет MIMO — в «разложении» видео на три слоя: персонаж, сцена и объекты на переднем плане. Это позволяет добиться гибкости, реалистичности движения и взаимодействия с окружением.

#motionCapture

_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Чувствую следующий год будет очень интересным

Появляется все больше примеров "симуляций мира". Простое объяснение: это управление движением в реальном времени на уровне кадров в генеративной модели.

Все это про создание реалистичных миров с бесконечным генеративным контентом, создание симуляций в научных и развлекательных целях.

Пример в посте – проект The Matrix. Проект направлен на создание бесконечно генерируемого мира с реалистичной графикой и возможностью взаимодействия в реальном времени. Система обеспечивает точное управление на уровне кадров, высококачественные визуальные эффекты и бесконечные возможности для исследования. Она обучена на данных из AAA-игр, таких как Forza Horizon 5 и Cyberpunk 2077, а также на реальных видеоматериалах, что позволяет пользователям исследовать разнообразные ландшафты, включая пустыни, города и леса, в непрерывных видеороликах.

Скоро у них выйдет демка. Очень жду. Пока что визуально это одна из самых "не галлюционирующих" моделей мира.

_______
Источник | #TochkiNadAI
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Отличную подборку подглядел у канала Нейродвиж.

Сотрудники одного из крупнейших инвестфондов Andreessen Horowitz (a16z) рассказали о нейронках, которые используют в работе и жизни.

Ассистенты:


Perplexity: поисковая система с ИИ и помощник в исследованиях;
Claude: универсальный чат-бот, подходит для проектов и обмена работами;
ChatGPT: вы точно знаете его, но волки советуют Advanced Voice Mode для общения с ИИ.

Для продуктивной работы:


Granola: ИИ-блокнот, который слушает ваши встречи и преобразует стенограммы в заметки;
Flow: голосовая диктовка, преобразующая речь в текст в любом приложении;
Gamma: создание презентаций, документов и сайтов с помощью ИИ;
Adobe Acrobat: инструмент для подведения итогов и работы с PDF-файлами;
Cubby: пространство для совместных исследований с ИИ;
Cora: ИИ-помощник для работы с электронной почтой, автоматизация ответов и организация писем;
Lindy: создание ИИ-агентов для автоматизации рабочих процессов.

Для буста аудитории:

Delphi: текстовые, голосовые и видеоклоны для общения с аудиторией;
HeyGen: ИИ-аватары для масштабирования контента и перевода видео;
Argil: ИИ-аватары для социальных сетей;
Overlap и Opus: преобразование длинных видео в короткие вирусные клипы;
Persona: ИИ-агент для контент-криэйторов;
Captions: ИИ для видеомонтажа (автосубтитры, коррекция зрительного контакта).

Для создания продуктов (код):

Cursor: редактор кода с ИИ, понимающий вашу кодовую базу;
Replit: ИИ для создания приложений и сайтов из текстового описания;
Anychat: использование любых ИИ-моделей в одном месте;
Codeium: инструмент автозаполнения кода с ИИ.

Для создания контента:

ElevenLabs: реалистичные ИИ-голоса;
Suno и Udio: создание музыки на основе текстовых запросов;
Midjourney, Ideogram, Playground: генерация изображений с помощью ИИ;
Runway, Kling, Viggle: генерация видео с использованием ИИ;
Krea: платформа для создания и редактирования изображений и видео;
PhotoRoom: редактор изображений для товаров и визуализаций с помощью ИИ.

Для обучения и развития:

Rosebud: интерактивный дневник с аналитикой от ИИ;
Good Inside: коучинг для родителей с персонализированной поддержкой;
Ada Health: оценка медицинских симптомов с использованием ИИ;
Ash: персонализированный ИИ-консультант и коуч;
NotebookLM: превращение документа в AI-подкаст;
Particle: новостное приложение с кратким резюме историй.

Для развлечений:

Remix: приложение для создания и обмена AI-контентом;
Grok: чат-бот от Илона Маска. Он весёлый, попробуйте;
Curio: игрушки для детей с AI, которые разговаривают.

_______
Источник | #TochkiNadAI
#полезности
@F_S_C_P

-------
Секретики!
-------