Точки над ИИ
3.55K subscribers
262 photos
253 videos
1 file
368 links
• Ресерчим и показываем сервисы с AI для всех профессий
• Пишем новости про AI. Кратко и понятно
• В канале удобная навигация, ищите любой AI-сервис в закрепленном посте.

Канал ведет Ваня Юницкий – CEO VOIC LAB (voic.tech)
Сотрудничество: @hello_voic
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Попался инструмент, который поможет найти любую часть длинного видео и превратить ее в рилс или шортс.

Похоже удобная штука, чтобы работать с объемным материалом и быстро клепать видосики.

Называется Choppity. Попробовать тут.

#videoEditing
This media is not supported in your browser
VIEW IN TELEGRAM
За последнее время, в рамках подготовки к одному тендеру, пришлось (не без интереса) изучить много решений по технологическому сопровождению спортивных ивентов.

В основном это были простые аналитические данные в AR-формате с развлекательной частью, но были и более сложные кейсы с анализом большого количества игровых показетелей с Computer Vision.

Посмотрите сколько всего анализируют и визуализируют во время теннисного матча в риалтайме.

Поймал себя на мысли, что иногда хочется отключить весь этот визуальный шум и просто посмотреть матч. Наверное, со мной такое впервые за 11 лет в индустрии 😅
This media is not supported in your browser
VIEW IN TELEGRAM
Очень красивая изнанка работы VFX спеца, использующего в пайплайне AI-подход.

Тут было хромакейное видео со сгенерированной картой нормалей (DaVinci Resolve) для базового релайтнинга и что-то еще.

Автор: Ruben Frosali
Перевод видео на несколько языков

D-ID мгновенно конвертирует видео на несколько языков с одной загрузки. Инструмент переводит текст, клонирует голос и делает липсинк. Можно пробовать бесплатно.

#translation
This media is not supported in your browser
VIEW IN TELEGRAM
Только на днях обсуждали MiniMax, а Денис Семенов уже запилил на ней клип для французского репера Chipo.

Все по Text-to-Image. Ну класс же!
This media is not supported in your browser
VIEW IN TELEGRAM
Для тех, кто мечтает пополнить свой шпионский набор

AI-сервис READ THEIR LIPS расшифровывает речь на видео по губам, и это бесплатно.

Прикладываю инструкцию гифкой к посту.

#translation #fun
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы давно мечтали начать разговаривать с едой и предметами вокруг

AI+AR внутри приложения Everies превращают повседневные предметы в интерактивных персонажей. Работает все на базе гугловского Gemini.

Что любопытно – персонажи персонализируются в зависимости от объекта и окружающей среды — у каждого из них есть свой внешний вид, голос и индивидуальность.

#fun
Смотрите как клево MiniMax воспроизвел смену эмоций с радости на плач.
Media is too big
VIEW IN TELEGRAM
Появляется все больше пользовательских генераций на анонсированном вчера Adobe Firefly для Premier Pro.

Отзывы разные, но все подчеркивают большое преимущество этой модели – удобный интерфейс в лучших традициях Adobe.

Вряд ли текущая версия модели может составить конкуренцию по визуалу китам, таким как Runway или новым китайским конкурентам, но сам факт количества сервисов для видеогенераций от крупных игроков вызывает азарт в наблюдении этой гонки. Не забудьте, что в этом году еще и Sora будет раскатана на всех.

Кстати, вот waitlist на Adobe Firefly Video Model.
думай медленно, решай быстро. новая модель o1 от OpenAI

Канеман в свое время разработал теорию двух систем мышления — Система 1 и Система 2 — для объяснения того, как люди принимают решения и обрабатывают информацию. и именно этой этой теорией можно частично объяснить новую модель ChatGPT, которая сегодня вышла.

Система 1 — быстрая, интуитивная и автоматическая часть нашего мышления, работает бессознательно, когнитивные усилия экономит время и может приводить к ошибкам и когнитивным искажениям. и ChatGPT — без навыка промптинга, понимания логики работы и насмотренности — работает по аналогии.

Система 2 — медленная и логическая часть мышления. активируется, когда нужно обдумывать сложные задачи, принимать взвешенные решения. она требует усилий и концентрации. и это по сути то, что сейчас предлагает новая модель o1.

значит ли это, что прежде ChatGPT не умел прежде в логику и только теперь научился думать? не совсем. GPT-4 (существует с марта 2023) уже была наделена advanced reasoning и при грамотном промпте и всех подсказках (типа «думай шаг за шагом») умела реализовать и дедукцию, и абдуктивное, и индуктивное рассуждение — я эти кейсы показываю на лекциях с прошлого лета.

OpenAI в своем релизе упоминают Chain-of-thought как ключевой принцип работы новой модели, но и это тоже уже известный подход к составлению задачи для ChatGPT, который программировал модель на последовательное поэтапное рассуждение.

просто раньше надо было внимательно промптить. теперь не надо будет. и модель по умолчанию сильнее в задачах программирования, математики и физики. сильнее ли в задачках для гуманитариев — проверим.

о1 доступна с сегодняшнего дня всем пользователям Plus.
This media is not supported in your browser
VIEW IN TELEGRAM
Для любителей тречить прогресс личных и рабочих задач

Elisi — это удобный, кросс-девайсный планировщик, который поможет вам повысить личную производительность. AI ассистент сканирует задачи, выявляет трудности и предлагает индивидуальные стратегии.

Я сам еще не тестил, пока обхожусь самодельным трекером в ноушене, который считает прогресс-барами буквально всю мою жизнь. До этого еще использовал удобный хэбит-трекер под отдельные привычки и дела. Пришлю, если интересно.

А вы чем-то похожим пользуетесь?

#productivity
Media is too big
VIEW IN TELEGRAM
Пользовательский тест новой функции в Runway Gen-3 – video-to-video

Теперь, кроме изображений, на входе можно давать модели видео до 10 секунд, как на этом примере.
This media is not supported in your browser
VIEW IN TELEGRAM
На AI платформе AKOOL появилась бета-версия дипфейка с веб-камеры в риалтайме.

Не понимаю пока как это регулируется, есть подозрение что скоро их попросят убрать из тестового доступа лица живых в данный момент людей.

#deepfake
This media is not supported in your browser
VIEW IN TELEGRAM
Где-то полгода назад вышло приложение с AI-компньоном под Apple Vision Pro, я как-то писал о нем в своем канале про XR штучки.

Если коротко «Wisp World» — это украшение рабочего места и AI-компаньон, который находится рядом с другими вашими приложениями.

В итоге я сам его так и не потестил на AVP, а тут, совершенно случайно, наткнулся на 40-минутное видео "геймплея" этого приложения. Почему-то хотелось смотреть этот медитативный разговор с AI-чатом 😅

Надо будет чекнуть что-там выкатили нового разработчики, думаю что добавить приличный естественный голос уже точно можно было.

Вообще я верю в такие "виджеты" в XR, мне кажется такие штуки станут важной частью личного пространства через несколько лет (когда созреет XR-железо и станет более доступным и удобным).