Точки над ИИ
9.48K subscribers
448 photos
508 videos
2 files
624 links
• Ресерчим сервисы с AI для всех профессий
• Новости про AI. Кратко и понятно
• В канале удобная навигация, любой AI-сервис в закрепленном посте.

Канал ведет Ваня Юницкий – CEO VOIC LAB (voic.tech)

Реклама: @hello_voic

РКН: https://clck.ru/3Hekfp
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Только на днях обсуждали MiniMax, а Денис Семенов уже запилил на ней клип для французского репера Chipo.

Все по Text-to-Image. Ну класс же!
This media is not supported in your browser
VIEW IN TELEGRAM
Для тех, кто мечтает пополнить свой шпионский набор

AI-сервис READ THEIR LIPS расшифровывает речь на видео по губам, и это бесплатно.

Прикладываю инструкцию гифкой к посту.

#translation #fun
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы давно мечтали начать разговаривать с едой и предметами вокруг

AI+AR внутри приложения Everies превращают повседневные предметы в интерактивных персонажей. Работает все на базе гугловского Gemini.

Что любопытно – персонажи персонализируются в зависимости от объекта и окружающей среды — у каждого из них есть свой внешний вид, голос и индивидуальность.

#fun
Смотрите как клево MiniMax воспроизвел смену эмоций с радости на плач.
Media is too big
VIEW IN TELEGRAM
Появляется все больше пользовательских генераций на анонсированном вчера Adobe Firefly для Premier Pro.

Отзывы разные, но все подчеркивают большое преимущество этой модели – удобный интерфейс в лучших традициях Adobe.

Вряд ли текущая версия модели может составить конкуренцию по визуалу китам, таким как Runway или новым китайским конкурентам, но сам факт количества сервисов для видеогенераций от крупных игроков вызывает азарт в наблюдении этой гонки. Не забудьте, что в этом году еще и Sora будет раскатана на всех.

Кстати, вот waitlist на Adobe Firefly Video Model.
думай медленно, решай быстро. новая модель o1 от OpenAI

Канеман в свое время разработал теорию двух систем мышления — Система 1 и Система 2 — для объяснения того, как люди принимают решения и обрабатывают информацию. и именно этой этой теорией можно частично объяснить новую модель ChatGPT, которая сегодня вышла.

Система 1 — быстрая, интуитивная и автоматическая часть нашего мышления, работает бессознательно, когнитивные усилия экономит время и может приводить к ошибкам и когнитивным искажениям. и ChatGPT — без навыка промптинга, понимания логики работы и насмотренности — работает по аналогии.

Система 2 — медленная и логическая часть мышления. активируется, когда нужно обдумывать сложные задачи, принимать взвешенные решения. она требует усилий и концентрации. и это по сути то, что сейчас предлагает новая модель o1.

значит ли это, что прежде ChatGPT не умел прежде в логику и только теперь научился думать? не совсем. GPT-4 (существует с марта 2023) уже была наделена advanced reasoning и при грамотном промпте и всех подсказках (типа «думай шаг за шагом») умела реализовать и дедукцию, и абдуктивное, и индуктивное рассуждение — я эти кейсы показываю на лекциях с прошлого лета.

OpenAI в своем релизе упоминают Chain-of-thought как ключевой принцип работы новой модели, но и это тоже уже известный подход к составлению задачи для ChatGPT, который программировал модель на последовательное поэтапное рассуждение.

просто раньше надо было внимательно промптить. теперь не надо будет. и модель по умолчанию сильнее в задачах программирования, математики и физики. сильнее ли в задачках для гуманитариев — проверим.

о1 доступна с сегодняшнего дня всем пользователям Plus.
This media is not supported in your browser
VIEW IN TELEGRAM
Для любителей тречить прогресс личных и рабочих задач

Elisi — это удобный, кросс-девайсный планировщик, который поможет вам повысить личную производительность. AI ассистент сканирует задачи, выявляет трудности и предлагает индивидуальные стратегии.

Я сам еще не тестил, пока обхожусь самодельным трекером в ноушене, который считает прогресс-барами буквально всю мою жизнь. До этого еще использовал удобный хэбит-трекер под отдельные привычки и дела. Пришлю, если интересно.

А вы чем-то похожим пользуетесь?

#productivity
Media is too big
VIEW IN TELEGRAM
Пользовательский тест новой функции в Runway Gen-3 – video-to-video

Теперь, кроме изображений, на входе можно давать модели видео до 10 секунд, как на этом примере.
This media is not supported in your browser
VIEW IN TELEGRAM
На AI платформе AKOOL появилась бета-версия дипфейка с веб-камеры в риалтайме.

Не понимаю пока как это регулируется, есть подозрение что скоро их попросят убрать из тестового доступа лица живых в данный момент людей.

#deepfake
This media is not supported in your browser
VIEW IN TELEGRAM
Где-то полгода назад вышло приложение с AI-компньоном под Apple Vision Pro, я как-то писал о нем в своем канале про XR штучки.

Если коротко «Wisp World» — это украшение рабочего места и AI-компаньон, который находится рядом с другими вашими приложениями.

В итоге я сам его так и не потестил на AVP, а тут, совершенно случайно, наткнулся на 40-минутное видео "геймплея" этого приложения. Почему-то хотелось смотреть этот медитативный разговор с AI-чатом 😅

Надо будет чекнуть что-там выкатили нового разработчики, думаю что добавить приличный естественный голос уже точно можно было.

Вообще я верю в такие "виджеты" в XR, мне кажется такие штуки станут важной частью личного пространства через несколько лет (когда созреет XR-железо и станет более доступным и удобным).
This media is not supported in your browser
VIEW IN TELEGRAM
Немножко 2D to 3D

MeshFormer позволяет создавать 3D-сетки с текстурами из нескольких 2D-изображений.

Благодаря сочетанию трансформеров и 3D-методов эта технология ускоряет и упрощает процессы. Она может улучшить творческие рабочие процессы в играх, XR и виртуал-продакшн проектах. Возьмем на карандаш.

#3D
This media is not supported in your browser
VIEW IN TELEGRAM
Как говорит Сергей Цыпцын у себя в канале про ИИ – "ну что ж, выпьем за.." (и тут обычно у некоторых начинает подгорать).

Попробуем! Ну что ж, выпьем за фитнес-тренеров!

Многие недооценивают возможности компьютерного зрения, несмотря на то, что по улицам тех же штатов уже давно колесят теслы на автопилоте, а на заводах роботы формируют гигантские склады, не допуская ошибок.

Нетрудно представить с какой точностью алгоритм сможет определять правильность выполнения упражнений, корректировать и обучать на таких тренировках. На примере демка, я бы с удовольствием попробовал.
Кажется я нашел сервис, в котором делают все эти бездушные ролики с футажным видеорядом

Вам наверняка попадались видео с разными фактами из науки, истории и теориями заговора, где идет AI-озвучка, текст явно писал GPT, а на фоне подборка из видео, подходящих по смыслу.

Прикрепляю скриншот интерфейса, так как чтобы скачать результат – нужно было оплатить подписку. Делать я этого не стал, но потестить сервис было интересно и даже увлекательно.

Вообще, конечно, приятен сам факт, что ты пишешь одно предложение в качестве промпта и реально получаешь готовый ролик за 5 сек, который потом можно подредактировать где нужно, но я к таким видео отношусь не очень хорошо. Вот ссылка на сервис, если решите потестить.
Смотрим на личную CRM c AI

Называется Table. Основной акцент внутри на работу с контактами/сетью, как главным личным капиталом.

Это такая умная записная книжка с табличками, взаимосвязями, подсказками и напоминалками. Внутри чат с LLM и умный поиск с ИИ.

Я раньше ни разу не встречал персональных црм, звучит интересно!
This media is not supported in your browser
VIEW IN TELEGRAM
Оказывается месяц назад в TikTok появилась функция Sound Search, которая позволяет искать песни, напевая их.

Она работает аналогично Shazam и YouTube Music, но с важным отличием — поддерживает поиск по напевам, чего Shazam не делает.

Sound Search не только находит трек, но и показывает видео, где он использован.
И гадание по LLM💀
This media is not supported in your browser
VIEW IN TELEGRAM
Два вдохновляющих примера использования реальных простых объектов для создания контента в Runway (video to video).

Первый пример попроще, вы видите его в этом посте. Автор взял игрушечный корабль своего сына и использовал его для создания ролика с кораблем в арктических водах для своего блога.

Второй пример интереснее и немного сложнее. Писал о нем тут. В данном случае автор использует связку с AR, а это значит что необязательно рыться в игрушках и шкафах в поисках подходящего объекта, достаточно просто загрузить нужную модельку из скетчфаба и разместить в помещении.

Обожаю такое!
Альтман запостил небольшое эссе на тему AI, ближайшего будущего и вдохновляющих прогнозов о плодотворном союзе человека и ИИ.

Про риски там тоже есть, но все равно получилось довольно инфантильно, хотя другого ждать от CEO компании такого уровня было бы странно, каждое слово в такой ситуации измеряется на миллиметровке конечно, если вы не Илон Маск.

Эссе небольшое, почитать можно по ссылке.

Топ фактов, без которых вы точно сможете прожить:

1. В эссе дважды упомянуты бабушки
2. В эссе дважды упомянуты дедушки.

Но, конечно, хочется верить только в лучшее и светлое, поэтому пусть все будет так, как говорит Альтман.