Вот эта новая фича от гуглогемини, которая может генерить и изменять картинки без вызова отдельной модели позволяет делать классные последовательные гифки за несколько минут
Покрал отсюда
Покрал отсюда
CEO Поиска Яндекса Дима Масюк расписал в LinkedIn принципы, на которых компания строит развитие сервисов с искусственным интеллектом. Они просты и понятны: бесшовно вписывать ИИ-решения в повседневную жизнь, строить эмоциональную связь между людьми и технологиями (привет, Алиса!) и максимально персонализировать решения для конкретного человека.
Кажется, такая стратегия у Яндекса уже пару лет точно — помню, как запускали Шедеврум, делая ставку на интуитивную простоту и удобство. Но первый раз вижу, что Дима говорит об этом публично. Видимо, это работает, учитывая популярность колонок с Алисой, да и в целом других продуктов Яндекса
Кажется, такая стратегия у Яндекса уже пару лет точно — помню, как запускали Шедеврум, делая ставку на интуитивную простоту и удобство. Но первый раз вижу, что Дима говорит об этом публично. Видимо, это работает, учитывая популярность колонок с Алисой, да и в целом других продуктов Яндекса
This media is not supported in your browser
VIEW IN TELEGRAM
С каждым днем мы все дальше от бога
This media is not supported in your browser
VIEW IN TELEGRAM
Путешествие по культовым картинам. Оч круто!
Подумал, что если бы вот это же кто-то запилил в VR, чтобы можно было походить-побродить внутри картин самому, было б вообще огонь, точно купил бы такое приложение, да и вообще появился бы повод достать VR-шлем с полки, а то я его уже 3 или 4 месяца даже в руки не брал
видео отсюда
Подумал, что если бы вот это же кто-то запилил в VR, чтобы можно было походить-побродить внутри картин самому, было б вообще огонь, точно купил бы такое приложение, да и вообще появился бы повод достать VR-шлем с полки, а то я его уже 3 или 4 месяца даже в руки не брал
видео отсюда
Forwarded from Denis Sexy IT 🤖
Китайский Deepseek постепенно становится их главной АИ лабой – настолько важной, что ключевых исследователей попросили сдать паспорта, чтобы те случайно не соблазнились сумасшедшими зарплатами в США ☕️
Китайские пользователи реддита не удивлены, так как Deepseek теперь работает с большим кол-вом секторов внутри Китая, включая оборонный
Китайские пользователи реддита не удивлены, так как Deepseek теперь работает с большим кол-вом секторов внутри Китая, включая оборонный
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем народ распробовал фишку с созданием простеньких аннимаций с помощью нового гемини. Вот, чувак автоматизировал все это дело прикрутив сверху еще и Midjourney + сделав простенький интерфейс для всего этого.
Разработчик обещает скоро выкатить эту штуку в ранний доступ
Разработчик обещает скоро выкатить эту штуку в ранний доступ
А еще новый Gemini flash 2.0 experimental очень хорошо удаляет вотермарки с изображений. Только иногда включает святошу и начинает ныть, что это противоречит его морали (просто перегенерируйте сообщение).
Ну и да, надо просить удалить не вотермарки, а именно текст, иначе лезет в залупу и не делает.
Ну и да, надо просить удалить не вотермарки, а именно текст, иначе лезет в залупу и не делает.
Было слегка скучно, потому я игрался с новым Gemini, проверял консистентность генерируемых картинок. И случайно нагенерировал комикс к копипасте про батин жареный суп
This media is not supported in your browser
VIEW IN TELEGRAM
Принес вам позалипать на ночь. Это визуализация выходных сигналов трансформера (архитектура, на которой работают почти все современные LLM: ChatGPT, Claude, Llama и иже с ними)
А вот тут можно самим понажимать в онлайн режиме, если интересно.
А вот тут можно самим понажимать в онлайн режиме, если интересно.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Языковая 3Д-генерация.
У нас есть некоторое количество сервисов для 3Д-генерации, о которых я неоднократно писал.
Проблема там в основном в топологии (каша) и в качестве текстур. Плюс в ограниченности сцены - как правило это один объект.
Уже неделю как интернет бомбит от связки Блендора и Клода 3.7 через MCP, о которой я тоже писал.
Ну и действительно, поглядите на пример.
Все, что потребовалось здесь, это сгенерировать картинку, а потом сказать Клюду:
"Recognize any elements of this scene individually. Describe them precisely, then build them in a scene."
"Распознай все элементы этой сцены по отдельности. Опишите их точно, а затем сделай из них сцену".
"Традиционные" 3Д-генераторы тоже пытаются распознать картинку, потом сгенерить ее с разных ракурсов, а потом восстановить 3Д из нескольких картинок. А Клод пытается "собрать\отрендерить сцену" с помощью, грубо говоря, скриптов для Блендора - запуская разные команды, о которых он в курсе. Процедурное моделирование на стрероидах LLM.
Понятно, что пока довольно примитивные сцены, понятно, что замоделить голову неведомого ему персонажа будет сложновато, но дайте время.
Интересно подумать, над специальным файнтюном как для распознавания картинок, так и для (и особенно) для Блендора. Файнтьюн, который обучен на последовательностях действий и сценах.
Просто сцены, которые генерит Клод, отлично редактируются, анимируются - это нормальная геометрия, а не обмылки из 3Д-генераторов.
Интересно, посмотреть, что будет дальше.
@cgevent
У нас есть некоторое количество сервисов для 3Д-генерации, о которых я неоднократно писал.
Проблема там в основном в топологии (каша) и в качестве текстур. Плюс в ограниченности сцены - как правило это один объект.
Уже неделю как интернет бомбит от связки Блендора и Клода 3.7 через MCP, о которой я тоже писал.
Ну и действительно, поглядите на пример.
Все, что потребовалось здесь, это сгенерировать картинку, а потом сказать Клюду:
"Recognize any elements of this scene individually. Describe them precisely, then build them in a scene."
"Распознай все элементы этой сцены по отдельности. Опишите их точно, а затем сделай из них сцену".
"Традиционные" 3Д-генераторы тоже пытаются распознать картинку, потом сгенерить ее с разных ракурсов, а потом восстановить 3Д из нескольких картинок. А Клод пытается "собрать\отрендерить сцену" с помощью, грубо говоря, скриптов для Блендора - запуская разные команды, о которых он в курсе. Процедурное моделирование на стрероидах LLM.
Понятно, что пока довольно примитивные сцены, понятно, что замоделить голову неведомого ему персонажа будет сложновато, но дайте время.
Интересно подумать, над специальным файнтюном как для распознавания картинок, так и для (и особенно) для Блендора. Файнтьюн, который обучен на последовательностях действий и сценах.
Просто сцены, которые генерит Клод, отлично редактируются, анимируются - это нормальная геометрия, а не обмылки из 3Д-генераторов.
Интересно, посмотреть, что будет дальше.
@cgevent