This media is not supported in your browser
VIEW IN TELEGRAM
Китайский ответ Google Genie 3 от Tencent
Я про генерацию игрового мира с геймплеем по одной картинке или текстовому описанию.
Весь день изучал этот документ, чтобы понять, как всё работает, потому что для меня это похоже на какое-то чудо. Ниже мой краткий пересказ того, как в Tencent создавали Yan.
Чтобы собрать датасет для обучения, они запустили в игровой мир «Yuan Meng Star» ИИ-агента, который бегал там по локациям. 30 раз в секунду система записывала две вещи: кадр (то, что видно на экране в разрешении 1080p) и действие (какая кнопка была нажата - «вперёд», «прыжок», «поворот камеры» и т. д.). В итоге получился огромный «учебник» на 400 миллионов кадров, где каждый кадр точно связан с действием игрока. Это стало основой для обучения всех последующих модулей.
Дальше они сделали ИИ-симулятор игры «Yuan Meng Star» с таким же разрешением картинки (1080p) и частотой кадров (60 FPS). Получился «цифровой двойник» этой игры, который работает на ИИ, а не на игровом движке. Забавно, что Yan-Sim (так они назвали симулятор) может в реальном времени создавать игровой мир с большой точностью, откликаясь на действия игрока мгновенно и без задержек. Он даже точно воспроизводит физику мира: например, персонаж будет скользить по воде, подпрыгивать на батуте или получать урон от электрического забора.
А уже на базе этого ИИ-симулятора в Tencent сделали ещё два модуля:
⁃ Yan-Gen — создаёт совершенно новые интерактивные миры с нуля, основываясь на текстовом описании («нарисуй снежный мир с соснами») или просто картинке.
⁃ Yan-Edit — редактор игрового мира, который даёт возможность изменять мир прямо во время игры с помощью текстовых команд. Это самая революционная часть. Вы играете и в любой момент можете написать: «добавь сюда трамплин» или «сделай всё в стиле акварельного рисунка».
Видимо скоро эту модель можно будет ловить тут
Я про генерацию игрового мира с геймплеем по одной картинке или текстовому описанию.
Весь день изучал этот документ, чтобы понять, как всё работает, потому что для меня это похоже на какое-то чудо. Ниже мой краткий пересказ того, как в Tencent создавали Yan.
Чтобы собрать датасет для обучения, они запустили в игровой мир «Yuan Meng Star» ИИ-агента, который бегал там по локациям. 30 раз в секунду система записывала две вещи: кадр (то, что видно на экране в разрешении 1080p) и действие (какая кнопка была нажата - «вперёд», «прыжок», «поворот камеры» и т. д.). В итоге получился огромный «учебник» на 400 миллионов кадров, где каждый кадр точно связан с действием игрока. Это стало основой для обучения всех последующих модулей.
Дальше они сделали ИИ-симулятор игры «Yuan Meng Star» с таким же разрешением картинки (1080p) и частотой кадров (60 FPS). Получился «цифровой двойник» этой игры, который работает на ИИ, а не на игровом движке. Забавно, что Yan-Sim (так они назвали симулятор) может в реальном времени создавать игровой мир с большой точностью, откликаясь на действия игрока мгновенно и без задержек. Он даже точно воспроизводит физику мира: например, персонаж будет скользить по воде, подпрыгивать на батуте или получать урон от электрического забора.
А уже на базе этого ИИ-симулятора в Tencent сделали ещё два модуля:
⁃ Yan-Gen — создаёт совершенно новые интерактивные миры с нуля, основываясь на текстовом описании («нарисуй снежный мир с соснами») или просто картинке.
⁃ Yan-Edit — редактор игрового мира, который даёт возможность изменять мир прямо во время игры с помощью текстовых команд. Это самая революционная часть. Вы играете и в любой момент можете написать: «добавь сюда трамплин» или «сделай всё в стиле акварельного рисунка».
Видимо скоро эту модель можно будет ловить тут
🔥28🤯6❤5👍4❤🔥2🤓2👏1🤔1💯1😇1🤗1
Есть у меня товарищ, который использует (использовал) меня как личный ChatGPT: просто пишет в личку «Тём, посмотри в нейросетях, как на андроиде музыку скачивать». Человек он немолодой, но и не старый - чтобы то же самое не написать прямо в чат с ИИ.
Короче, подарил я ему подписку в Perplexity, всё настроил. Объяснил, как пользоваться, какие функции есть - в общем, полный ликбез. И он реально перестал мне писать по таким вопросам.
А на днях мы встретились, и я стал свидетелем, как этот «новообращённый в ИИ» использует Perplexity со своего телефона. У него создано много разных «Spaces» под задачи - с прописанными инструкциями, подгруженными файлами и прочим.
Меня особенно поразило, как он заказывает продукты. В одном из «Spaces» подгружён документ с разрешёнными и запрещёнными продуктами - рекомендации врача. В «Links» указаны ссылки на каталоги продуктовых магазинов, где он делает заказы. В «Instructions» - промпт в формате: сначала посмотреть рекомендации, затем составить рецепты блюд, а после - для каждого ингредиента дать ссылку для заказа в каталоге.
Сказать, что я офигел, - ничего не сказать. Даже я так не использую. Мне вообще казалось, что Perplexity не очень хорошо ориентируется в каталогах. Но человек просто не знал этого - и сделал себе автоматизацию для заказа еды.
Короче, подарил я ему подписку в Perplexity, всё настроил. Объяснил, как пользоваться, какие функции есть - в общем, полный ликбез. И он реально перестал мне писать по таким вопросам.
А на днях мы встретились, и я стал свидетелем, как этот «новообращённый в ИИ» использует Perplexity со своего телефона. У него создано много разных «Spaces» под задачи - с прописанными инструкциями, подгруженными файлами и прочим.
Меня особенно поразило, как он заказывает продукты. В одном из «Spaces» подгружён документ с разрешёнными и запрещёнными продуктами - рекомендации врача. В «Links» указаны ссылки на каталоги продуктовых магазинов, где он делает заказы. В «Instructions» - промпт в формате: сначала посмотреть рекомендации, затем составить рецепты блюд, а после - для каждого ингредиента дать ссылку для заказа в каталоге.
Сказать, что я офигел, - ничего не сказать. Даже я так не использую. Мне вообще казалось, что Perplexity не очень хорошо ориентируется в каталогах. Но человек просто не знал этого - и сделал себе автоматизацию для заказа еды.
3❤110🤣54🔥45👍25💯8⚡3🤔2🤗1😘1
ChatGPT за 5 баксов
Сегодня праздник пришел на экраны индийских пользователей ChatGPT. Многие, нажав кнопку «Upgrade Plan» увидели, что появился новый тариф Go за 399 индийских рупий ($5).
Единственное отличие от тарифа за $20 — это отсутствие SORA и Codex, которых нет в тарифе за 399 рупий. А еще там только gpt-5 fast (без ризонинга).
Пойду-ка и я стану индийцем…
Сегодня праздник пришел на экраны индийских пользователей ChatGPT. Многие, нажав кнопку «Upgrade Plan» увидели, что появился новый тариф Go за 399 индийских рупий ($5).
Единственное отличие от тарифа за $20 — это отсутствие SORA и Codex, которых нет в тарифе за 399 рупий. А еще там только gpt-5 fast (без ризонинга).
Пойду-ка и я стану индийцем…
👏36🤪17❤12😁6🔥4❤🔥1⚡1💯1🤗1😘1 1
Многим зашёл недавний пост про использование Spaces от Perplexity в быту. Я там рассказывал про кейс знакомого, который автоматизировал создание меню на день и поиск продуктов для него. Штука реально удобная, так как закрывает сразу две проблемы: предлагает варианты, что приготовить, и сразу ищет все ингредиенты с прямыми ссылками для заказа.
Вдохновившись таким форматом оптимизации, я немного переработал кейс под себя. Так что давайте пошагово напишу, что и как я делал:
0. Если у вас нет Pro-аккаунта Perplexity — годовую подписку за несколько баксов можно купить здесь.
1. Заходим в раздел Spaces (https://www.perplexity.ai/spaces/) и жмём «Create a Space». Указываем название.
2. Переходим к настройке Space. Нам доступны следующие функции: Add Files, Add Links, Add Instructions.
3. Add Files: тут я прикрепил файл, где описал пищевые предпочтения своей семьи. Я делал это в Gemini: просто просил сделать таблицу предпочтений и ограничений в еде для каждого члена семьи. Дальше наговаривал голосом, кто что не любит, а что ест с удовольствием — получил заполненную таблицу, которую нужно скачать и добавить в этот раздел.
4. Add Links: в этом разделе указываем ссылку на каталог продуктов, лучше прямую (например, https://vkusvill.ru/goods/) — там Perplexity будет искать для вас продукты.
5. Add Instructions: тут пишем промпт. Вот мой — можете подогнать под свои предпочтения:
.
Вдохновившись таким форматом оптимизации, я немного переработал кейс под себя. Так что давайте пошагово напишу, что и как я делал:
0. Если у вас нет Pro-аккаунта Perplexity — годовую подписку за несколько баксов можно купить здесь.
1. Заходим в раздел Spaces (https://www.perplexity.ai/spaces/) и жмём «Create a Space». Указываем название.
2. Переходим к настройке Space. Нам доступны следующие функции: Add Files, Add Links, Add Instructions.
3. Add Files: тут я прикрепил файл, где описал пищевые предпочтения своей семьи. Я делал это в Gemini: просто просил сделать таблицу предпочтений и ограничений в еде для каждого члена семьи. Дальше наговаривал голосом, кто что не любит, а что ест с удовольствием — получил заполненную таблицу, которую нужно скачать и добавить в этот раздел.
4. Add Links: в этом разделе указываем ссылку на каталог продуктов, лучше прямую (например, https://vkusvill.ru/goods/) — там Perplexity будет искать для вас продукты.
5. Add Instructions: тут пишем промпт. Вот мой — можете подогнать под свои предпочтения:
РОЛЬ
Ты — ассистент по планированию питания для семьи из 5 человек. Задача: составлять меню на день с учётом предпочтений и ограничений (файл предпочтения.xlsx) и формировать список покупок во «ВкусВилл».
Процесс
Сначала спроси:
– «Сегодня готовим сами или берём готовое?»
– «Есть ли особые пожелания или продукты для использования?»
На основе файла и ответов предложи меню (завтрак, обед, ужин). Составь таблицу «Приём пищи | Блюдо | Ккал | Примечания». Заверши вопросом: «Подходит? Если да — соберу корзину во ВкусВилл».
После подтверждения собери корзину:
– используй только https://vkusvill.ru/goods/
, ссылки строго на карточки товаров;
– указывай количество с учётом упаковки на 5 человек;
– если товара нет — предложи замену с пометкой «(замена)»;
– оформи таблицу: «Ингредиент | Кол-во | Вариант (Название — Цена — URL)»;
– добавь итоговую сумму.
Правила
– Учитывай аллергии и запреты в первую очередь.
– Будь дружелюбным и лаконичным.
– Формат вывода — Markdown-таблицы.
.
13🔥76❤17👍15✍3👏3 2❤🔥1⚡1🦄1
Силиконовый Мешок
Многим зашёл недавний пост про использование Spaces от Perplexity в быту. Я там рассказывал про кейс знакомого, который автоматизировал создание меню на день и поиск продуктов для него. Штука реально удобная, так как закрывает сразу две проблемы: предлагает…
Есть еще один интересный Space в Perplexity, который я использую почти каждый день.
Думаю, многие из вас знают, что Perplexity хорошо транскрибирует YouTube ролики. Просто кидаешь ссылку и просишь содержание видео.
Но я решил пойти дальше и сделать отдельный Space для фактчекинга роликов. Вот такой промпт нужно добавить в Instructions:
Для коротких роликов - работает хорошо, когда закидываешь 2-3-х часовые интервью «сами_знаете_кого», находит максимум 5 тезисов на весь выпуск. Но моя задача показать базовый функционал, а вы уже додумаете, как применить.
Думаю, многие из вас знают, что Perplexity хорошо транскрибирует YouTube ролики. Просто кидаешь ссылку и просишь содержание видео.
Но я решил пойти дальше и сделать отдельный Space для фактчекинга роликов. Вот такой промпт нужно добавить в Instructions:
Контекст: Действуй как строгая система проверки фактов (фактчекинга), оценивающая утверждения пользователя на предмет точности. Разбивай сложные запросы на отдельные утверждения, классифицируй каждое как «Правда», «Ложь», «Частично правда» или «Непроверяемо» и предоставляй прозрачные объяснения. Ссылайся на надежные источники и выделяй двусмысленные или неполные утверждения, требующие уточнения. Следуй стандартам журналистских расследований и академических исследований.
Роль: Ты — эксперт-фактчекер с более чем 20-летним опытом в журналистике и исследованиях, придерживающийся высочайших стандартов точности, добросовестности и прозрачности. Ты обладаешь навыками нюансированной оценки, способен отличать двусмысленные утверждения и подкреплять свои выводы заслуживающими доверия, проверяемыми источниками. Действуй со строгостью, сравнимой с PolitiFact, FactCheck.org и рецензируемыми научными учреждениями.
Действие:
- Разбей исходный запрос на проверяемые утверждения.
- Классифицируй правдивость каждого утверждения.
- Предоставь краткие объяснения для каждой классификации.
- Укажи условия, влияющие на точность утверждения, если это применимо.
- Для каждого утверждения приведи как минимум один авторитетный источник, указав прямую, кликабельную ссылку.
⁃ Запроси уточнения для неясных или неполных утверждений.
Формат: Представь результаты в формате markdown, используя следующую структуру:
- Утверждение [n]: [текст утверждения]
- Оценка: [Правда/Ложь/Частично правда/Непроверяемо]
- Объяснение: [аргументация]
- Условия: [контекст, если применимо]
- Источники: [прямая, кликабельная ссылка на источник]
Для коротких роликов - работает хорошо, когда закидываешь 2-3-х часовые интервью «сами_знаете_кого», находит максимум 5 тезисов на весь выпуск. Но моя задача показать базовый функционал, а вы уже додумаете, как применить.
6❤52🔥28👍16❤🔥5🤯4👏1
Если вы используете API OpenAI, то можно получить от 1 до 10 млн бесплатных токенов в день.
Что нужно сделать?Продать душу разрешить анализировать ваши входящие и исходящие запросы. Заходите сюда и разрешаете OpenAI это делать - получаете бонус.
Что нужно сделать?
До 1 миллиона токенов в день для моделей gpt-5, gpt-5-chat-latest, gpt-4.1, gpt-4o, o1 и o3.
До 10 миллионов токенов в день для моделей gpt-5-mini, gpt-5-nano, gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini и codex-mini-latest.
1🔥31❤5👍4👀3✍2👏1
Силиконовый Мешок
Думаю, вы видели последнюю новость о том, что «пошаренные» чаты в ChatGPT были проиндексированы Google и теперь любой желающий может почитать ваше общение с агентом. Нужно просто вбить в поисковую строку site:chatgpt.com/share и указать в конце ключевое слово.…
Хаха, теперь и у Grok проиндексировалось около 400 000 диалогов с пользователями.
Все по классике, пишем в гугле:
И находим любой диалог, где пользователь нажал «поделиться». Забавно, что когда эта ситуация произошла с OpenAI - Илон Маск сказал, что у Grok такой подставы быть не может.
Все по классике, пишем в гугле:
site:grok.com/share [слово]
И находим любой диалог, где пользователь нажал «поделиться». Забавно, что когда эта ситуация произошла с OpenAI - Илон Маск сказал, что у Grok такой подставы быть не может.
🤣62🔥12😁7❤4⚡1🤯1💯1
С понедельника посты в канале будут выходить не так часто, но это всего на неделю. Вы же помните, что я еду вожатым в лагерь для взрослых?
Буду свои мысли не буквами выдавать, а словами рассказывать — есть желание прямо какие-то интересные проекты с ребятами запустить в рамках недели лагеря.
Ну и с вами буду делиться происходящим (нечасто — вы такое не любите), а те, кто хочет поехать, — всё ещё могут это сделать. Не забывайте: чтобы получить суперскидку, всегда говорите: «я от силиконового мешка».
Буду свои мысли не буквами выдавать, а словами рассказывать — есть желание прямо какие-то интересные проекты с ребятами запустить в рамках недели лагеря.
Ну и с вами буду делиться происходящим (нечасто — вы такое не любите), а те, кто хочет поехать, — всё ещё могут это сделать. Не забывайте: чтобы получить суперскидку, всегда говорите: «я от силиконового мешка».
🔥30❤🔥7⚡5❤4🤩3👍2👏2
Как научиться делать ИИ-агентов и не сойти с ума
Я подсчитал — в этом канале 150 постов про ИИ-агентов, это самая популярная тема последних лет тут.
Но все равно каждый день я получаю один и тот же вопрос, написанный в разных формулировках: «Как мне научиться создавать ИИ-агентов?».
Начнем с того, что я всё так же настаиваю начинать с курса от Hugging Face про ИИ-агентов. Считаю, что это база для новичка.
А теперь перейдем к этапам:
ФАЗА 0: ИГРУШКА
Хватит читать туториалы. Серьёзно. Возьмите один PDF-файл, своё резюме, статью из Википедии — что угодно — и создайте чат-бота, который сможет отвечать на вопросы по этому документу. Используйте LangChain или n8n. Не парьтесь насчёт UI. Не парьтесь, если он медленный. Ваша единственная цель — понять, как на самом деле связаны между собой промпт, контекстное окно и LLM. Вы должны прочувствовать ограничения базового RAG, прежде чем сможете оценить что-то другое.
ФАЗА 1: ИНСТРУМЕНТЫ
Теперь дайте своему боту один инструмент. Калькулятор, API погоды — что угодно. Именно здесь вы переходите от поискового бота к ии-агенту. Настоящая сложность не в том, чтобы вызвать API, а в работе с промптингом, чтобы заставить агента понимать, когда использовать инструмент, а когда просто сгенерировать ответ.
ФАЗА 2: ОРКЕСТРАТОР
Один агент не может всё делать одинаково хорошо. Поэтому создайте систему из специализированных агентов. Единственная задача агента-оркестратора — получить запрос и направить его нужному «специалисту»: агенту по биллингу, агенту поддержки и т. д. Здесь ваш простой скрипт превращается в настоящую систему, и вы вынуждены задуматься, как агенты общаются между собой.
ФАЗА 3: ПАМЯТЬ
Агент без памяти — это просто вызов функции. Он не может вести настоящий диалог. Теперь дайте своим агентам память. Начните с простой истории диалога, затем переходите к векторной базе для «долговременной памяти». Сложность не в том, чтобы сохранить память, а в том, чтобы извлечь только релевантные её части, не засирая контекстное окно.
ФАЗА 4: ОГРАНИЧИТЕЛИ
Именно на этом этапе большинство проектов проваливаются. Агент, который может всё, — это агент, который будет постоянно галлюцинировать и факапить. Теперь вы учитесь говорить «нет». Создайте жёсткие правила, валидацию вывода и контент-фильтры. Ваша задача научить агента говорить «я не знаю» вместо того, чтобы врать.
ФАЗА X: РЕАЛЬНЫЙ МИР
Всё, что было до этого — песочница. Настоящая работа начинается только сейчас. Вы его разворачиваете. Вы узнаете о задержках (latency), мониторинге и т.д. Вы создаёте циклы обратной связи, чтобы агент учился на своих ошибках. Вы сталкиваетесь с конфиденциальностью данных и доверием пользователей. Эта фаза никогда не заканчивается. Вы просто становитесь лучше в этом цикле.
Вот и всё. Вот и весь путь изучения ии-агентов. Просто повторяйте это каждый день испина голова болеть не будет.
Я подсчитал — в этом канале 150 постов про ИИ-агентов, это самая популярная тема последних лет тут.
Но все равно каждый день я получаю один и тот же вопрос, написанный в разных формулировках: «Как мне научиться создавать ИИ-агентов?».
Начнем с того, что я всё так же настаиваю начинать с курса от Hugging Face про ИИ-агентов. Считаю, что это база для новичка.
А теперь перейдем к этапам:
ФАЗА 0: ИГРУШКА
Хватит читать туториалы. Серьёзно. Возьмите один PDF-файл, своё резюме, статью из Википедии — что угодно — и создайте чат-бота, который сможет отвечать на вопросы по этому документу. Используйте LangChain или n8n. Не парьтесь насчёт UI. Не парьтесь, если он медленный. Ваша единственная цель — понять, как на самом деле связаны между собой промпт, контекстное окно и LLM. Вы должны прочувствовать ограничения базового RAG, прежде чем сможете оценить что-то другое.
ФАЗА 1: ИНСТРУМЕНТЫ
Теперь дайте своему боту один инструмент. Калькулятор, API погоды — что угодно. Именно здесь вы переходите от поискового бота к ии-агенту. Настоящая сложность не в том, чтобы вызвать API, а в работе с промптингом, чтобы заставить агента понимать, когда использовать инструмент, а когда просто сгенерировать ответ.
ФАЗА 2: ОРКЕСТРАТОР
Один агент не может всё делать одинаково хорошо. Поэтому создайте систему из специализированных агентов. Единственная задача агента-оркестратора — получить запрос и направить его нужному «специалисту»: агенту по биллингу, агенту поддержки и т. д. Здесь ваш простой скрипт превращается в настоящую систему, и вы вынуждены задуматься, как агенты общаются между собой.
ФАЗА 3: ПАМЯТЬ
Агент без памяти — это просто вызов функции. Он не может вести настоящий диалог. Теперь дайте своим агентам память. Начните с простой истории диалога, затем переходите к векторной базе для «долговременной памяти». Сложность не в том, чтобы сохранить память, а в том, чтобы извлечь только релевантные её части, не засирая контекстное окно.
ФАЗА 4: ОГРАНИЧИТЕЛИ
Именно на этом этапе большинство проектов проваливаются. Агент, который может всё, — это агент, который будет постоянно галлюцинировать и факапить. Теперь вы учитесь говорить «нет». Создайте жёсткие правила, валидацию вывода и контент-фильтры. Ваша задача научить агента говорить «я не знаю» вместо того, чтобы врать.
ФАЗА X: РЕАЛЬНЫЙ МИР
Всё, что было до этого — песочница. Настоящая работа начинается только сейчас. Вы его разворачиваете. Вы узнаете о задержках (latency), мониторинге и т.д. Вы создаёте циклы обратной связи, чтобы агент учился на своих ошибках. Вы сталкиваетесь с конфиденциальностью данных и доверием пользователей. Эта фаза никогда не заканчивается. Вы просто становитесь лучше в этом цикле.
Вот и всё. Вот и весь путь изучения ии-агентов. Просто повторяйте это каждый день и
10❤93👍39🔥28✍4❤🔥3😁3⚡2😍1🤝1💊1
Видимо, я самый последний делюсь впечатлением о новой Нанобанано, которая уже неделю доступна в гугловском AI Studio и на куче агрегаторов.
Знаете, мне понравилось — по моим ощущениям, эта контекстно-редактирующая модель лучше FLUX Context и GPT-шной.
На следующей неделе доберусь до компьютера и как следует её погоняю, а пока наслаждайтесь тем, как она восстановила самую первую в истории фотографию.
Знаете, мне понравилось — по моим ощущениям, эта контекстно-редактирующая модель лучше FLUX Context и GPT-шной.
На следующей неделе доберусь до компьютера и как следует её погоняю, а пока наслаждайтесь тем, как она восстановила самую первую в истории фотографию.
👍39❤22🤯12🔥7 4👎1
Ну что, дорогие постигаторы знаний, скоро в школу!
Задумался, что помимо учебников и новых портфелей вошло в наш с детьми ученический ИИ-сет. Пока мой список выглядит так:
Perplexity — идеальное решение для подготовки эссе, рефератов и погружения в новые темы. Ещё в прошлом году сделал детям отдельные аккаунты, воспользовавшись выгодным предложением за несколько баксов.
ChatGPT — конечно же, с режимом «Учеба и обучение». Это наша с детьми любимая функция, чтобы подучить какой-то материал или освоить новые знания. Максимальный рекомендасьон.
NotebookLM — тут сложно что-то новое написать: собираем кучу материалов в формате сайтов, PDF-ок и даже учебников, кидаем в недра «ноутбука» и вгрызаемся в гранит науки.
MathGPT — очень крутой инструмент для решения математических задач. Если честно, я и сам его использую для проверки домашних заданий у детей. Бесплатно.
Gemini — исключительно по причине гигантского контекстного окна и возможности создавать «Deep Research» объёмом с дипломную работу. А недавно, я для своего дошкольника начал там Storybook’и делать про дни недели на английском или времена года - вообще топ формат.
Gamma — в прошлом году почти все презентации для школы делали в ней. Для детей вполне хватает и бесплатной версии.
Это прямо наша база, но платформ для обучения и разных инструментов становится всё больше и больше. Иногда мне кажется, что уже и пользователей столько нет, сколько продуктов каждый день клепают. А вы что используете для себя или в помощь детям?
Задумался, что помимо учебников и новых портфелей вошло в наш с детьми ученический ИИ-сет. Пока мой список выглядит так:
Perplexity — идеальное решение для подготовки эссе, рефератов и погружения в новые темы. Ещё в прошлом году сделал детям отдельные аккаунты, воспользовавшись выгодным предложением за несколько баксов.
ChatGPT — конечно же, с режимом «Учеба и обучение». Это наша с детьми любимая функция, чтобы подучить какой-то материал или освоить новые знания. Максимальный рекомендасьон.
NotebookLM — тут сложно что-то новое написать: собираем кучу материалов в формате сайтов, PDF-ок и даже учебников, кидаем в недра «ноутбука» и вгрызаемся в гранит науки.
MathGPT — очень крутой инструмент для решения математических задач. Если честно, я и сам его использую для проверки домашних заданий у детей. Бесплатно.
Gemini — исключительно по причине гигантского контекстного окна и возможности создавать «Deep Research» объёмом с дипломную работу. А недавно, я для своего дошкольника начал там Storybook’и делать про дни недели на английском или времена года - вообще топ формат.
Gamma — в прошлом году почти все презентации для школы делали в ней. Для детей вполне хватает и бесплатной версии.
Это прямо наша база, но платформ для обучения и разных инструментов становится всё больше и больше. Иногда мне кажется, что уже и пользователей столько нет, сколько продуктов каждый день клепают. А вы что используете для себя или в помощь детям?
❤56🔥14👍10❤🔥3🙏1💯1🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну что! Я приехал. Включаюсь в работу, завтра будем разгребать, что там в мире ИИ произошло за неделю. Всех с Днём знаний!
🔥40🤣15 6❤4👏2❤🔥1😍1🦄1💊1😎1
Начнем сезон с обзора Nano Banana 🍌
По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый обзорчик».
26 августа 2025 года Google представила Gemini 2.5 Flash (внутреннее название Nano Banana) — свою новую модель для генерации и редактирования изображений. И это не очередной генератор картинок, а полноценная визуальная экосистема, способная понимать сложный контекст, поддерживать согласованность персонажей и объектов и, что самое главное, точно следовать инструкциям пользователя.
Я пользуюсь «Бананой» в Google AI Studio, там все просто и нативно. Переходите на aistudio.google.com и дальше:
1) Выбираете модель Gemini 2.5 Flash
2) Нажимаете на иконку изображения, чтобы прикрепить референсные картинки
3) Пишете промпты на любом языке, но английский модель понимает лучше
4) Можете поиграть с «температурой» (рекомендуется 0.4–0.8 для изображений).
5) Я поставил максимальное количество токенов на выходе для более детальной генерации.
Еще доступ к Gemini 2.5 Flash можно получить тут:
- Gemini API — для разработчиков (оплата за использование).
- Vertex AI — корпоративное решение с расширенными функциями.
- Gemini Native Image в чате Gemini — нажмите «Создать изображение».
- Adobe Firefly — полная интеграция (20 бесплатно в месяц, затем безлимитно с Creative Cloud).
- Adobe Express — удобный интерфейс для пользователей.
- Freepik — интеграция с инструментами ИИ для изображений.
- Poe by Quora — доступ к нескольким моделям, включая Gemini.
Цены и лимиты
При использовании через API/Studio/Vertex:
- $0.039 за изображение (в среднем 1290 токенов).
- Лимиты: 10 запросов в минуту (бесплатный тариф), 60 запросов в минуту (платный).
- Максимум на входе: 5 изображений одновременно.
- Разрешение на выходе: до 4K (4096×4096).
Через Adobe Firefly:
- 20 бесплатных изображений в месяц для всех пользователей.
- Безлимитно до 1 сентября для платных подписчиков Creative Cloud.
- После 1 сентября: пользователи Express получают безлимитный доступ.
Что мне больше всего понравилось в Nano Banana по сравнению с FLUX Kontext:
- Может объединить от 2 до 5 изображений в одну картинку.
- Очень хорошо удерживает «идентичность» персонажа при итерациях.
- Добавление и удаление объектов.
- Может изменять конкретные элементы через промпт.
- Есть знания о мире, и модель реально понимает культурные отсылки.
- Время генерации — 2–4 секунды.
- Отрисовка текста — действительно пишет слова правильно.
- Понимание 3D-пространства — поворачивает объекты, меняет перспективу.
- Понимает, какой свет должен быть в разное время суток.
- Реалистично изменяет текстуры.
- Создавать в нем скетчи — одно удовольствие.
Если интересно, могу следующим постом рассказать про бизнес-кейсы и «домашнее» использование Gemini 2.5 Flash. Просто дайте знать нашим тайным способом —🔥
По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый обзорчик».
26 августа 2025 года Google представила Gemini 2.5 Flash (внутреннее название Nano Banana) — свою новую модель для генерации и редактирования изображений. И это не очередной генератор картинок, а полноценная визуальная экосистема, способная понимать сложный контекст, поддерживать согласованность персонажей и объектов и, что самое главное, точно следовать инструкциям пользователя.
Я пользуюсь «Бананой» в Google AI Studio, там все просто и нативно. Переходите на aistudio.google.com и дальше:
1) Выбираете модель Gemini 2.5 Flash
2) Нажимаете на иконку изображения, чтобы прикрепить референсные картинки
3) Пишете промпты на любом языке, но английский модель понимает лучше
4) Можете поиграть с «температурой» (рекомендуется 0.4–0.8 для изображений).
5) Я поставил максимальное количество токенов на выходе для более детальной генерации.
Еще доступ к Gemini 2.5 Flash можно получить тут:
- Gemini API — для разработчиков (оплата за использование).
- Vertex AI — корпоративное решение с расширенными функциями.
- Gemini Native Image в чате Gemini — нажмите «Создать изображение».
- Adobe Firefly — полная интеграция (20 бесплатно в месяц, затем безлимитно с Creative Cloud).
- Adobe Express — удобный интерфейс для пользователей.
- Freepik — интеграция с инструментами ИИ для изображений.
- Poe by Quora — доступ к нескольким моделям, включая Gemini.
Цены и лимиты
При использовании через API/Studio/Vertex:
- $0.039 за изображение (в среднем 1290 токенов).
- Лимиты: 10 запросов в минуту (бесплатный тариф), 60 запросов в минуту (платный).
- Максимум на входе: 5 изображений одновременно.
- Разрешение на выходе: до 4K (4096×4096).
Через Adobe Firefly:
- 20 бесплатных изображений в месяц для всех пользователей.
- Безлимитно до 1 сентября для платных подписчиков Creative Cloud.
- После 1 сентября: пользователи Express получают безлимитный доступ.
Что мне больше всего понравилось в Nano Banana по сравнению с FLUX Kontext:
- Может объединить от 2 до 5 изображений в одну картинку.
- Очень хорошо удерживает «идентичность» персонажа при итерациях.
- Добавление и удаление объектов.
- Может изменять конкретные элементы через промпт.
- Есть знания о мире, и модель реально понимает культурные отсылки.
- Время генерации — 2–4 секунды.
- Отрисовка текста — действительно пишет слова правильно.
- Понимание 3D-пространства — поворачивает объекты, меняет перспективу.
- Понимает, какой свет должен быть в разное время суток.
- Реалистично изменяет текстуры.
- Создавать в нем скетчи — одно удовольствие.
Если интересно, могу следующим постом рассказать про бизнес-кейсы и «домашнее» использование Gemini 2.5 Flash. Просто дайте знать нашим тайным способом —
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥157❤16👍8🤣3 3🍌2❤🔥1👏1🤗1😘1
Силиконовый Мешок
Начнем сезон с обзора Nano Banana 🍌 По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый…
Как задавать нужные позы в Nano Banana?
Я немного устал рисовать референсы карандашом на бумаге и нашел такой сайт: https://posemy.art/ - там можно изменять позы, крутить тело в любую сторону и все это в 3D. А еще бесплатно.
Дальше я кидаю два изображения в «Банану» с таким промптом:
Еще можно использовать ИИ-апскейлеры, чтобы с исходных 900px дотащить до 4K.
Обратите внимание: если вы загружаете два референсных изображения, лучше всего, чтобы у них было одинаковое соотношение сторон. Если у изображений разные соотношения сторон, итоговое изображение будет с параметрами последнего.
Я немного устал рисовать референсы карандашом на бумаге и нашел такой сайт: https://posemy.art/ - там можно изменять позы, крутить тело в любую сторону и все это в 3D. А еще бесплатно.
Дальше я кидаю два изображения в «Банану» с таким промптом:
Have the character in Figure 1 pose as shown in Figure 2, keeping their appearance, clothing, and style unchanged; adjust only the movements.
Еще можно использовать ИИ-апскейлеры, чтобы с исходных 900px дотащить до 4K.
Обратите внимание: если вы загружаете два референсных изображения, лучше всего, чтобы у них было одинаковое соотношение сторон. Если у изображений разные соотношения сторон, итоговое изображение будет с параметрами последнего.
5❤40🔥24👏5 5⚡2