Главный вопрос вопрос от тех, кто только начинает погружаться в мир ИИ, звучит так: кому платить двадцатку? Ну или какую ИИ-модель выбрать под свои задачи. Я всегда рекомендую начать с Perplexity - она не дорогая и там можно протестировать все модели сразу, чтобы определиться. Ну а если кратко:
ChatGPT (Для личного использования и малого бизнеса)
Сильные стороны: Режим агента может сам искать информацию в интернете, автоматизировать рутину и выполнять задачи. Пользовательские GPTs позволяют создавать мини-приложения и свои сценарии работы. Проекты в ChatGPT удобны для совместной работы. Он подключается к Microsoft и Google Дискам. Голосовой диалог ощущается, будто говоришь с реальным человеком. Очень удобный инструмент канвас для текста и кода. У него 1 миллион корпоративных клиентов и 80% рынка с 700 миллионами пользователей.
Слабые стороны:
- В ресечах уступает Gemini и Claude
- Генерация видео (Sora) пока без звука (Veo от Gemini здесь выигрывает)
- Генерация изображений неплохая, но уступает Gemini Nano Banana
- Плохо создает инфографику и простые слайды
Copilot (Для работы в экосистеме Microsoft)
Сильные стороны: Дает самую глубокую интеграцию с Word, Excel, Outlook и Teams. Доступ к файлам через «/» позволяет работать напрямую с документами и таблицами. Безопасность обеспечивается через Microsoft Graph, и для работы не нужно подключать сторонних поставщиков или покупать дополнительные лицензии.
Слабые стороны:
- Замкнут на экосистеме Microsoft
- Мало творческих функций
- Дорогой, если вы не пользуетесь подпиской Microsoft 365
Gemini (Экосистема Google + творчество)
Сильные стороны: Модель 2.5 Pro имеет самое большое «окно контекста» среди всех. Nano Banana считается лучшим для генерации и редактирования изображений. Veo 3 создает короткие видео вирусного качества со звуком. NotebookLM круто пересказывает огромные документы в аудио и видео. Он хорош в глубоких исследованиях, создании инфографики. Очень недорогой API и бесшовная интеграция с Gmail и Google Диском.
Слабые стороны:
- Инструменты AI Studio все еще в бета-версии
- Veo 3 ограничен 8 секундами и стоит дорого
Claude (Исследования, тексты, код, совместная работа)
Сильные стороны: Он лучше других создает презентации, таблицы Excel и финансовые модели. Модели Sonnet и Opus 4 считаются топовыми для программирования. Проекты в Claude удобны для командной работы. Он отлично создает инфографику, кратко собирает информацию из сотен источников для Deep Research. Подключается к Google Диску, Microsoft Drive и Canva.
Слабые стороны:
- Не генерирует изображения
- Не генерирует видео
- Нет режима агента
Perplexity (Веб-исследования и браузинг)
Сильные стороны: Это ИИ-браузер, который ищет информацию в реальном времени и всегда предоставляет ссылки на источники. Удобно искать и анализировать информацию, умеет находить актуальные новости, события и цены. Pro-версия подключается к академическим, финансовым базам данных и социальным сетям (Reddit). Отлично подходит для маркетинговых исследований и проверки фактов и для студентов. Работает со всеми LLM’ками, просто переключаете в настройках, какую будете использовать и все. Недорогой, если знать где покупать годовые лицензии.
Слабые стороны:
- Слаб в творческих задачах
- Меньшее «окно контекста» по сравнению с Gemini/Claude
Grok (Анализ трендов в соцсетях в реальном времени)
Сильные стороны: Это единственный ИИ с доступом к данным X/Twitter в реальном времени. Он дает ответы без цензуры, проводит анализ настроений и быстро отслеживает текущие события. Обладает уникальным характером и юмором. Недавно научился генерировать изображения и имеет интересную функцию «Companions» (собеседники).
Слабые стороны:
- Ограничен использованием для соцсетей и новостей
- Нет инструментов для создания документов.
- Слаб для профессиональных и бизнес-задач
- Все еще нет интерфейса командной строки для программирования
ChatGPT (Для личного использования и малого бизнеса)
Сильные стороны: Режим агента может сам искать информацию в интернете, автоматизировать рутину и выполнять задачи. Пользовательские GPTs позволяют создавать мини-приложения и свои сценарии работы. Проекты в ChatGPT удобны для совместной работы. Он подключается к Microsoft и Google Дискам. Голосовой диалог ощущается, будто говоришь с реальным человеком. Очень удобный инструмент канвас для текста и кода. У него 1 миллион корпоративных клиентов и 80% рынка с 700 миллионами пользователей.
Слабые стороны:
- В ресечах уступает Gemini и Claude
- Генерация видео (Sora) пока без звука (Veo от Gemini здесь выигрывает)
- Генерация изображений неплохая, но уступает Gemini Nano Banana
- Плохо создает инфографику и простые слайды
Copilot (Для работы в экосистеме Microsoft)
Сильные стороны: Дает самую глубокую интеграцию с Word, Excel, Outlook и Teams. Доступ к файлам через «/» позволяет работать напрямую с документами и таблицами. Безопасность обеспечивается через Microsoft Graph, и для работы не нужно подключать сторонних поставщиков или покупать дополнительные лицензии.
Слабые стороны:
- Замкнут на экосистеме Microsoft
- Мало творческих функций
- Дорогой, если вы не пользуетесь подпиской Microsoft 365
Gemini (Экосистема Google + творчество)
Сильные стороны: Модель 2.5 Pro имеет самое большое «окно контекста» среди всех. Nano Banana считается лучшим для генерации и редактирования изображений. Veo 3 создает короткие видео вирусного качества со звуком. NotebookLM круто пересказывает огромные документы в аудио и видео. Он хорош в глубоких исследованиях, создании инфографики. Очень недорогой API и бесшовная интеграция с Gmail и Google Диском.
Слабые стороны:
- Инструменты AI Studio все еще в бета-версии
- Veo 3 ограничен 8 секундами и стоит дорого
Claude (Исследования, тексты, код, совместная работа)
Сильные стороны: Он лучше других создает презентации, таблицы Excel и финансовые модели. Модели Sonnet и Opus 4 считаются топовыми для программирования. Проекты в Claude удобны для командной работы. Он отлично создает инфографику, кратко собирает информацию из сотен источников для Deep Research. Подключается к Google Диску, Microsoft Drive и Canva.
Слабые стороны:
- Не генерирует изображения
- Не генерирует видео
- Нет режима агента
Perplexity (Веб-исследования и браузинг)
Сильные стороны: Это ИИ-браузер, который ищет информацию в реальном времени и всегда предоставляет ссылки на источники. Удобно искать и анализировать информацию, умеет находить актуальные новости, события и цены. Pro-версия подключается к академическим, финансовым базам данных и социальным сетям (Reddit). Отлично подходит для маркетинговых исследований и проверки фактов и для студентов. Работает со всеми LLM’ками, просто переключаете в настройках, какую будете использовать и все. Недорогой, если знать где покупать годовые лицензии.
Слабые стороны:
- Слаб в творческих задачах
- Меньшее «окно контекста» по сравнению с Gemini/Claude
Grok (Анализ трендов в соцсетях в реальном времени)
Сильные стороны: Это единственный ИИ с доступом к данным X/Twitter в реальном времени. Он дает ответы без цензуры, проводит анализ настроений и быстро отслеживает текущие события. Обладает уникальным характером и юмором. Недавно научился генерировать изображения и имеет интересную функцию «Companions» (собеседники).
Слабые стороны:
- Ограничен использованием для соцсетей и новостей
- Нет инструментов для создания документов.
- Слаб для профессиональных и бизнес-задач
- Все еще нет интерфейса командной строки для программирования
1🔥51❤23👍17✍1⚡1👏1💯1🤗1🦄1
Силиконовый Мешок
Главный вопрос вопрос от тех, кто только начинает погружаться в мир ИИ, звучит так: кому платить двадцатку? Ну или какую ИИ-модель выбрать под свои задачи. Я всегда рекомендую начать с Perplexity - она не дорогая и там можно протестировать все модели сразу…
Какой ИИ-агент заменит тебя в офисе?
Продолжаем вчерашнюю тему с анализом ИИ-инструментов. Сегодня давайте разберем какие сервисы помогают в решение рабочих задач.
Есть такой венчурный фонд a16z (Andreessen Horowitz) — это прям крупные ребята, инвестирующие в половину Кремниевой долины. Ну и, как вы понимаете, в последнее время их основной фокус на ИИ-компаниях, а когда ты за чем-то следишь — ты обязательно это исследуешь (чтобы понимать, куда деньги заносить).
Так вот, эти ребята решили разобраться в рынке ИИ-помощников и выкатили крутое исследование (с картинками!) о том, кто из ИИ круче в офисной работе: от составления писем и таблиц до ресёрча и полноценной аналитики.
Они разделили все инструменты на два лагеря:
— «Универсалы» (горизонтальные) — те, что пытаются делать всё сразу.
— «Специалисты» (вертикальные) — заточенные под одну задачу: почту, таблицы или презентации.
А затем устроили им настоящий краш-тест на офисных задачах. Ну, а я вам это исследование перевел, отредактировал и в лонгрид уложил. Обязательно поделитесь им со своим другом, который постоянно ничего не успевает на работе.
https://teletype.in/@prompt_design/the-ai-native-office-suite-can-ai-do-work-for-you
Продолжаем вчерашнюю тему с анализом ИИ-инструментов. Сегодня давайте разберем какие сервисы помогают в решение рабочих задач.
Есть такой венчурный фонд a16z (Andreessen Horowitz) — это прям крупные ребята, инвестирующие в половину Кремниевой долины. Ну и, как вы понимаете, в последнее время их основной фокус на ИИ-компаниях, а когда ты за чем-то следишь — ты обязательно это исследуешь (чтобы понимать, куда деньги заносить).
Так вот, эти ребята решили разобраться в рынке ИИ-помощников и выкатили крутое исследование (с картинками!) о том, кто из ИИ круче в офисной работе: от составления писем и таблиц до ресёрча и полноценной аналитики.
Они разделили все инструменты на два лагеря:
— «Универсалы» (горизонтальные) — те, что пытаются делать всё сразу.
— «Специалисты» (вертикальные) — заточенные под одну задачу: почту, таблицы или презентации.
А затем устроили им настоящий краш-тест на офисных задачах. Ну, а я вам это исследование перевел, отредактировал и в лонгрид уложил. Обязательно поделитесь им со своим другом, который постоянно ничего не успевает на работе.
https://teletype.in/@prompt_design/the-ai-native-office-suite-can-ai-do-work-for-you
Teletype
Офисные ИИ-Агенты: когда они нас заменят?
Искусственный интеллект — это уже не просто функция, а полноценный член команды. Он берет на себя много задач: от составления писем...
5❤29✍15🔥8👍7❤🔥4🤔2👏1🙏1😍1🦄1
Media is too big
VIEW IN TELEGRAM
Видели какую обнову китайцы сделали? Wan2.2-Animate - две основные функции: замена персонажа и анимация по эталонному видео. Можно уже потестить на Hugging Face
🔥39👍9❤3👏1🙏1💯1😘1
ИИ-автоматизации и ИИ-агенты
Кажется, что уже все вокруг запустили свои ИИ-студии (или агентства), в которых занимаются автоматизацией клиентских процессов и внедряют им много искусственного интеллекта. Но когда немного поресечишь или пообщаешься с «автоматизаторами» — понимаешь, что все делают в основном RAG-ботов. Это когда к LLM-ке прикручивают векторную базу с вашими данными и выводят интерфейс в Telegram-бот.
Еще одним подтверждением моих выводов можно считать этот прекрасный сборник ТЫСЯЧИ схем ИИ-агентов и ИИ-автоматизаций. Его автор задался вопросом, «че там все автоматизируют», и при помощи этого API спарсил тысячи постов на Reddit, описывающих свои ИИ-автоматизации. И действительно, эту тысячу схем можно поделить на три основных класса:
Класс 1: Чат с данными (около 50% проектов)
Это доминирующий паттерн: чат-интерфейс для взаимодействия с данными из конкретной области через RAG. Источники данных дико разнятся:
Внешние: результаты веб-поиска, «Википедия», новостные ленты.
Внутренние: базы данных компаний, учебные материалы университетов, лор D&D.
Эфемерные: содержимое конкретного видео на YouTube, запись встречи или PDF-документ (около 1/3 этих проектов используют PDF в качестве основного формата ввода).
Несколько примеров из базы схем:
1) [RAG-система с информацией о программе резидентства в Канаде]
2) [Чат-бот NPC для D&D с базой знаний по лору]
3) [Система вопросов и ответов по видео с YouTube]
Класс 2: Автоматизация бизнес-процессов (~25% проектов)
Эти проекты автоматизируют бизнес-процессы: заметки по встречам, скоринг лидов в CRM, сопоставление резюме, автоматический анализ новостей. Они часто обрабатывают данные пакетами, а не отвечают на запросы в реальном времени.
Несколько примеров:
1) [Система приоритизации и скоринга лидов в B2B CRM]
2) [Конвертация научных статей в подкасты]
3) [Автоматический утренний анализ новостей и инвестиций]
Класс 3: Агенты-планировщики с использованием инструментов (~15% проектов)
Сюда входят мультиагентные фреймворки (большинство просто не работают), исследовательские агенты, агенты для кодинга и системы на основе ReAct для конкретных областей, таких как написание скриптов для Blender или управление Kubernetes.
Примеры:
1) [Мультиагентная генерация контента]
2) [Агент для сканирования на киберугрозы]
В общем, на данный момент большая часть ИИ-автоматизаций сводится к чат-ботам, а остальная — к сложным и геморройным проектам. Так что на рынке ИИ-автоматизаций еще есть что оптимизировать.
Кажется, что уже все вокруг запустили свои ИИ-студии (или агентства), в которых занимаются автоматизацией клиентских процессов и внедряют им много искусственного интеллекта. Но когда немного поресечишь или пообщаешься с «автоматизаторами» — понимаешь, что все делают в основном RAG-ботов. Это когда к LLM-ке прикручивают векторную базу с вашими данными и выводят интерфейс в Telegram-бот.
Еще одним подтверждением моих выводов можно считать этот прекрасный сборник ТЫСЯЧИ схем ИИ-агентов и ИИ-автоматизаций. Его автор задался вопросом, «че там все автоматизируют», и при помощи этого API спарсил тысячи постов на Reddit, описывающих свои ИИ-автоматизации. И действительно, эту тысячу схем можно поделить на три основных класса:
Класс 1: Чат с данными (около 50% проектов)
Это доминирующий паттерн: чат-интерфейс для взаимодействия с данными из конкретной области через RAG. Источники данных дико разнятся:
Внешние: результаты веб-поиска, «Википедия», новостные ленты.
Внутренние: базы данных компаний, учебные материалы университетов, лор D&D.
Эфемерные: содержимое конкретного видео на YouTube, запись встречи или PDF-документ (около 1/3 этих проектов используют PDF в качестве основного формата ввода).
Несколько примеров из базы схем:
1) [RAG-система с информацией о программе резидентства в Канаде]
2) [Чат-бот NPC для D&D с базой знаний по лору]
3) [Система вопросов и ответов по видео с YouTube]
Класс 2: Автоматизация бизнес-процессов (~25% проектов)
Эти проекты автоматизируют бизнес-процессы: заметки по встречам, скоринг лидов в CRM, сопоставление резюме, автоматический анализ новостей. Они часто обрабатывают данные пакетами, а не отвечают на запросы в реальном времени.
Несколько примеров:
1) [Система приоритизации и скоринга лидов в B2B CRM]
2) [Конвертация научных статей в подкасты]
3) [Автоматический утренний анализ новостей и инвестиций]
Класс 3: Агенты-планировщики с использованием инструментов (~15% проектов)
Сюда входят мультиагентные фреймворки (большинство просто не работают), исследовательские агенты, агенты для кодинга и системы на основе ReAct для конкретных областей, таких как написание скриптов для Blender или управление Kubernetes.
Примеры:
1) [Мультиагентная генерация контента]
2) [Агент для сканирования на киберугрозы]
В общем, на данный момент большая часть ИИ-автоматизаций сводится к чат-ботам, а остальная — к сложным и геморройным проектам. Так что на рынке ИИ-автоматизаций еще есть что оптимизировать.
❤38✍16🔥9👍6❤🔥2🤔2⚡1🤗1🦄1😘1
Я уже много раз писал в этом канале о том, как делать автоматизации в n8n и как искать, что автоматизировать. Но, судя по вопросам в личку, многие начинающие ИИ-автоматизаторы своей главной целью считают — с головой уйти в передвигание нод в интерфейсе n8n и вообще не общаться с клиентом. А еще они по какой-то загадочной причине считают, что являются первопроходцами в этой деятельности и никто до них еще не делал чат-бота с базой данных. И поэтому, получив задание от заказчика, они сразу ныряют во все эти ноды, связи и API, пропуская две самые важные фазы любого проекта:
Фаза 1: Исследуйте проблему
Всегда начинайте с исследования проблемы, а не ее решения.
Мой процесс:
1. 2-3 дня наблюдаю за реальными людьми, которые выполняют эту работу
2. Описываю их текущий рабочий процесс простым языком (без технических терминов)
3. Определяю те 20% случаев, которые вызывают 80% ежедневного геморроя
4. Описываю идеальный конечный результат человеческим языком
Сначала кейс, потом воркфлоу
Прежде чем открыть n8n, я документирую:
1. Бизнес-проблема (простым языком): «Люба тратит 45 минут каждое утро, чтобы классифицировать письма в поддержке и пересылать срочные нужным членам команды».
2. Точные входные и выходные данные:
Вход: Письма с [email protected]
Выход: Текст из категоризированных писем в соответствующих ТГ-чатах, а срочные уведомлением на телефон
3. Метрики успеха:
Основная: Время, которое Люба тратит на утренние письма, сократилось до 10 минут
Второстепенная: Ни одна срочная проблема не остается незамеченной дольше 30 минут
4. 3-5 логических шагов (прежде чем трогать ноды)
⁃ Получаем новые письма
⁃ Извлекаем ключевую информацию (отправитель, тема, тело письма)
⁃ Классифицируем срочность и категорию
⁃ Направляем в соответствующие чаты
⁃ Логируем результаты для отслеживания
Почему эта последовательность важна: Воркфлоу должен подстраиваться под ваш кейс, а не наоборот.
Фаза 2: Не изобретайте велосипед
Ленивый подход, который работает: всегда сначала ищите существующие решения.
Где я ищу шаблоны для n8n (по порядку):
1. Шаблоны в сообществе n8n (ищу по точным ключевым словам)
2. Reddit r/n8n + r/automation (сортирую по лучшим постам за месяц)
3. Туториалы на YouTube по похожим воркфлоу
4. Хештег #n8n в X/Twitter для свежих примеров
Стратегия адаптации шаблонов:
⁃ Найдите воркфлоу, которые решают 60-70% вашей проблемы
⁃ Скопируйте структуру нод, адаптируйте логику
⁃ Начните с «чей-то» базы, а не с чистого листа
И только потом переходите к третьей фазе: «сборке скучного MVP».
Если интересно можно продолжить в таком же формате. Но мне нужен «знак» - 🔥а лучше 🔥🔥🔥
Фаза 1: Исследуйте проблему
Всегда начинайте с исследования проблемы, а не ее решения.
Мой процесс:
1. 2-3 дня наблюдаю за реальными людьми, которые выполняют эту работу
2. Описываю их текущий рабочий процесс простым языком (без технических терминов)
3. Определяю те 20% случаев, которые вызывают 80% ежедневного геморроя
4. Описываю идеальный конечный результат человеческим языком
Сначала кейс, потом воркфлоу
Прежде чем открыть n8n, я документирую:
1. Бизнес-проблема (простым языком): «Люба тратит 45 минут каждое утро, чтобы классифицировать письма в поддержке и пересылать срочные нужным членам команды».
2. Точные входные и выходные данные:
Вход: Письма с [email protected]
Выход: Текст из категоризированных писем в соответствующих ТГ-чатах, а срочные уведомлением на телефон
3. Метрики успеха:
Основная: Время, которое Люба тратит на утренние письма, сократилось до 10 минут
Второстепенная: Ни одна срочная проблема не остается незамеченной дольше 30 минут
4. 3-5 логических шагов (прежде чем трогать ноды)
⁃ Получаем новые письма
⁃ Извлекаем ключевую информацию (отправитель, тема, тело письма)
⁃ Классифицируем срочность и категорию
⁃ Направляем в соответствующие чаты
⁃ Логируем результаты для отслеживания
Почему эта последовательность важна: Воркфлоу должен подстраиваться под ваш кейс, а не наоборот.
Фаза 2: Не изобретайте велосипед
Ленивый подход, который работает: всегда сначала ищите существующие решения.
Где я ищу шаблоны для n8n (по порядку):
1. Шаблоны в сообществе n8n (ищу по точным ключевым словам)
2. Reddit r/n8n + r/automation (сортирую по лучшим постам за месяц)
3. Туториалы на YouTube по похожим воркфлоу
4. Хештег #n8n в X/Twitter для свежих примеров
Стратегия адаптации шаблонов:
⁃ Найдите воркфлоу, которые решают 60-70% вашей проблемы
⁃ Скопируйте структуру нод, адаптируйте логику
⁃ Начните с «чей-то» базы, а не с чистого листа
И только потом переходите к третьей фазе: «сборке скучного MVP».
Если интересно можно продолжить в таком же формате. Но мне нужен «знак» - 🔥а лучше 🔥🔥🔥
2🔥229❤16❤🔥8 6✍3👍3👎1👏1😍1🤗1🦄1
Давно не напоминал вам про наш чудесный чат @prompt_chat с самым крутым и доброжелательным комьюнити. Залетайте к нам если еще не.
❤11🔥3👏3💯1🤗1😘1
Если используете Deep Research так же часто, как я, — не проходите мимо. Сервис Parallel, который генерирует отчеты на базе десятков тысяч проанализированных страниц, запустил акцию и зачисляет на новые аккаунты от 20 до 80 долларов (на один мне пришло $80, на два других — по $20). Один отчет стоит около 2,5 доллара.
Регистрация очень простая:
1. Перейдите по ссылке и зарегистрируйтесь: https://platform.parallel.ai/play/deep-research
2. Получите деньги на счет
3. Пользуйтесь
Регистрация очень простая:
1. Перейдите по ссылке и зарегистрируйтесь: https://platform.parallel.ai/play/deep-research
2. Получите деньги на счет
3. Пользуйтесь
❤26🔥19👍8❤🔥1🙏1😘1
Audio
Я чуть супом не поперхнулся. А давно подкасты от NotebookLM так дерзко звучать стали?
Выбирал формат «дебаты», дополнительный промпт не прописывал, тексты на базе которых подкасты генерировались - научные англоязычные статьи.
Выбирал формат «дебаты», дополнительный промпт не прописывал, тексты на базе которых подкасты генерировались - научные англоязычные статьи.
🤣83😁14🔥8❤5🤯4👏3😈2❤🔥1👍1🤗1
Кстати, Google опять раздает бесплатные годовые Pro-аккаунты Gemini студентам. Акция действует до 06.10.2025. Как снова «стать студентом» читайте в комментариях к этому посту.
А если не хочется заморачиваться, то всегда можно купить годовую подписку Perplexity за несколько баксов.
А если не хочется заморачиваться, то всегда можно купить годовую подписку Perplexity за несколько баксов.
🤗15🔥10❤9✍1👎1🙏1💯1🤣1
Google выпустил гайд для стартапов о том, как создавать ИИ-агентов, — «Startup technical guide to AI agents» — и я залип.
Весь день его читаю, насколько же доступно они всё объясняют. Да, на английском, но сейчас это не проблема: закиньте PDF в NotebookLM или Perplexity, хотя я рекомендую посмотреть его глазами — там много схем.
Вот, допустим, как рассказывается про заземление (Grounding) ответов агента:
Заземление — это процесс, который обеспечивает точность и достоверность ответов агента, связывая их с проверяемыми фактами из внешних источников данных. Это критически важный механизм для борьбы с «галлюцинациями» (неверной или выдуманной информацией) и повышения доверия пользователей к системе. Техники заземления эволюционировали от простых к более сложным.
Retrieval-Augmented Generation (RAG): фундаментальный паттерн, который дополняет знания модели информацией из внешней базы данных. Перед генерацией ответа агент выполняет семантический поиск по базе знаний (например, по внутренней документации), чтобы найти релевантные факты, и передаёт их модели в качестве контекста. Это позволяет агенту давать более точные и актуальные ответы.
GraphRAG: этот подход обогащает заземление, используя граф знаний. Вместо того чтобы рассматривать факты как изолированные фрагменты текста, GraphRAG позволяет агенту понимать явные связи между данными (например, «симптом А вызывает болезнь Б, которая лечится препаратом В»). Это обеспечивает более глубокое контекстуальное понимание.
Agentic RAG: наиболее продвинутый подход, где агент становится активным участником процесса поиска информации. Вместо одного простого поиска агент может анализировать сложный запрос, разрабатывать многошаговую стратегию поиска, выполнять несколько вызовов к различным инструментам и синтезировать информацию из разных источников для нахождения наилучшего ответа.
Это я вам ещё кратко перевёл, в оригинале там значительно подробнее, со схемами и кейсами. Да, Google там через абзац свои продукты пиарит, но они у него реально хорошие. В общем, если вы создаёте своих ИИ-агентов или пытаетесь разобраться, что это вообще такое, — рекомендую ознакомиться с документом. Выложу его в первом комментарии к этому посту, чтобы вам не пришлось заполнять кучу форм на сайте Google.
Весь день его читаю, насколько же доступно они всё объясняют. Да, на английском, но сейчас это не проблема: закиньте PDF в NotebookLM или Perplexity, хотя я рекомендую посмотреть его глазами — там много схем.
Вот, допустим, как рассказывается про заземление (Grounding) ответов агента:
Заземление — это процесс, который обеспечивает точность и достоверность ответов агента, связывая их с проверяемыми фактами из внешних источников данных. Это критически важный механизм для борьбы с «галлюцинациями» (неверной или выдуманной информацией) и повышения доверия пользователей к системе. Техники заземления эволюционировали от простых к более сложным.
Retrieval-Augmented Generation (RAG): фундаментальный паттерн, который дополняет знания модели информацией из внешней базы данных. Перед генерацией ответа агент выполняет семантический поиск по базе знаний (например, по внутренней документации), чтобы найти релевантные факты, и передаёт их модели в качестве контекста. Это позволяет агенту давать более точные и актуальные ответы.
GraphRAG: этот подход обогащает заземление, используя граф знаний. Вместо того чтобы рассматривать факты как изолированные фрагменты текста, GraphRAG позволяет агенту понимать явные связи между данными (например, «симптом А вызывает болезнь Б, которая лечится препаратом В»). Это обеспечивает более глубокое контекстуальное понимание.
Agentic RAG: наиболее продвинутый подход, где агент становится активным участником процесса поиска информации. Вместо одного простого поиска агент может анализировать сложный запрос, разрабатывать многошаговую стратегию поиска, выполнять несколько вызовов к различным инструментам и синтезировать информацию из разных источников для нахождения наилучшего ответа.
Это я вам ещё кратко перевёл, в оригинале там значительно подробнее, со схемами и кейсами. Да, Google там через абзац свои продукты пиарит, но они у него реально хорошие. В общем, если вы создаёте своих ИИ-агентов или пытаетесь разобраться, что это вообще такое, — рекомендую ознакомиться с документом. Выложу его в первом комментарии к этому посту, чтобы вам не пришлось заполнять кучу форм на сайте Google.
2🔥65❤25✍16👍7❤🔥3👎1💯1🍌1😈1
Что-то у нас уже весь чат @prompt_chat кипит от вопросов, как получить годовой Pro-аккаунт Gemini от Google.
Если вы не студент и не хотите погружаться во все эти тонкости и проходить сложные квесты, просто купите активированный аккаунт у тех, кто смог зарегистрировать. Цена вопроса — 10 баксов. Я покупал у этого продавца несколько месяцев назад на ggsel — работает.
После оплаты вам сразу прилетает «портянка»: логин, пароль, 2FA и инструкция, по которой надо всё сделать. Не забудьте поменять пароль, ну и помните, что, в отличие от Perplexity, Google не даст вам пользоваться своими продуктами, если увидит, что регион неправильный.
Если вы не студент и не хотите погружаться во все эти тонкости и проходить сложные квесты, просто купите активированный аккаунт у тех, кто смог зарегистрировать. Цена вопроса — 10 баксов. Я покупал у этого продавца несколько месяцев назад на ggsel — работает.
После оплаты вам сразу прилетает «портянка»: логин, пароль, 2FA и инструкция, по которой надо всё сделать. Не забудьте поменять пароль, ну и помните, что, в отличие от Perplexity, Google не даст вам пользоваться своими продуктами, если увидит, что регион неправильный.
1🔥25👏6❤3🙏3💯3❤🔥1👍1🤓1😘1
Perplexity только что анонсировала свое поисковое API. Теперь можно обращаться к тому поиску, который они сами используют, с сотнями миллионов страниц в индексе.
1❤49👍19🔥18⚡4🦄3👏2❤🔥1🤔1
Силиконовый Мешок
Google выпустил гайд для стартапов о том, как создавать ИИ-агентов, — «Startup technical guide to AI agents» — и я залип. Весь день его читаю, насколько же доступно они всё объясняют. Да, на английском, но сейчас это не проблема: закиньте PDF в NotebookLM…
После того, как поделился гайдом от Google, мне написали в личку интересный вопрос: «А как изучать ИИ структурно?» Ну вот общаемся мы с ChatGPT или Perplexity, решаем какие-то свои домашние дела. Да, есть те, кто освоил конструкторы типа N8N или Make и решают свои рабочие дела. Но это все не дотягивает до уровня создания своего ИИ-стартапа, на что и рассчитан этот гайд. Как пройти путь от новичка до профи в ИИ?
Я не претендую, что это можно считать полноценным учебным планом, конечно нет. Ну как шпаргалку откуда и куда двигаться, вполне: https://teletype.in/@prompt_design/7_Core_Stages_of_Learning_AI
Я не претендую, что это можно считать полноценным учебным планом, конечно нет. Ну как шпаргалку откуда и куда двигаться, вполне: https://teletype.in/@prompt_design/7_Core_Stages_of_Learning_AI
Teletype
7 этапов изучения ИИ в 2025–26: полный гайд от новичка до профи
Искусственный интеллект (ИИ) - это уже не просто хайповое словечко. Он меняет целые индустрии, автоматизирует рабочие процессы и создаёт...
2👏31❤21✍11🔥8👍3🙏2💯2⚡1😍1🤗1🦄1
Сегодня осознал, насколько же сильно я привык к Perplexity: на нём завязано столько ежедневной рутины, что сложно представить, как раньше без него обходился.
Наверное, самый базовый функционал — это куча «Tasks», которые собирают для меня новости по разным источникам и отправляют к определённому времени (например, я отслеживаю с их помощью тематические сабреддиты). А ещё есть десяток настроенных «Spaces» под разные задачи: от заказа еды по меню до фактчека для YouTube-роликов.
Про использование Perplexity на телефоне я, наверное, напишу отдельный пост, но физическая кнопка быстрого вызова всегда закреплена за этим приложением. Про основной функционал поиска писать не буду, хотя всё больше и больше ищу информацию через Perplexity.
Поэтому, когда мне задают вопрос, чем отличается Perplexity от ChatGPT (или любой другой LLM), я отвечаю, что это совершенно разные истории. Perplexity — это незаметный труженик, который прикрывает мои тылы и всегда под рукой, а ChatGPT — это для души.
А годовой Pro-аккаунт Perplexity за $8 снимает все остальные аргументы.
Наверное, самый базовый функционал — это куча «Tasks», которые собирают для меня новости по разным источникам и отправляют к определённому времени (например, я отслеживаю с их помощью тематические сабреддиты). А ещё есть десяток настроенных «Spaces» под разные задачи: от заказа еды по меню до фактчека для YouTube-роликов.
Про использование Perplexity на телефоне я, наверное, напишу отдельный пост, но физическая кнопка быстрого вызова всегда закреплена за этим приложением. Про основной функционал поиска писать не буду, хотя всё больше и больше ищу информацию через Perplexity.
Поэтому, когда мне задают вопрос, чем отличается Perplexity от ChatGPT (или любой другой LLM), я отвечаю, что это совершенно разные истории. Perplexity — это незаметный труженик, который прикрывает мои тылы и всегда под рукой, а ChatGPT — это для души.
А годовой Pro-аккаунт Perplexity за $8 снимает все остальные аргументы.
https://ggsel.net
Купить активация Perplexity AI PRO | НА ГОД по цене 752.46 ₽ на ggsel
Покупайте активация Perplexity AI PRO | НА ГОД у проверенного продавца Zhirinovsky с гарантией сделки и отзывами. Моментальная доставка. Скидка до конца недели! Продано: 1. Положительных отзывов: 0.
❤43👏18👍9👎4🤔3🙏2🔥1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
В одном проекте по автоматизации была задача: забирать PDF‑сканы из сетевого хранилища NAS, распознавать их и переводить в JSON для дальнейшей обработки. Но есть нюанс: нельзя отправлять их на внешние серверы LLM’ок, всё нужно делать локально.
Уже начал вайбкодить своё решение, но тут наткнулся на DocStrange. Это бесплатное open‑source‑решение, которое превращает PDF, отсканированные документы в структурированные данные (Markdown, CSV, HTML, JSON и т. п.) с поддержкой таблиц, полей, OCR и прочего. Можно запускать локально или в облаке (в облаке дают до 10 000 документов в месяц бесплатно).
Так что, если вы ищете решение для извлечения данных из бухгалтерских и других документов, присмотритесь.
Github: https://github.com/NanoNets/docstrange
Уже начал вайбкодить своё решение, но тут наткнулся на DocStrange. Это бесплатное open‑source‑решение, которое превращает PDF, отсканированные документы в структурированные данные (Markdown, CSV, HTML, JSON и т. п.) с поддержкой таблиц, полей, OCR и прочего. Можно запускать локально или в облаке (в облаке дают до 10 000 документов в месяц бесплатно).
Так что, если вы ищете решение для извлечения данных из бухгалтерских и других документов, присмотритесь.
Github: https://github.com/NanoNets/docstrange
❤64🔥31👍13🙏10⚡3❤🔥2🦄2
Силиконовый Мешок
В комментариях к прошлому посту интересовались, зачем мы берём с собой в кемпинг принтер. Отвечаю: это не принтер, а портативная зарядная станция EcoFlow River 3 Plus. Обычно нам её хватает на пару дней, чтобы заряжать все наши гаджеты: телефоны, рации, фонари…
Возможно я становлюсь фанатом техники от EcoFlow, но взял еще и их повербанк. И это пушка-бомба: заряжается до 100% менее чем за час, а телефону отдает по кабелю почти 30 Вт, что тоже заряжает его почти за час. Два порта работают в обе стороны (и заряжает и заряжается), ну и удобное приложение. Называется EcoFlow RAPID.
1🔥26❤5⚡4👍2✍1👏1😍1💯1