Силиконовый Мешок
19.6K subscribers
724 photos
241 videos
20 files
697 links
Как заработать 💸 на Искусственном Интеллекте уже сегодня.


Написать админу @artem_subbotin

Чат канала: @prompt_chat
Download Telegram
Главный вопрос вопрос от тех, кто только начинает погружаться в мир ИИ, звучит так: кому платить двадцатку? Ну или какую ИИ-модель выбрать под свои задачи. Я всегда рекомендую начать с Perplexity - она не дорогая и там можно протестировать все модели сразу, чтобы определиться. Ну а если кратко:

ChatGPT (Для личного использования и малого бизнеса)
Сильные стороны: Режим агента может сам искать информацию в интернете, автоматизировать рутину и выполнять задачи. Пользовательские GPTs позволяют создавать мини-приложения и свои сценарии работы. Проекты в ChatGPT удобны для совместной работы. Он подключается к Microsoft и Google Дискам. Голосовой диалог ощущается, будто говоришь с реальным человеком. Очень удобный инструмент канвас для текста и кода. У него 1 миллион корпоративных клиентов и 80% рынка с 700 миллионами пользователей.
Слабые стороны:
- В ресечах уступает Gemini и Claude
- Генерация видео (Sora) пока без звука (Veo от Gemini здесь выигрывает)
- Генерация изображений неплохая, но уступает Gemini Nano Banana
- Плохо создает инфографику и простые слайды

Copilot (Для работы в экосистеме Microsoft)
Сильные стороны: Дает самую глубокую интеграцию с Word, Excel, Outlook и Teams. Доступ к файлам через «/» позволяет работать напрямую с документами и таблицами. Безопасность обеспечивается через Microsoft Graph, и для работы не нужно подключать сторонних поставщиков или покупать дополнительные лицензии.
Слабые стороны:
- Замкнут на экосистеме Microsoft
- Мало творческих функций
- Дорогой, если вы не пользуетесь подпиской Microsoft 365

Gemini (Экосистема Google + творчество)
Сильные стороны: Модель 2.5 Pro имеет самое большое «окно контекста» среди всех. Nano Banana считается лучшим для генерации и редактирования изображений. Veo 3 создает короткие видео вирусного качества со звуком. NotebookLM круто пересказывает огромные документы в аудио и видео. Он хорош в глубоких исследованиях, создании инфографики. Очень недорогой API и бесшовная интеграция с Gmail и Google Диском.
Слабые стороны:
- Инструменты AI Studio все еще в бета-версии
- Veo 3 ограничен 8 секундами и стоит дорого

Claude (Исследования, тексты, код, совместная работа)
Сильные стороны: Он лучше других создает презентации, таблицы Excel и финансовые модели. Модели Sonnet и Opus 4 считаются топовыми для программирования. Проекты в Claude удобны для командной работы. Он отлично создает инфографику, кратко собирает информацию из сотен источников для Deep Research. Подключается к Google Диску, Microsoft Drive и Canva.
Слабые стороны:
- Не генерирует изображения
- Не генерирует видео
- Нет режима агента

Perplexity (Веб-исследования и браузинг)
Сильные стороны: Это ИИ-браузер, который ищет информацию в реальном времени и всегда предоставляет ссылки на источники. Удобно искать и анализировать информацию, умеет находить актуальные новости, события и цены. Pro-версия подключается к академическим, финансовым базам данных и социальным сетям (Reddit). Отлично подходит для маркетинговых исследований и проверки фактов и для студентов. Работает со всеми LLM’ками, просто переключаете в настройках, какую будете использовать и все. Недорогой, если знать где покупать годовые лицензии.
Слабые стороны:
- Слаб в творческих задачах
- Меньшее «окно контекста» по сравнению с Gemini/Claude

Grok (Анализ трендов в соцсетях в реальном времени)
Сильные стороны: Это единственный ИИ с доступом к данным X/Twitter в реальном времени. Он дает ответы без цензуры, проводит анализ настроений и быстро отслеживает текущие события. Обладает уникальным характером и юмором. Недавно научился генерировать изображения и имеет интересную функцию «Companions» (собеседники).
Слабые стороны:
- Ограничен использованием для соцсетей и новостей
- Нет инструментов для создания документов.
- Слаб для профессиональных и бизнес-задач
- Все еще нет интерфейса командной строки для программирования
1🔥5123👍1711👏1💯1🤗1🦄1
Силиконовый Мешок
Главный вопрос вопрос от тех, кто только начинает погружаться в мир ИИ, звучит так: кому платить двадцатку? Ну или какую ИИ-модель выбрать под свои задачи. Я всегда рекомендую начать с Perplexity - она не дорогая и там можно протестировать все модели сразу…
Какой ИИ-агент заменит тебя в офисе?

Продолжаем вчерашнюю тему с анализом ИИ-инструментов. Сегодня давайте разберем какие сервисы помогают в решение рабочих задач.

Есть такой венчурный фонд a16z (Andreessen Horowitz) — это прям крупные ребята, инвестирующие в половину Кремниевой долины. Ну и, как вы понимаете, в последнее время их основной фокус на ИИ-компаниях, а когда ты за чем-то следишь — ты обязательно это исследуешь (чтобы понимать, куда деньги заносить).

Так вот, эти ребята решили разобраться в рынке ИИ-помощников и выкатили крутое исследование (с картинками!) о том, кто из ИИ круче в офисной работе: от составления писем и таблиц до ресёрча и полноценной аналитики.

Они разделили все инструменты на два лагеря:
«Универсалы» (горизонтальные) — те, что пытаются делать всё сразу.
«Специалисты» (вертикальные) — заточенные под одну задачу: почту, таблицы или презентации.

А затем устроили им настоящий краш-тест на офисных задачах. Ну, а я вам это исследование перевел, отредактировал и в лонгрид уложил. Обязательно поделитесь им со своим другом, который постоянно ничего не успевает на работе.

https://teletype.in/@prompt_design/the-ai-native-office-suite-can-ai-do-work-for-you
52915🔥8👍7❤‍🔥4🤔2👏1🙏1😍1🦄1
Media is too big
VIEW IN TELEGRAM
Видели какую обнову китайцы сделали? Wan2.2-Animate - две основные функции: замена персонажа и анимация по эталонному видео. Можно уже потестить на Hugging Face
🔥39👍93👏1🙏1💯1😘1
ИИ-автоматизации и ИИ-агенты

Кажется, что уже все вокруг запустили свои ИИ-студии (или агентства), в которых занимаются автоматизацией клиентских процессов и внедряют им много искусственного интеллекта. Но когда немного поресечишь или пообщаешься с «автоматизаторами» — понимаешь, что все делают в основном RAG-ботов. Это когда к LLM-ке прикручивают векторную базу с вашими данными и выводят интерфейс в Telegram-бот.

Еще одним подтверждением моих выводов можно считать этот прекрасный сборник ТЫСЯЧИ схем ИИ-агентов и ИИ-автоматизаций. Его автор задался вопросом, «че там все автоматизируют», и при помощи этого API спарсил тысячи постов на Reddit, описывающих свои ИИ-автоматизации. И действительно, эту тысячу схем можно поделить на три основных класса:

Класс 1: Чат с данными (около 50% проектов)
Это доминирующий паттерн: чат-интерфейс для взаимодействия с данными из конкретной области через RAG. Источники данных дико разнятся:
Внешние: результаты веб-поиска, «Википедия», новостные ленты.
Внутренние: базы данных компаний, учебные материалы университетов, лор D&D.
Эфемерные: содержимое конкретного видео на YouTube, запись встречи или PDF-документ (около 1/3 этих проектов используют PDF в качестве основного формата ввода).
Несколько примеров из базы схем:
1) [RAG-система с информацией о программе резидентства в Канаде]
2) [Чат-бот NPC для D&D с базой знаний по лору]
3) [Система вопросов и ответов по видео с YouTube]

Класс 2: Автоматизация бизнес-процессов (~25% проектов)
Эти проекты автоматизируют бизнес-процессы: заметки по встречам, скоринг лидов в CRM, сопоставление резюме, автоматический анализ новостей. Они часто обрабатывают данные пакетами, а не отвечают на запросы в реальном времени.
Несколько примеров:
1) [Система приоритизации и скоринга лидов в B2B CRM]
2) [Конвертация научных статей в подкасты]
3) [Автоматический утренний анализ новостей и инвестиций]

Класс 3: Агенты-планировщики с использованием инструментов (~15% проектов)
Сюда входят мультиагентные фреймворки (большинство просто не работают), исследовательские агенты, агенты для кодинга и системы на основе ReAct для конкретных областей, таких как написание скриптов для Blender или управление Kubernetes.
Примеры:
1) [Мультиагентная генерация контента]
2) [Агент для сканирования на киберугрозы]

В общем, на данный момент большая часть ИИ-автоматизаций сводится к чат-ботам, а остальная — к сложным и геморройным проектам. Так что на рынке ИИ-автоматизаций еще есть что оптимизировать.
3816🔥9👍6❤‍🔥2🤔21🤗1🦄1😘1
Я уже много раз писал в этом канале о том, как делать автоматизации в n8n и как искать, что автоматизировать. Но, судя по вопросам в личку, многие начинающие ИИ-автоматизаторы своей главной целью считают — с головой уйти в передвигание нод в интерфейсе n8n и вообще не общаться с клиентом. А еще они по какой-то загадочной причине считают, что являются первопроходцами в этой деятельности и никто до них еще не делал чат-бота с базой данных. И поэтому, получив задание от заказчика, они сразу ныряют во все эти ноды, связи и API, пропуская две самые важные фазы любого проекта:

Фаза 1: Исследуйте проблему
Всегда начинайте с исследования проблемы, а не ее решения.
Мой процесс:
1. 2-3 дня наблюдаю за реальными людьми, которые выполняют эту работу
2. Описываю их текущий рабочий процесс простым языком (без технических терминов)
3. Определяю те 20% случаев, которые вызывают 80% ежедневного геморроя
4. Описываю идеальный конечный результат человеческим языком

Сначала кейс, потом воркфлоу
Прежде чем открыть n8n, я документирую:
1. Бизнес-проблема (простым языком): «Люба тратит 45 минут каждое утро, чтобы классифицировать письма в поддержке и пересылать срочные нужным членам команды».
2. Точные входные и выходные данные:
Вход: Письма с [email protected]
Выход: Текст из категоризированных писем в соответствующих ТГ-чатах, а срочные уведомлением на телефон
3. Метрики успеха:
Основная: Время, которое Люба тратит на утренние письма, сократилось до 10 минут
Второстепенная: Ни одна срочная проблема не остается незамеченной дольше 30 минут
4. 3-5 логических шагов (прежде чем трогать ноды)
⁃ Получаем новые письма
⁃ Извлекаем ключевую информацию (отправитель, тема, тело письма)
⁃ Классифицируем срочность и категорию
⁃ Направляем в соответствующие чаты
⁃ Логируем результаты для отслеживания
Почему эта последовательность важна: Воркфлоу должен подстраиваться под ваш кейс, а не наоборот.

Фаза 2: Не изобретайте велосипед
Ленивый подход, который работает: всегда сначала ищите существующие решения.
Где я ищу шаблоны для n8n (по порядку):
1. Шаблоны в сообществе n8n (ищу по точным ключевым словам)
2. Reddit r/n8n + r/automation (сортирую по лучшим постам за месяц)
3. Туториалы на YouTube по похожим воркфлоу
4. Хештег #n8n в X/Twitter для свежих примеров

Стратегия адаптации шаблонов:
⁃ Найдите воркфлоу, которые решают 60-70% вашей проблемы
⁃ Скопируйте структуру нод, адаптируйте логику
⁃ Начните с «чей-то» базы, а не с чистого листа
И только потом переходите к третьей фазе: «сборке скучного MVP».

Если интересно можно продолжить в таком же формате. Но мне нужен «знак» - 🔥а лучше 🔥🔥🔥
2🔥22916❤‍🔥863👍3👎1👏1😍1🤗1🦄1
Давно не напоминал вам про наш чудесный чат @prompt_chat с самым крутым и доброжелательным комьюнити. Залетайте к нам если еще не.
11🔥3👏3💯1🤗1😘1
Если используете Deep Research так же часто, как я, — не проходите мимо. Сервис Parallel, который генерирует отчеты на базе десятков тысяч проанализированных страниц, запустил акцию и зачисляет на новые аккаунты от 20 до 80 долларов (на один мне пришло $80, на два других — по $20). Один отчет стоит около 2,5 доллара.

Регистрация очень простая:
1. Перейдите по ссылке и зарегистрируйтесь: https://platform.parallel.ai/play/deep-research
2. Получите деньги на счет
3. Пользуйтесь
26🔥19👍8❤‍🔥1🙏1😘1
Audio
Я чуть супом не поперхнулся. А давно подкасты от NotebookLM так дерзко звучать стали?

Выбирал формат «дебаты», дополнительный промпт не прописывал, тексты на базе которых подкасты генерировались - научные англоязычные статьи.
🤣83😁14🔥85🤯4👏3😈2❤‍🔥1👍1🤗1
Кстати, Google опять раздает бесплатные годовые Pro-аккаунты Gemini студентам. Акция действует до 06.10.2025. Как снова «стать студентом» читайте в комментариях к этому посту.

А если не хочется заморачиваться, то всегда можно купить годовую подписку Perplexity за несколько баксов.
🤗15🔥1091👎1🙏1💯1🤣1
Google выпустил гайд для стартапов о том, как создавать ИИ-агентов, — «Startup technical guide to AI agents» — и я залип.

Весь день его читаю, насколько же доступно они всё объясняют. Да, на английском, но сейчас это не проблема: закиньте PDF в NotebookLM или Perplexity, хотя я рекомендую посмотреть его глазами — там много схем.

Вот, допустим, как рассказывается про заземление (Grounding) ответов агента:

Заземление — это процесс, который обеспечивает точность и достоверность ответов агента, связывая их с проверяемыми фактами из внешних источников данных. Это критически важный механизм для борьбы с «галлюцинациями» (неверной или выдуманной информацией) и повышения доверия пользователей к системе. Техники заземления эволюционировали от простых к более сложным.

Retrieval-Augmented Generation (RAG): фундаментальный паттерн, который дополняет знания модели информацией из внешней базы данных. Перед генерацией ответа агент выполняет семантический поиск по базе знаний (например, по внутренней документации), чтобы найти релевантные факты, и передаёт их модели в качестве контекста. Это позволяет агенту давать более точные и актуальные ответы.

GraphRAG: этот подход обогащает заземление, используя граф знаний. Вместо того чтобы рассматривать факты как изолированные фрагменты текста, GraphRAG позволяет агенту понимать явные связи между данными (например, «симптом А вызывает болезнь Б, которая лечится препаратом В»). Это обеспечивает более глубокое контекстуальное понимание.

Agentic RAG: наиболее продвинутый подход, где агент становится активным участником процесса поиска информации. Вместо одного простого поиска агент может анализировать сложный запрос, разрабатывать многошаговую стратегию поиска, выполнять несколько вызовов к различным инструментам и синтезировать информацию из разных источников для нахождения наилучшего ответа.

Это я вам ещё кратко перевёл, в оригинале там значительно подробнее, со схемами и кейсами. Да, Google там через абзац свои продукты пиарит, но они у него реально хорошие. В общем, если вы создаёте своих ИИ-агентов или пытаетесь разобраться, что это вообще такое, — рекомендую ознакомиться с документом. Выложу его в первом комментарии к этому посту, чтобы вам не пришлось заполнять кучу форм на сайте Google.
2🔥652516👍7❤‍🔥3👎1💯1🍌1😈1
Что-то у нас уже весь чат @prompt_chat кипит от вопросов, как получить годовой Pro-аккаунт Gemini от Google.
Если вы не студент и не хотите погружаться во все эти тонкости и проходить сложные квесты, просто купите активированный аккаунт у тех, кто смог зарегистрировать. Цена вопроса — 10 баксов. Я покупал у этого продавца несколько месяцев назад на ggsel — работает.
После оплаты вам сразу прилетает «портянка»: логин, пароль, 2FA и инструкция, по которой надо всё сделать. Не забудьте поменять пароль, ну и помните, что, в отличие от Perplexity, Google не даст вам пользоваться своими продуктами, если увидит, что регион неправильный.
1🔥25👏63🙏3💯3❤‍🔥1👍1🤓1😘1
Perplexity только что анонсировала свое поисковое API. Теперь можно обращаться к тому поиску, который они сами используют, с сотнями миллионов страниц в индексе.
149👍19🔥184🦄3👏2❤‍🔥1🤔1
Силиконовый Мешок
Google выпустил гайд для стартапов о том, как создавать ИИ-агентов, — «Startup technical guide to AI agents» — и я залип. Весь день его читаю, насколько же доступно они всё объясняют. Да, на английском, но сейчас это не проблема: закиньте PDF в NotebookLM…
После того, как поделился гайдом от Google, мне написали в личку интересный вопрос: «А как изучать ИИ структурно?» Ну вот общаемся мы с ChatGPT или Perplexity, решаем какие-то свои домашние дела. Да, есть те, кто освоил конструкторы типа N8N или Make и решают свои рабочие дела. Но это все не дотягивает до уровня создания своего ИИ-стартапа, на что и рассчитан этот гайд. Как пройти путь от новичка до профи в ИИ?

Я не претендую, что это можно считать полноценным учебным планом, конечно нет. Ну как шпаргалку откуда и куда двигаться, вполне: https://teletype.in/@prompt_design/7_Core_Stages_of_Learning_AI
2👏312111🔥8👍3🙏2💯21😍1🤗1🦄1
Сегодня осознал, насколько же сильно я привык к Perplexity: на нём завязано столько ежедневной рутины, что сложно представить, как раньше без него обходился.

Наверное, самый базовый функционал — это куча «Tasks», которые собирают для меня новости по разным источникам и отправляют к определённому времени (например, я отслеживаю с их помощью тематические сабреддиты). А ещё есть десяток настроенных «Spaces» под разные задачи: от заказа еды по меню до фактчека для YouTube-роликов.

Про использование Perplexity на телефоне я, наверное, напишу отдельный пост, но физическая кнопка быстрого вызова всегда закреплена за этим приложением. Про основной функционал поиска писать не буду, хотя всё больше и больше ищу информацию через Perplexity.

Поэтому, когда мне задают вопрос, чем отличается Perplexity от ChatGPT (или любой другой LLM), я отвечаю, что это совершенно разные истории. Perplexity — это незаметный труженик, который прикрывает мои тылы и всегда под рукой, а ChatGPT — это для души.

А годовой Pro-аккаунт Perplexity за $8 снимает все остальные аргументы.
43👏18👍9👎4🤔3🙏2🔥1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
В одном проекте по автоматизации была задача: забирать PDF‑сканы из сетевого хранилища NAS, распознавать их и переводить в JSON для дальнейшей обработки. Но есть нюанс: нельзя отправлять их на внешние серверы LLM’ок, всё нужно делать локально.

Уже начал вайбкодить своё решение, но тут наткнулся на DocStrange. Это бесплатное open‑source‑решение, которое превращает PDF, отсканированные документы в структурированные данные (Markdown, CSV, HTML, JSON и т. п.) с поддержкой таблиц, полей, OCR и прочего. Можно запускать локально или в облаке (в облаке дают до 10 000 документов в месяц бесплатно).

Так что, если вы ищете решение для извлечения данных из бухгалтерских и других документов, присмотритесь.
Github: https://github.com/NanoNets/docstrange
64🔥31👍13🙏103❤‍🔥2🦄2
Силиконовый Мешок
В комментариях к прошлому посту интересовались, зачем мы берём с собой в кемпинг принтер. Отвечаю: это не принтер, а портативная зарядная станция EcoFlow River 3 Plus. Обычно нам её хватает на пару дней, чтобы заряжать все наши гаджеты: телефоны, рации, фонари…
Возможно я становлюсь фанатом техники от EcoFlow, но взял еще и их повербанк. И это пушка-бомба: заряжается до 100% менее чем за час, а телефону отдает по кабелю почти 30 Вт, что тоже заряжает его почти за час. Два порта работают в обе стороны (и заряжает и заряжается), ну и удобное приложение. Называется EcoFlow RAPID.
1🔥2654👍21👏1😍1💯1