Вайб-кодинг
27.8K subscribers
1.58K photos
557 videos
30 files
792 links
Авторский канал по ВАЙБ КОДИНГУ

Ссылка для друзей: https://t.iss.one/+ll3pbl442dNkZmYy

Связь: @devmangx
По контенту: @codingpepe

РКН: https://clck.ru/3RRVfk
Download Telegram
Запустить несколько headless-инстансов под скрейпинг/тесты/автоматизацию легко.

А вот поднимать их, следить за жизненным циклом, нормально гасить и чистить ресурсы не очень. Всё расползается в набор разрозненных скриптов.

А что если был бы простой отдельный инструмент ровно под эту задачу? 💓

Знакомься, Pinchtab это легковесный Go-бинарник (12 МБ), который запускает Chrome и поднимает простой HTTP API. Любой агент или скрипт может через него ходить по страницам, быстро читать текст, интерактивно кликать/вводить и сохранять сессии. Ноль конфигурации, без привязки к фреймворкам, экономит токены.

Pinchtab это пакет для Node.js.

Установка:

npm install pinchtab


Дальше пример, поднимаем “флот” браузеров.

const { Pinchtab } = require('pinchtab');

const orchestrator = new Pinchtab();
// Запускаем 3 headless-инстанса Chrome
const fleet = await orchestrator.launch(3);

// fleet содержит данные для подключения (например WS endpoints) для каждого инстанса
console.log(fleet);

// Потом аккуратно гасим весь флот
await orchestrator.destroy();


За деталями, расширенной конфигурацией и CLI проще всего идти в репозиторий GitHub, там все расписано.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
AI-агент, который управляет телефоном через обычный текст 💖

Один разработчик выложил в опенсорс проект PhoneDriver. Он работает на визуальной модели Qwen3-VL, умеет понимать, что на экране телефона, и имитировать действия человека.

Достаточно просто описать задачу, например: "Открой настройки и включи Wi-Fi". Модель сама анализирует элементы интерфейса и через команды ADB выполняет клики, свайпы или ввод текста.

Есть визуальный веб-интерфейс: можно в реальном времени смотреть скриншоты с телефона и логи выполнения.

Также поддерживается автоопределение разрешения экрана, плюс можно настраивать параметры модели, задержку действий, число ретраев и т.д.

Для деплоя в основном нужны Python и окружение ADB. Ещё нужна видеокарта с достаточным объёмом VRAM, чтобы тянуть 4B или 8B визуальную модель, а на телефоне должен быть включён USB Debugging.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
🪖🪖🪖
Please open Telegram to view this post
VIEW IN TELEGRAM
6
This media is not supported in your browser
VIEW IN TELEGRAM
Voice mode наконец-то выкатывают в Claude Code. Сегодня он уже доступен примерно для 5% пользователей, и дальше будут постепенно расширять rollout в ближайшие недели.

Когда у тебя появится доступ, на welcome-экране будет заметка. Включается и выключается командой /voice.

Как пользоваться voice mode: зажимаешь пробел, говоришь, отпускаешь. По сути, push-to-talk.

Транскрипт стримится прямо в позицию курсора. Можно набрать половину промпта руками, надиктовать грязную середину голосом, потом дописать. То, что уже набрано, он не заменяет.

За voice mode доплачивать не нужно, и токены за транскрибацию голоса не учитываются в твоих rate limits.

Доступно на планах Pro, Max, Team и Enterprise, раскатывают волнами.
AI В МАРКЕТИНГЕ: КРЕАТИВЫ, ВОРОНКИ, АНАЛИТИКА И АГЕНТЫ

За последний год маркетинг изменился кардинально: AI-агенты автоматизируют аналитику и ротацию креативов, вайбкодинг позволяет делать сайты и ботов за час, генеративные тулы создают видео пачками без команды дизайнеров.

Что нас ждет в 2026?

5 топовых экспертов создали практическую конференцию "AI в маркетинге: креативы, воронки, аналитика и агенты", на которой покажут как это работает на практике. Каждый спикер даст конкретные инструменты, которые можно внедрить сразу.

Конференция для вас маст-хэв, если вы:

🔹 Тратите 4+ часов в день на дашборды и ручные отчёты
🔹 Сливаете бюджет на выгоревшие креативы
🔹 Ждёте разработчиков для создания сайтов и ботов
🔹 Нужна команда дизайнеров и монтажеров для производства контента

🗓 Собираемся 5 марта с 18:00 по МСК в онлайне. Вы заберёте рабочие кейсы и инструменты:
– Скиллы для вайбкодинга: как делать сайты, тг-ботов и скрипты без разработчиков
– Миро-доску с воркфлоу создания AI-контента: как создавать мультики в Higgsfield и автоматизировать процесс
– Шаблон для автоматизации ротации креативов: агент следит за выгоранием и ротирует автоматически
– Фреймворки AI-native аналитики: как получать инсайты за секунды, а не за недели
– Шаблон работы с AI-агентами через Cursor

👉 Регистрируйтесь в боте:
https://t.iss.one/marketing_conference_bot

Для участия нужна только подписка на каналы спикеров.
This media is not supported in your browser
VIEW IN TELEGRAM
Когда Text-to-SQL не работает, мы обычно валим всё на LLM или на кривой промптинг.

Но настоящая проблема чаще всего в схеме.

Объясняю:

Ты спрашиваешь: “Какие издатели получали роялти-платежи больше $5,000?”

Векторный поиск подтягивает "publisher" и "royalty_ledger".

Но он пропускает "vendor_agreement" — таблицу-мост, которая их связывает.

В итоге LLM пишет валидный SQL, который возвращает пусто.

Вот почему векторы сыпятся на реальных enterprise-схемах.

Они матчят названия.

Они не умеют находить пути для join-ов.

А пути уже описаны во внешних ключах.

Именно эту дыру закрывает QueryWeaver.

Это open-source инструмент от FalkorDB.

QueryWeaver превращает твою схему в граф.

- Таблицы это узлы.
- Внешние ключи это рёбра.

Потом он проходит по пути и автоматически добавляет промежуточные таблицы-мосты.

Спокойно тянет multi-hop цепочки.

Его гоняли на BIRD Benchmark на базе “superhero ” БД, расширенной до 60 таблиц: он разрулил запрос на 5 hop-ов, простроив цепочку через:

superpower → capability_matrix → stakeholder_registry → resource_requisition → budget_allocation

Можно запустить локально:

id="6b6prn"
docker run -p 5000:5000 -it falkordb/queryweaver


исходники тут
Анатомия промпта для Claude 4.6

1. Задача (Task)

Определи, чего ты хочешь, и как выглядит успех:
"Я хочу [TASK], чтобы [SUCCESS CRITERIA]."
Без ролей типа "веди себя как сеньор-эксперт".

2. Контекстные файлы (Context Files)

Загрузи контекстные файлы со своей экспертизой и правилами:
"Сначала прочитай эти файлы полностью перед тем, как отвечать: [filename .md] - [что внутри]."
ИИ вырос. Не нужно объяснять все в промпте. Вынеси это в файлы.

3. Референс (Reference)

Покажи ИИ ровно то, что ты хочешь. Загрузи пример.
Потом задай паттерны, тон и структуру как правила. Без "сделай что-то похожее" и надежды, что ИИ сам догадается.

4. Краткое ТЗ (Brief)

Это единственная часть, которую вы набираете с нуля. Все остальное это файлы.
"Тип вывода + длина. Чего НЕ должно быть по звучанию. Что значит успех."

5. Правила (Rules)

Контекстный файл хранит твои стандарты, вкус и аудиторию.
Промпт: "Прочитай его полностью перед стартом. Если ты собираешься нарушить одно из моих правил, остановись и скажи мне."

6. Диалог (Conversation)

Мы 3 года промптили ИИ. Теперь он промптит нас.
Промпт: "НЕ начинай выполнять задачу. Задай мне уточняющие вопросы (используй инструмент 'AskUserQuestion'), чтобы мы вместе пошагово уточнили подход."

7. План (Plan)

Claude прочитал твои файлы до того, как написал хоть слово.
Промпт: "Перед тем как что-то писать, перечисли 3 правила из моего контекстного файла, которые важнее всего для этой задачи. Потом дай план выполнения."

8. Выравнивание целей (Alignment)

Ничего не происходит, пока вы оба не видите одну и ту же цель. Это заменяет старую эпоху промптинга.
Промпт: "Начинай работу только после того, как мы согласуемся."
14
Кто-то собрал полноценный клон Perplexity, который работает на 100% локально и стоит $0.

Называется Perplexica. 🤙

→ real-time поиск по вебу
→ Даёт ссылки на все источники, которые использует
→ Работает с локальными моделями через Ollama
→ Несколько режимов поиска (обычный, академический, YouTube, Reddit, writing)
→ Ноль затрат на API. Ноль сбора данных.

29K звёзд. Лицензия MIT.

100% opensourse
Please open Telegram to view this post
VIEW IN TELEGRAM
8
OpenClaw cовет:

Твои агенты могут тебе врать.

Они скажут "уже делаю!" и даже не начнут. Скажут "готово!" а там ничего не готово. Скажут "собираю прямо сейчас" и при этом вообще ничего не запущено 🤡

Вот что я добавил в инструкции каждому агенту:

Never say 'done' or 'working on it' unless the action has actually started. Every status update must include proof — a process ID, file path, URL, or command output. No proof = didn't happen. A false completion is worse than a delayed honest answer.


Теперь если мне говорят, что что-то билдится, это выглядит вот так:
Please open Telegram to view this post
VIEW IN TELEGRAM
2
This media is not supported in your browser
VIEW IN TELEGRAM
🚬 Software инженеры это вам: я нашел open-source агент для мониторинга ошибок, который сканирует продовые логи, находит первопричину и шлет сообщение в Slack со всем контекстом еще до того, как ты вообще заметишь, что что-то сломалось.

Сокращает простой в проде на 95%

Как это работает:

1. Забирает сырые ошибки из Sentry или Azure Log Analytics
2. Семантически группирует их по первопричине (20 ошибок превращаются примерно в 4 реальные проблемы)
3. Ищет в GitHub конкретные файлы кода, которые задействованы
4. Проверяет Linear на существующие тикеты, чтобы не плодить дубликаты
5. Пробегается по Slack в поиске прошлых обсуждений похожих инцидентов
6. Определяет критичность (S1-S4) и решает, алертить или подавлять
7. Отправляет в Slack обогащенные алерты со ссылками на код, статусом тикета и уровнем критичности

Агент можно гонять в проде как cron job каждые 5 минут.

Он построен поверх Airweave AI, это open-source слой для контекстного retrieval, который делает все инструменты семантически поисковыми для агентов.

Ключевая мысль: обычные тулзы мониторинга ошибок дают алерты, но не дают контекст. Airweave закрывает эту дыру, делая все инструменты и кодовые базы семантически доступными для поиска агентами.

Он подключается к 50+ источникам (GitHub, Linear, Slack, базы данных и т.д.) и дает агентам возможность искать по всем сразу одним запросом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Профессор Дональд Кнут начал свою новую статью словами: "Шок! Шок!" 😨😨

Claude Opus 4.6 только что решил открытую задачу, над которой Кнут работал неделями, гипотезу о разложении графа из его книги The Art of Computer Programming.

Он назвал статью "Claude Cycles".

31 попытка. Примерно 1 час. Кнут прочитал вывод модели, оформил формальное доказательство и закончил так: "Похоже, однажды мне все-таки придется пересмотреть свое мнение о генеративном ИИ."

Человек, который написал библию computer science, только что это сказал. В статье, названной в честь ИИ.

Статья, кому интересно: https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Gemini 3.1 Flash-Lite уже вышел. 😨😨

Это самая экономичная по цене модель в линейке Gemini 3, заточенная под интеллект в масштабе.

За счет роста скорости вывода на 45% она обходит 2.5 Flash и поддерживает динамические уровни размышления под сложность задачи.

Gemini 3 Flash-Lite в цифрах:

- 1432 Elo в лидерборде arena
- 86.9% на GPQA Diamond (научные знания)
- 76.8% на MMMU Pro (мультимодальное рассуждение)

Цена $0.25 за 1M входных токенов и $1.50 за 1M выходных токенов.

Gemini 3.1 Flash-Lite выкатывается в превью для разработчиков и компаний через Gemini API в Google AI Studio и Vertex AI.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Один разработчик похоронил аргумент "ИИ не тянет большие кодовые базы".

Штука называется RepoMap в Aider.

- Генерит сжатую карту всего репозитория
- Упаковывает кодбазы на 100K+ строк в 4K токенов
- Показывает Claude, какие файлы реально релевантны
- Автоматически обновляется по мере правок
- Никакой настройки

ИИ понимает весь проект целиком, а не только те файлы, которые ты не забыл вставить. 👌

100% опенсорс
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Похоже, сами кандидаты тоже в этом не участвовали
3
Приложение Codex теперь доступно на Windows.

Оно работает и нативно, и в WSL, с встроенными терминалами для PowerShell, Command Prompt, Git Bash или WSL.

Также сделали первую нативную для Windows песочницу для агента: на уровне ОС она блокирует запись в файловую систему вне вашей рабочей папки и запрещает исходящий сетевой трафик, пока вы явно не разрешите.

Плюс: 7 новых приложений “Open in …” и 2 новых Windows-скилла (WinUI + ASP.NET).
Google выкатили Google Workspace CLI

Один инструмент командной строки для управления всем стеком Google Workspace (Drive, Gmail, Calendar, Sheets, Docs и др.)

Ключевые детали:
- Команды генерируются динамически с использованием Google Discovery Service
- Не нужно вручную писать REST API-запросы
- На выходе — структурированный JSON, чтобы AI-агенты могли легко его использовать
- Поставляется с 40+ встроенными agent skills и 100+ workflow-рецептами
- Может работать как MCP-сервер, чтобы агенты вроде Claude Desktop или Gemini CLI могли управлять инструментами Workspace через него


https://github.com/googleworkspace/cli
Прикольная, кастомная команда в Claude Code: /cost-estimate

Она сканирует твой кодбейз и сверяет с текущими рыночными ставками, чтобы посчитать, сколько бы стоил проект, если бы его делала обычная команда.

Смотрит на все API, интеграции, вообще всё.

Без ИИ: примерно 2,8 года. Примерно $650k.
С ИИ: 30 часов.

Вот сам markdown-файл.

Please open Telegram to view this post
VIEW IN TELEGRAM
Новый репозиторий OpenAI: Symphony 😳

TL;DR: это оркестрационный слой, который опрашивает проектные канбан-доски на изменения и поднимает агентов под каждую стадию жизненного цикла тикета.

Вместо того чтобы промптить агента написать код и сделать PR, ты просто двигаешь тикеты по канбан-доске.

100% опенсорс
Please open Telegram to view this post
VIEW IN TELEGRAM
4
This media is not supported in your browser
VIEW IN TELEGRAM
Официальные Apify Agent Skills : для веб-скрейпинга, извлечения данных и автоматизации

1 универсальный скилл apify-ultimate-scraper = вытаскивает данные со всего веба:

- X (Twitter): твиты в реальном времени
- TikTok / IG: горячие тренды
- YouTube: субтитры к видео и скачивание
- Google Maps: инфа по бизнесам

Все возвращается как структурированный JSON, ИИ получает и может сразу запускать автоматизацию.

Очень подходит соло-разработчикам и тем, кто пилит тулзы для автоматизации
Оп, OpenAI выкатили GPT-5.4

Новая флагманская модель вышла в версиях Thinking и Pro и получила контекст до 1 млн токенов.

Что обновили:
• Улучшили результаты в коде, математике и агентских задачах
• Модель быстрее отвечает и тратит меньше токенов на рассуждение
• Теперь можно остановить ответ на середине и дописать инструкции
• В Codex появился режим /fast – генерация примерно в 1.5× быстрее

По бенчмаркам уровень кода сопоставим с Claude Opus 4.6, а в агентских задачах модель даже сильнее.

Цена: $2.5 / $15 за 1M токенов (вход / выход). Доступ уже начинают постепенно открывать пользователям.