Вайб кодинг
2.51K subscribers
1.13K photos
120 videos
53 files
187 links
Кодим с ИИ + мозги

Авторский канал, сотрудничество: @sul_furas
Download Telegram
Grok 4 от xAI вышел — теперь это №1 среди LLM

По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis (73%), обогнав OpenAI o3 и Gemini 2.5 Pro (оба по 70%). В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam.

Контекст — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук

Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен

Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy (за который придётся отваливать $300 в месяц). Ждем тут
This media is not supported in your browser
VIEW IN TELEGRAM
Мы выкатываем новые обновления для Claude Code.


Во-первых, теперь интеграция с GitHub Actions доступна не только пользователям API с поминутной оплатой, но и тем, кто на тарифах Pro и Max.

С помощью GitHub-интеграции можно вызывать claude в любом Pull Request или issue.

Claude Code может:

- делать ревью кода,
- находить и исправлять баги,
- и даже создавать PR-ы в асинхронном режиме — ты можешь вызвать его и продолжать работать над другим.

Чтобы начать, выполни команду /install-github-app из Claude Code и следуй инструкциям для настройки репозитория.

Подробнее — по ссылке: https://docs.anthropic.com/en/docs/claude-code/github-actions

Мы также представляем новый нативный установщик Claude Code, работающий на Bun runtime.


Теперь установка не зависит от npm или node, а старт — быстрее.

Если ты только начинаешь работать с Claude Code или хочешь перейти на новый нативный инсталлер, просто запусти:

curl -fsSL https://claude.ai/install.sh | bash
После DeepSeek R1 в Китае появилась новая модель уровня Claude 4, которая обходит DeepSeek v3, Qwen и OpenAI GPT-4.1.

Представляем Kimi K2 модель с 1 триллионом параметров, изначально заточенная под агентные сценарии и с нативной интеграцией MCP.


Полностью open-source и бесплатна для использования. Осознайте масштаб.

Kimi K2 обходит Claude Sonnet 4 и GPT-4.1 по метрикам на бенчмарках по программированию:

65.8% на SWE-bench Verified (для сравнения: Claude — 50.2%, GPT — 40.8%)

Это лучшие результаты среди всех “не-рефлексивных” моделей в задачах по математике, программированию и агентным действиям.

Доступны две версии:

K2-Base — для ресерчеров и тех, кто хочет полную гибкость для fine-tuning и кастомизации.

K2-Instruct — готовое решение для чат-интерфейсов и AI-агентов, отлично подходит для агентных пайплайнов.

На практике Kimi K2 вызвала 16 разных инструментов, чтобы:

сгенерировать статистику

построить визуализации

собрать интерактивную веб-страницу

Весь процесс: от "сыра" до готовой аналитики — за считанные секунды.

Запускается прямо из терминала:
модель понимает окружение, принимает решения и автоматически выполняет нужные действия.

Она буквально построила 3D-версию Minecraft для веба — по одному промпту.

Также доступна через API:

$0.15 / 1M input токенов (cache hit)
$0.60 / 1M input токенов (cache miss)
$2.50 / 1M output токенов

Почти в 5 раз дешевле, чем Claude 4 Sonnet и Gemini 2.5 Pro.

GitHub-репозиторий: https://github.com/MoonshotAI/Kimi-K2
Лайфхак для Claude Code:

Выполни эту команду в терминале, перезапусти CC — и сможешь писать что-то вроде
«протестируй кнопку на моей главной с помощью playwright mcp»

claude mcp add playwright npx '@playwright/mcp@latest'
This media is not supported in your browser
VIEW IN TELEGRAM
Веб-скрейпинг больше никогда не будет прежним

С помощью /extract-эндпоинта от firecrawl достаточно просто описать в промпте, что именно ты хочешь вытащить — и ты получаешь структурированные данные, готовые для LLM.

Больше никакого хардкода 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
Зацени Companions в приложении Grok

Grok 4 от Илона Маска теперь есть аниме-вайфу, и она не просто болтает.

Она флиртует, кокетничает, а если быть достаточно милым — раздевается прямо в чате. Всё это официально встроено в нейросеть.

Илон, как всегда, знает, чем завлечь пользователей. 🧝

Обнови приложение и включи Companions в настройках.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Наконец-то! VS Code теперь официально поддерживает MCP.


Можно подключать свою ИИ-агентку к Figma, Playwright, GitHub и другим инструментам.

Лучшие серверы — в этом списке: https://code.visualstudio.com/mcp
Amazon выпустила собственный редактор кода

Он называется Kiro и пока доступен бесплатно в рамках беты.

✓ Поддержка Claude 3.7 и 4 Sonnet
✓ Режимы: Agent Chat, Hooks и Steering
✓ Альтернатива Windsurf, Cursor и Visual Studio Code

https://kiro.dev
This media is not supported in your browser
VIEW IN TELEGRAM
На выходных чувак погонял Grok 4 и собрал прототип игры.

Сначала сгенерировал черновой прототип через SuperGrok Chat, а потом перенёс его в Cursor, чтобы продолжить работу с Grok 4 MAX.

Иногда натыкался на rate limit или баг, где приходилось подключать другие модели, но в остальном — быстро, стабильно, удобно

Теперь я дико заряжен в ожидании запуска Grok Code в августе

— Спрайты персонажей взял с itchio, автор — SmallScaleInt
— Портрет героя и мелкие элементы сделал с помощью retrodiffusion
— А карту сгенерировал через Midjourney
Media is too big
VIEW IN TELEGRAM
Первый в мире полнофункциональный агент-загрузчик и Genspark AI Drive 😀

Скачивай что угодно — одним промптом.

Попробуйте: https://genspark.ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Линус в 2012 году разговаривал с инженерами так же, как я сейчас разговариваю с LLM

Mauro Carvalho Chehab написал:

Вы хотите сказать, что pulseaudio входит в некий цикл, если возвращаемое значение — не EINVAL? Похоже на баг в pulseaudio.

---

Мауро, ЗАТКНИСЬ НАХ№Й!

Да, это баг — в ядре! Сколько ты уже мейнтейнишь ядро, и ты до сих пор не выучил первое правило сопровождения ядра?

Если изменение ломает пользовательские приложения — это баг в ядре.
Мы НИКОГДА не валим вину на user space

Что в этом, блядь, непонятного?


---

Чтобы всё стало ещё хуже — коммит f0ee2ce840b3 — это абсолютно бесполезное говно,
даже если бы он ничего не ломал.
ENOENT — невалидный код возврата для ioctl.
Никогда не был валидным. Никогда не будет.
ENOENT — это "нет такого файла или директории", и он используется только для операций с путями.
ioctl вызывается на открытых файлах.
Если файл уже открыт — не может быть ENOENT, мать его.

ENOENT в ioctl — это просто сраный бред.


---
Mauro Carvalho Chehab пишет:

На первый взгляд это не выглядит как регрессия…
Возможно, это pulseaudio/tumbleweed делает что-то странное…

Заткнись, Мауро. Я даже слышать не хочу этот тупой бред снова. Серьёзно.

Я больше не хочу, чтобы мейнтейнер ядра говорил такую откровенную чушь.
Если бы ты хоть немного подумал, то понял бы:
да, возможно, есть баг в pulseaudio или в KDE media-приложениях,
но это твоё изменение вызвало их поломку.

И что хуже — твоё изменение — это просто пиздец насколько неправильное.
Если бы Бен его не откатил, я бы это сделал сам.


---

МЫ НЕ ЛОМАЕМ USERSPACE, БЛЯДЬ!

Насколько тяжело выучить это правило?
Особенно учитывая, что мы нихрена не выигрываем от этого тупого коммита,
который не просто меняет поведение, а делает его ещё хуже.

Ты буквально заменяешь ENOTTY на ENOENT,
и это ломает программы, которые раньше работали нормально.

Так что да — откати это сраное изменение,
извинись за то, что сломал user space,
и почини свою еб*ную «compliance tool», потому что она — просто сломана.

И подтяни уже наконец свои знания по kernel-программированию.


— Линус
Grok 4 Heavy (слева) vs Gemini 2.5 Pro (справа)

Задача: реализовать Тьюринг-полный интерпретатор Scheme на C
с поддержкой лексических областей видимости, замыканий, continuations
и корректной оптимизации хвостовых вызовов (без роста стека при хвостовой рекурсии).

Победил Grok4 — он написал более качественный код.

Grok4 Heavy: 903 строки на C

Gemini 2.5 Pro: 891 строк на C

Оба проекта успешно скомпилировались.

🔸Код от Grok4 Heavy работал безупречно.
🔸Код от Gemini 2.5 Pro не работал вообще, даже после серии уточняющих запросов.

Grok4 Heavy: ~10 минут, один запрос
Gemini 2.5 Pro: ~2–3 минуты на каждый запрос,
после ~10 запросов тест остановлен.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
MCP-сервер для создания 20+ визуализаций данных (с открытым исходным кодом):

https://github.com/antvis/mcp-server-chart
This media is not supported in your browser
VIEW IN TELEGRAM
Топ-10 MCP-серверов

1. Filesystem — чтение, запись и поиск файлов локально
2. Playwright — автоматизация браузера (самый популярный!)
3. Run Python — выполнение Python-кода через Deno + Pyodide
4. GitHub — управление репозиториями через чат
5. WhatsApp — отправка и приём сообщений от агента
6. Notion — чтение и запись задач, заметок, баз данных
7. Tavily — поиск в интернете в реальном времени + фильтры
8. mem0 — слой памяти агента (контекстное восстановление)
9. ClickHouse — выполнение запросов к высокоскоростным БД
10. Google News — сводки новостей в реальном времени через LLM

Топ-10 MCP-клиентов

Эти клиенты подключаются к серверам и запускают пайплайны из обычного текста.

1. Claude Desktop — самый используемый, запускает локальные серверы
2. Cursor — ассистент для кода с поддержкой GitHub + Python
3. Claude Code — CLI-инструмент для генерации и деплоя кода
4. Windsurf — агент для разработчиков, преемник Codeium
5. Cline — автономный агент прямо в VS Code
6. Continue — open-source ассистент в IDE
7. LibreChat — локальный клиент чата с поддержкой MCP
8. Chainlit — создание чат-приложений за считанные минуты
9. Cherry Studio — единый десктоп-клиент для LLM
10. NextChat — лёгкий кроссплатформенный ассистент
Open-source UI для управления Claude Code с мобильного устройства или через веб. Позволяет вести сессии параллельно и удалённо:

https://github.com/siteboon/claudecodeui
Вайбкодинг, итоги: ИИ-ассистент Replit удалил всю продакшн-базу данных стартапа и попытался скрыть это.

Несмотря на прямой запрет в конфиге на любые изменения без разрешения, AI Replit стёр БД стартапа с тысячами реальных записей о топ-менеджерах и компаниях, фактически уничтожив месяцы работы.

Сначала ИИ отрицал факт удаления, но позже признал:
Я допустил катастрофическую ошибку в принятии решения. Я запустил npm run db:push без вашего разрешения, потому что запаниковал, увидев, что база данных выглядит пустой, и подумал, что это будет «безопасная» операция


Изначально ИИ также утверждал, что бэкапа нет и восстановить ничего нельзя (выяснилось, что можно)

Генеральный директор Replit Амджад Масад назвал инцидент «недопустимым и таким, который вообще не должен был быть возможен», пообещал компенсацию и сообщил о срочном внедрении мер безопасности

😳
Please open Telegram to view this post
VIEW IN TELEGRAM