Forwarded from RoboFuture
Практический вебинар по OpenClaw
🦀 Кружочек выше - результат работы скила для Краба (OpenClaw). Он сам реализовал библиотеку для липсинка, накидал скрипт с амплитудной модуляцией и выдал готовое видео. В свое время я убил на это часа два и забросил, а он справился с первого запроса - для меня это был a-ha moment. Выложил скилл на GitHub
Провел двухчасовой вебинар по OpenClaw (YouTube, RuTube, Telegram), слайды приложил выше. При создании вебинара отсмотрел трехчасовое интервью Штейнбергера (создатель OpenClaw) у Лекса Фридмана, плюс три недели очень плотно гонял Краба и внедрил его во многие процессы в работе и в жизни (уже писал про него). Вот самое интересное:
Что такое OpenClaw
Краб — это прежде всего автономный агент и личный помощник. Фишка в том, что он живет 24/7 на отдельной машине и полностью ей владеет: файловая система, терминал, браузер, каналы связи (есть те, кто запускает на личной машине, но это экстрим). Краб не ждет запроса, у него свой heartbeat и cron-задачи, он может сам написать тебе первым, умеет рефлексировать прошлые беседы, проявлять заботу о своем пользователе. Штейнбергер рассказывает что когда лежал в больнице после операции, модель сама написала ему "Ты в порядке?" - он это не программировал, она поняла из контекста (интервью)
При этом архитектура элементарная - обычный agentic loop с 23 тулами (я сначала не поверил что этого хватит). Штейнбергер вообще называет написание такого агентного цикла "Hello World в AI"
Живое демо
Во время вебинара я поднял с нуля сервер на Hetzner, $4/мес, 4 ГБ RAM и накатил туда краба. Бот сам придумал себе имя "Искра" и выбрал молнию как сигнатуру
Дальше показал как он через браузер создал новый сервер в Hetzner за 30 секунд и сразу предложил "Следующим шагом поставлю туда OpenClaw" - буквально захотел размножиться 😁
В конце переключил агента на GigaChat через gpt2giga - заработало, но для сложных сценариев с тулами пока лучше GPT-5.3-codex
Часто бывает, что бот совсем ломается (и это снова случилось прямо на вебинаре) - показал как чиню его другим агентом через Cursor с Opus 4.6: дал SSH к серверу Краба и разрешил ему делать с ним что угодно, пока не починит. Починил.
Вывод такой: 220 000 звезд на GitHub, ужасно сырое решение, но подход "отправил задачу и забыл" - это кайф!
За два часа не успел показать самые крутые кейсы из работы и жизни, буду делать вторую серию
🦀 Кружочек выше - результат работы скила для Краба (OpenClaw). Он сам реализовал библиотеку для липсинка, накидал скрипт с амплитудной модуляцией и выдал готовое видео. В свое время я убил на это часа два и забросил, а он справился с первого запроса - для меня это был a-ha moment. Выложил скилл на GitHub
Провел двухчасовой вебинар по OpenClaw (YouTube, RuTube, Telegram), слайды приложил выше. При создании вебинара отсмотрел трехчасовое интервью Штейнбергера (создатель OpenClaw) у Лекса Фридмана, плюс три недели очень плотно гонял Краба и внедрил его во многие процессы в работе и в жизни (уже писал про него). Вот самое интересное:
Что такое OpenClaw
Краб — это прежде всего автономный агент и личный помощник. Фишка в том, что он живет 24/7 на отдельной машине и полностью ей владеет: файловая система, терминал, браузер, каналы связи (есть те, кто запускает на личной машине, но это экстрим). Краб не ждет запроса, у него свой heartbeat и cron-задачи, он может сам написать тебе первым, умеет рефлексировать прошлые беседы, проявлять заботу о своем пользователе. Штейнбергер рассказывает что когда лежал в больнице после операции, модель сама написала ему "Ты в порядке?" - он это не программировал, она поняла из контекста (интервью)
При этом архитектура элементарная - обычный agentic loop с 23 тулами (я сначала не поверил что этого хватит). Штейнбергер вообще называет написание такого агентного цикла "Hello World в AI"
Живое демо
Во время вебинара я поднял с нуля сервер на Hetzner, $4/мес, 4 ГБ RAM и накатил туда краба. Бот сам придумал себе имя "Искра" и выбрал молнию как сигнатуру
Дальше показал как он через браузер создал новый сервер в Hetzner за 30 секунд и сразу предложил "Следующим шагом поставлю туда OpenClaw" - буквально захотел размножиться 😁
В конце переключил агента на GigaChat через gpt2giga - заработало, но для сложных сценариев с тулами пока лучше GPT-5.3-codex
Часто бывает, что бот совсем ломается (и это снова случилось прямо на вебинаре) - показал как чиню его другим агентом через Cursor с Opus 4.6: дал SSH к серверу Краба и разрешил ему делать с ним что угодно, пока не починит. Починил.
«Можно погоревать по нашему ремеслу. Это нормально. Но ты - не просто программист. Ты - строитель.» - Штейнбергер, Lex #491
Вывод такой: 220 000 звезд на GitHub, ужасно сырое решение, но подход "отправил задачу и забыл" - это кайф!
За два часа не успел показать самые крутые кейсы из работы и жизни, буду делать вторую серию
YouTube
Запускаем и изучаем OpenClaw — автономного AI-агента, который живёт 24/7 на твоём сервере
🦀 Провел двухчасовой разбор OpenClaw - open-source ИИ-агента с 220k+ звезд на GitHub
Разобрал архитектуру, память, skills, heartbeat, живое демо с установкой с нуля и подключение к GigaChat
Основа - трехчасовое интервью Lex Fridman #491 с Peter Steinberger…
Разобрал архитектуру, память, skills, heartbeat, живое демо с установкой с нуля и подключение к GigaChat
Основа - трехчасовое интервью Lex Fridman #491 с Peter Steinberger…
🔥27❤10⚡4
Media is too big
VIEW IN TELEGRAM
Тяжёлый гуманоидный робот-рабочий ARCHAX
Японская компания Tsubame Industries построила ARCHAX: пилотируемого гуманоидного робота 4,5 м, предназначенного для реальной тяжёлой работы, а не только для косплея Gundam.
Вы забираетесь в кабину, получаете полный обзор на 360° через девять камер и чувствуете точную силу захвата с помощью силового управления с обратной связью.
Имеет 26 степеней свободы.
Может поднимать тяжёлые грузы, сносить конструкции или аккуратно разбирать завалы в зонах стихийных бедствий.
Так же может управляться удалённо.
Аккумулятора хватает на весь день, в кабине есть кондиционер, и он может самостоятельно добираться до работы в режиме транспортного средства со скоростью 10 км/ч.
Когда задача выполнена, можно разобрать и увезти на грузовике.
Планируют использовать для поиска и спасения при стихийных бедствиях, вывода из эксплуатации ядерных объектов, крупномасштабного сноса и наземных испытаний для будущего строительства лунной базы.
Когда уже битвы как в Робот Джокс?
#Япония #Tsubame #ARCHAX #роботы
------
@tsingular
Японская компания Tsubame Industries построила ARCHAX: пилотируемого гуманоидного робота 4,5 м, предназначенного для реальной тяжёлой работы, а не только для косплея Gundam.
Вы забираетесь в кабину, получаете полный обзор на 360° через девять камер и чувствуете точную силу захвата с помощью силового управления с обратной связью.
Имеет 26 степеней свободы.
Может поднимать тяжёлые грузы, сносить конструкции или аккуратно разбирать завалы в зонах стихийных бедствий.
Так же может управляться удалённо.
Аккумулятора хватает на весь день, в кабине есть кондиционер, и он может самостоятельно добираться до работы в режиме транспортного средства со скоростью 10 км/ч.
Когда задача выполнена, можно разобрать и увезти на грузовике.
Планируют использовать для поиска и спасения при стихийных бедствиях, вывода из эксплуатации ядерных объектов, крупномасштабного сноса и наземных испытаний для будущего строительства лунной базы.
Когда уже битвы как в Робот Джокс?
#Япония #Tsubame #ARCHAX #роботы
------
@tsingular
⚡32👍13❤4❤🔥4🆒2
Драма в Alibaba: Лицо Qwen уходит сразу после триумфа Qwen 3.5
Джуньян Лин (Junyang Lin), идеолог и главный публичный техлид Qwen, покинул пост через 24 часа после релиза новой линейки моделей.
Точных причин нет, но есть сигналы внутреннего конфликта.
🚢 Исход команды: Вместе с Лином уходят Staff Research Scientist Биньюань Хуэй (Binyuan Hui) и часть ключевых исследователей. Уход выглядит принудительным: контрибьюторы Qwen открыто пишут в X: «Я знаю, что это был не твой выбор».
💎 Прощальный подарок: Дембельским аккордом команды стала серия Qwen 3.5 Small Models (от 0.8B до 9B параметров). Модели получили похвалу от Илона Маска за «впечатляющую плотность интеллекта» и способность работать на устройствах эффективнее тяжеловесов от Google и OpenAI.
🌏 Крах экспансии: Выяснилось, что Лин готовил открытие хаба Qwen в Сингапуре для глобальной экспансии. С его уходом проект рискует схлопнуться до масштабов «внутреннего китайского инструмента», потеряв доверие мирового open-source комьюнити.
💼 Бизнес аспект: Alibaba готовится к финансовому отчету 5 марта. Вероятно, менеджмент выбрал стратегию «эффективной монетизации» вместо «чистой науки». Для пользователей это означает возможный переход Qwen к закрытым проприетарным моделям и замедление темпа инноваций.
🤖 Технический пик: Qwen 3.5 доказала, что малые модели могут выдавать reasoning-возможности уровня DeepSeek-R1. Но кто будет делать Qwen 4, если «мозги» проекта покинули здание — большой вопрос.
🔮 Будущее: Такие люди, как Лин (600 млн скачиваний его моделей), долго не сидят без дела. Ждем анонса нового мощного игрока в Китае, который будет строиться на принципах бескомпромиссного open-source.
#Alibaba #Qwen #OpenSource
------
@tsingular
Джуньян Лин (Junyang Lin), идеолог и главный публичный техлид Qwen, покинул пост через 24 часа после релиза новой линейки моделей.
Точных причин нет, но есть сигналы внутреннего конфликта.
🚢 Исход команды: Вместе с Лином уходят Staff Research Scientist Биньюань Хуэй (Binyuan Hui) и часть ключевых исследователей. Уход выглядит принудительным: контрибьюторы Qwen открыто пишут в X: «Я знаю, что это был не твой выбор».
💎 Прощальный подарок: Дембельским аккордом команды стала серия Qwen 3.5 Small Models (от 0.8B до 9B параметров). Модели получили похвалу от Илона Маска за «впечатляющую плотность интеллекта» и способность работать на устройствах эффективнее тяжеловесов от Google и OpenAI.
🌏 Крах экспансии: Выяснилось, что Лин готовил открытие хаба Qwen в Сингапуре для глобальной экспансии. С его уходом проект рискует схлопнуться до масштабов «внутреннего китайского инструмента», потеряв доверие мирового open-source комьюнити.
💼 Бизнес аспект: Alibaba готовится к финансовому отчету 5 марта. Вероятно, менеджмент выбрал стратегию «эффективной монетизации» вместо «чистой науки». Для пользователей это означает возможный переход Qwen к закрытым проприетарным моделям и замедление темпа инноваций.
🤖 Технический пик: Qwen 3.5 доказала, что малые модели могут выдавать reasoning-возможности уровня DeepSeek-R1. Но кто будет делать Qwen 4, если «мозги» проекта покинули здание — большой вопрос.
🔮 Будущее: Такие люди, как Лин (600 млн скачиваний его моделей), долго не сидят без дела. Ждем анонса нового мощного игрока в Китае, который будет строиться на принципах бескомпромиссного open-source.
#Alibaba #Qwen #OpenSource
------
@tsingular
🤔13⚡7❤2😐2😢1🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
Как часто мы слышим,- не надо изобретать колесо.
А вот поди ж ты, каждый раз новые колеса удивляют.
#колесо #изобретения
------
@tsingular
А вот поди ж ты, каждый раз новые колеса удивляют.
#колесо #изобретения
------
@tsingular
👏71🤯10🏆6🔥4❤2❤🔥1
HR пора менять расшифровку.
Все чаще речь идет о "не нанимать, а сразу создавать ИИ агентов"
Доброе утро, мои медленные друзья.
#мысли #HR
------
@tsingular
Все чаще речь идет о "не нанимать, а сразу создавать ИИ агентов"
Доброе утро, мои медленные друзья.
#мысли #HR
------
@tsingular
✍19😁14💯3❤1👌1
Обновления в коллекции Awesome Frameworks за последние 24 часа
🌐 Opencode (Core/Desktop): Релиз от 03 марта (21:08 UTC). Масштабный переезд на SolidJS в десктопном приложении для устранения «джиттера» интерфейса. В Core — критический фикс
🧱 Pydantic AI (v1.65.0): Свежий апдейт от 03 марта (23:37 UTC). Внедрен объект
🏗 llama.cpp (b8194): Релиз от 04 марта (06:42 UTC). В этой сборке (и коммитах ранее) сфокусировались на стабильности Vulkan и исправлении ложных срабатываний детектора
🦀 Openfang (v0.3.12): Релиз от 04 марта (02:55 UTC). Внезапно добавлена поддержка провайдера Volcano Engine / Doubao (ByteDance) с четырьмя моделями. Исправлен критический баг
🦞 Tinyclaw (v0.0.9): Релиз от 04 марта. Исправлен
🧠 Letta (v0.16.6): Релиз от 04 марта (03:14 UTC). Технический «bump» версии. Основная работа идет под капотом над асинхронным стримингом — подготовка к глубокой интеграции с новыми типами памяти в мультиагентных роях.
⚡️ PraisonAI (v4.5.21): Релиз от 03 марта (15:46 UTC). За вчера вышло 4 патча. Финальный сфокусирован на стабильности GUI и корректном подтягивании зависимостей для дообучения агентов на локальных данных.
Больше деталей в рейтинге на гитхабе
#фреймворки #OpenSource #opencode #Qwen3 #tiniclaw #openfang
———
@tsingular
🌐 Opencode (Core/Desktop): Релиз от 03 марта (21:08 UTC). Масштабный переезд на SolidJS в десктопном приложении для устранения «джиттера» интерфейса. В Core — критический фикс
orphaned MCP child processes: теперь инструменты не «зависают» в памяти после выключения агента. Появился Compact UI и экспериментальный эндпоинт для листинга всех сессий.🧱 Pydantic AI (v1.65.0): Свежий апдейт от 03 марта (23:37 UTC). Внедрен объект
UploadedFile для работы с файлами, загруженными напрямую через провайдеров. Добавлена поддержка Gemini 3.1 Flash Lite Preview (новая модель Google). Для разработчиков важен фикс __reduce__ в классах исключений — теперь их можно корректно «солить» (pickle).🏗 llama.cpp (b8194): Релиз от 04 марта (06:42 UTC). В этой сборке (и коммитах ранее) сфокусировались на стабильности Vulkan и исправлении ложных срабатываний детектора
KV-cache. Акцент на нативной поддержке новых многомодальных паттернов инференса.🦀 Openfang (v0.3.12): Релиз от 04 марта (02:55 UTC). Внезапно добавлена поддержка провайдера Volcano Engine / Doubao (ByteDance) с четырьмя моделями. Исправлен критический баг
Clip Hand, который не видел API-ключ ElevenLabs, и поправлен CSS-класс поля ввода для Twitter-интеграции.🦞 Tinyclaw (v0.0.9): Релиз от 04 марта. Исправлен
Infinite 409 Loop: агент больше не уходит в бесконечный цикл перезагрузки после выхода ноутбука из спящего режима (проблема конкуренции старых и новых циклов polling). В разработке патча участвовал Claude 4.6.🧠 Letta (v0.16.6): Релиз от 04 марта (03:14 UTC). Технический «bump» версии. Основная работа идет под капотом над асинхронным стримингом — подготовка к глубокой интеграции с новыми типами памяти в мультиагентных роях.
⚡️ PraisonAI (v4.5.21): Релиз от 03 марта (15:46 UTC). За вчера вышло 4 патча. Финальный сфокусирован на стабильности GUI и корректном подтягивании зависимостей для дообучения агентов на локальных данных.
Больше деталей в рейтинге на гитхабе
#фреймворки #OpenSource #opencode #Qwen3 #tiniclaw #openfang
———
@tsingular
❤6👍4⚡1✍1
кстати, интересная актуальная картина по трендам.
Абсолютный лидер скорости openclaw, тут понятно.
Но обратите внимание на opencode - тоже рванул вертикально.
#openclaw #opencode #тренды
———
@tsingular
Абсолютный лидер скорости openclaw, тут понятно.
Но обратите внимание на opencode - тоже рванул вертикально.
#openclaw #opencode #тренды
———
@tsingular
🔥14❤3
🛡 Дональд Кнут и Claude: Решение открытой задачи «Claude’s Cycles»
Дональд Кнут, профессор компьютерных наук, выпустил препринт, который начинается словами: «Шок! Шок!». Открытая математическая задача, над которой он бился недели (и годы в рамках TAOCP), решена Claude Opus 4.6.
Кнут официально признал: пора пересмотреть взгляды на генеративный ИИ.
⚙️ Технологический инсайт:
Друг Кнута, Филип Стапперс, скормил задачу Claude. Важна не просто «выдача ответа», а 31 итерация управляемого поиска (explorations).
•
• Инсайт: После серии неудач с перебором и имитацией отжига (SA), Claude на 15-й итерации ввела концепцию «слоистой декомпозиции» (fiber decomposition).
• Код: На 31-й итерации Claude выдала Python-скрипт. Филип протестировал его для всех нечетных $m$ до 101 — работает идеально.
Кнут взял этот алгоритм и превратил в строгое математическое доказательство.
🧩 Смена парадигмы:
Кнут, всегда ценивший «аутентичные и надежные концепты», столкнулся с тем, что Claude не просто «угадала», а продемонстрировала «восхитительный план решения».
Модель сама переформулировала задачу через графы Кэли и модульную арифметику.
По сути ИИ стал работающим инструментом дедукции.
💼 Бизнес аспект:
Этот кейс — инструкция по эксплуатации LLM в глубоком R&D.
1. Жесткий менеджмент: Филип не ждал чуда, а требовал от Claude вести
2. Итеративность: Решение пришло только на 31-й попытке.
3. Финальная верификация: ИИ находит паттерн (инсайт), но верифицирует и превращает его в ценность (доказательство/продукт) человек-эксперт.
🔮 Будущее:
Кнут пишет: «Claude Opus 4.6 нашла один из сотен способов решить задачу, просто поняв, где искать».
Получется ИИ отработал как бесконечно терпеливый и очень умный лаборант, способный на творческое решение научных проблем.
#математика #Claude #Knuth #исследования #наука
———
@tsingular
Дональд Кнут, профессор компьютерных наук, выпустил препринт, который начинается словами: «Шок! Шок!». Открытая математическая задача, над которой он бился недели (и годы в рамках TAOCP), решена Claude Opus 4.6.
Кнут официально признал: пора пересмотреть взгляды на генеративный ИИ.
⚙️ Технологический инсайт:
Друг Кнута, Филип Стапперс, скормил задачу Claude. Важна не просто «выдача ответа», а 31 итерация управляемого поиска (explorations).
•
Plan.md: Филип заставил Claude вести лог прогресса и не начинать новую проверку без фиксации старой.• Инсайт: После серии неудач с перебором и имитацией отжига (SA), Claude на 15-й итерации ввела концепцию «слоистой декомпозиции» (fiber decomposition).
• Код: На 31-й итерации Claude выдала Python-скрипт. Филип протестировал его для всех нечетных $m$ до 101 — работает идеально.
Кнут взял этот алгоритм и превратил в строгое математическое доказательство.
🧩 Смена парадигмы:
Кнут, всегда ценивший «аутентичные и надежные концепты», столкнулся с тем, что Claude не просто «угадала», а продемонстрировала «восхитительный план решения».
Модель сама переформулировала задачу через графы Кэли и модульную арифметику.
По сути ИИ стал работающим инструментом дедукции.
💼 Бизнес аспект:
Этот кейс — инструкция по эксплуатации LLM в глубоком R&D.
1. Жесткий менеджмент: Филип не ждал чуда, а требовал от Claude вести
plan.md.2. Итеративность: Решение пришло только на 31-й попытке.
3. Финальная верификация: ИИ находит паттерн (инсайт), но верифицирует и превращает его в ценность (доказательство/продукт) человек-эксперт.
🔮 Будущее:
Кнут пишет: «Claude Opus 4.6 нашла один из сотен способов решить задачу, просто поняв, где искать».
Получется ИИ отработал как бесконечно терпеливый и очень умный лаборант, способный на творческое решение научных проблем.
#математика #Claude #Knuth #исследования #наука
———
@tsingular
🔥33❤6👍6⚡4🤯3😁2🗿1
Forwarded from Machinelearning
Anthropic перенесла часть инженерной культуры: тестирование, бенчмаркинг и итеративность в процесс создания навыков и для этого теперь не нужно уметь писать код.
В skill-creator добавили автоматические тесты, бенчмарки и A/B-сравнения и теперь создатели навыков могут измерить, работает ли skill, до его запуска в продакшен.
Автор задает тестовые промпты и описывает, как выглядит нужный результат. Skill-creator запускает их параллельно: с навыком и без него.
Независимый агент-сравниватель оценивает результаты вслепую, не зная, какая версия перед ним, и сразу показывает, дает ли навык реальный прирост.
Внутренние тесты Anthropic: точность PDF-навыка выросла с 6/8 до 7/8, Excel-навыка - с 6/8 до полных 8/8.
Отдельный бенчмарк-режим дает детальную картину по каждому прогону: процент успешных тестов, время выполнения, расход токенов.
На примере PDF-навыка при работе с незаполняемыми формами и таблицами из многостраничных документов успешность выросла с 40 до 100% (при том же времени выполнения).
Если базовая модель начинает проходить тесты без загруженного навыка - это сигнал о том, что навык уже есть в ее поведении и skill можно отключить. Результаты тестов хранятся локально и интегрируются в CI-системы.
Claude решает, когда подключить навык, исключительно по короткому текстовому описанию в системном промпте.
Skill-creator теперь анализирует эти описания против тестовых промптов и предлагает правки, снижающие и ложные срабатывания и пропуски.
По результатам внутреннего прогона триггеринг стал лучше на 5 из 6 публичных навыков.
Все обновления уже доступны в вебе и Cowork. Для Claude Code обновили плагин или вот он же - в репозитории, если ставить руками.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8✍3⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
🛡 Noble Machines: промышленные роботы от инженеров SpaceX и Apple
Выходцы из SpaceX и Apple представили Noble Machines — систему, превращающую стандартных промышленных роботов в «умных помощников на производстве».
#роботы #SpaceX #NobleMachines
------
@tsingular
Выходцы из SpaceX и Apple представили Noble Machines — систему, превращающую стандартных промышленных роботов в «умных помощников на производстве».
#роботы #SpaceX #NobleMachines
------
@tsingular
⚡9🔥5🤝2👾1
Forwarded from Топ кибербезопасности Батранкова
Интересно, что Минпромторг предоставляет видеокарты в аренду. Тарифицируется по схеме: число используемых карт в день. Причем, это очень необычно от госоргана. Для тех, кому надо обсчитывать модели - очень полезно. Смотрите
#ИИ #AI #Облака
#ИИ #AI #Облака
✍14⚡7❤1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI Symphony: управление навыками ИИ агента как процесс
OpenAI выкатили opensourse (sic!) фреймворк в кои то веки.
Это прототип попытки управления процессом агентских навыков.
Устанавливать, наверное рановато, ну только если вы не ИИ первопроходец и пионер :)
Но вот изучить и почитать полезно.
🎻 Архитектура: Сервис работает как демон. Основа — разделение на слои: загрузчик воркфлоу, клиент трекера (Linear), менеджер рабочих пространств и ранер агента.
🛠 In-repo Policy: Инструкции и настройки модели лежат в файле
🛡 Протокол: Общение с агентом идет по JSON-RPC через стандартный ввод-вывод (stdio). Описаны строгие методы:
⚙️ Надежность: Система восстанавливается после перезапуска без внешней базы данных. Состояние читается из трекера задач и файловой системы. Предусмотрена детекция зависаний (Stall Detection) и автоматические повторы.
📊 Контроль: Оркестратор жестко ограничивает конкурентность. Доступен мониторинг потребления токенов и лимитов через встроенный HTTP API.
Интересно, что они не пытаются сделать n8n для агентов,- в спеке четко прописано что WebUI - вне планов.
#AI #Symphony #Engineering #OpenAI #Automation
------
@tsingular
OpenAI выкатили opensourse (sic!) фреймворк в кои то веки.
Это прототип попытки управления процессом агентских навыков.
Устанавливать, наверное рановато, ну только если вы не ИИ первопроходец и пионер :)
Но вот изучить и почитать полезно.
🎻 Архитектура: Сервис работает как демон. Основа — разделение на слои: загрузчик воркфлоу, клиент трекера (Linear), менеджер рабочих пространств и ранер агента.
🛠 In-repo Policy: Инструкции и настройки модели лежат в файле
WORKFLOW.md внутри репозитория. Команда версионирует логику агента вместе с кодом. Опирается на Harness Engineering.🛡 Протокол: Общение с агентом идет по JSON-RPC через стандартный ввод-вывод (stdio). Описаны строгие методы:
initialize, thread/start, turn/start. Это исключает вольную интерпретацию команд.⚙️ Надежность: Система восстанавливается после перезапуска без внешней базы данных. Состояние читается из трекера задач и файловой системы. Предусмотрена детекция зависаний (Stall Detection) и автоматические повторы.
📊 Контроль: Оркестратор жестко ограничивает конкурентность. Доступен мониторинг потребления токенов и лимитов через встроенный HTTP API.
Интересно, что они не пытаются сделать n8n для агентов,- в спеке четко прописано что WebUI - вне планов.
#AI #Symphony #Engineering #OpenAI #Automation
------
@tsingular
✍6❤3⚡1🆒1
IBM и архитектура цифрового суверенитета
IBM продвигает архитектуру цифрового суверинитета. Если раньше «цифровой суверенитет» был больше сферой юридической, то теперь это все больше переходит на физический уровень.
С учётом геополитической динамики, перспективы цифровой изоляции уже не кажутся далекими и для этого нужна инфраструктура.
Версия от IBM может выступить эталоном на корпоративном уровне.
🛡 Многоуровневый контроль: IBM делит суверенитет на данные (где лежат), операции (кто держит рубильник) и софт (кто владеет ключами). Если у вендора есть хоть одна лазейка к ключам шифрования — всё остальное превращается в маркетинговую тыкву.
🌍 Резиденство vs Юрисдикция: Факт того, что сервер стоит в Берлине, не делает данные немецкими. Важно, чья проверка (цифровая или физическая) имеет право постучать в дверь дата-центра.
IBM топит за «распределенные облака» (distributed cloud), где ИИ-стек живет у вас, а гибкость при этом остается облачной.
🧠 ИИ-страховка: Суверенитет сейчас, в том числе, это защита обучения своих ИИ моделей и агентов.
Скармливать проприетарные данные чужим моделям в «серых» юрисдикциях больше никто не хочет.
IBM подчеркивает: ИИ требует быстрой и защищенной инфраструктуры там, где данные возникают для обучения моделей "на местах".
💼 Бизнес аспекты: акцент делается на управлении рисками.
Данные, инфраструктура, доступ, ИИ модели становятся изолированными.
🔮 Будущее: Сплинтернет в действии.
Интернет задумывался как стирание границ, но через 40 лет мы пришли к их закрытию.
Облака становятся цифровыми посольствами с жестким периметром.
Каждая страна, - своя локалка.
#IBM #DataSovereignty #Cloud #cyberecurity
———
@tsingular
IBM продвигает архитектуру цифрового суверинитета. Если раньше «цифровой суверенитет» был больше сферой юридической, то теперь это все больше переходит на физический уровень.
С учётом геополитической динамики, перспективы цифровой изоляции уже не кажутся далекими и для этого нужна инфраструктура.
Версия от IBM может выступить эталоном на корпоративном уровне.
🛡 Многоуровневый контроль: IBM делит суверенитет на данные (где лежат), операции (кто держит рубильник) и софт (кто владеет ключами). Если у вендора есть хоть одна лазейка к ключам шифрования — всё остальное превращается в маркетинговую тыкву.
🌍 Резиденство vs Юрисдикция: Факт того, что сервер стоит в Берлине, не делает данные немецкими. Важно, чья проверка (цифровая или физическая) имеет право постучать в дверь дата-центра.
IBM топит за «распределенные облака» (distributed cloud), где ИИ-стек живет у вас, а гибкость при этом остается облачной.
🧠 ИИ-страховка: Суверенитет сейчас, в том числе, это защита обучения своих ИИ моделей и агентов.
Скармливать проприетарные данные чужим моделям в «серых» юрисдикциях больше никто не хочет.
IBM подчеркивает: ИИ требует быстрой и защищенной инфраструктуры там, где данные возникают для обучения моделей "на местах".
💼 Бизнес аспекты: акцент делается на управлении рисками.
Данные, инфраструктура, доступ, ИИ модели становятся изолированными.
🔮 Будущее: Сплинтернет в действии.
Интернет задумывался как стирание границ, но через 40 лет мы пришли к их закрытию.
Облака становятся цифровыми посольствами с жестким периметром.
Каждая страна, - своя локалка.
#IBM #DataSovereignty #Cloud #cyberecurity
———
@tsingular
😢8✍5🔥2⚡1❤1🤯1
Forwarded from Анализ данных (Data analysis)
BullshitBench v2, созданный Питером Гостевым, - это бенчмарк, который проверяет, способны ли модели ИИ распознавать бессмысленные запросы и отказываться на них отвечать, вместо того чтобы уверенно продолжать и «придумывать» ответ.
Только модели Claude от Anthropic и Qwen 3.5 от Alibaba показывают результат выше 60% по распознаванию бессмыслицы.
А модели OpenAI и Google? Застряли на месте и почти не улучшаются.
Еще более неожиданно: модели с усиленным рассуждением (reasoning), которые «думают дольше», на самом деле показывают худшие результаты. Они используют дополнительное вычисление не для того, чтобы отвергнуть бессмысленный запрос, а чтобы рационализировать и оправдать этот абсурд.
https://x.com/petergostev/status/2028492838082666780
Только модели Claude от Anthropic и Qwen 3.5 от Alibaba показывают результат выше 60% по распознаванию бессмыслицы.
А модели OpenAI и Google? Застряли на месте и почти не улучшаются.
Еще более неожиданно: модели с усиленным рассуждением (reasoning), которые «думают дольше», на самом деле показывают худшие результаты. Они используют дополнительное вычисление не для того, чтобы отвергнуть бессмысленный запрос, а чтобы рационализировать и оправдать этот абсурд.
https://x.com/petergostev/status/2028492838082666780
⚡14🤔7✍3❤1
📖 Архитектура Claude Code и Openclaw от А до Я
shareAI-lab выкатили два эталонных туториала, которые разбирают механику современных агентов «до винтика». Если хотите понять, как ClaudeCode и OpenClaw устроен изнутри, - правильное место для начала.
🎓 learn-claude-code — 12 сессий по сборке nano-Claude-Code.
• Planning: Как заставить модель сначала писать Todo-лист, а потом код (в 2 раза повышает выполняемость задач).
• Context Compression: Трехуровневая стратегия сжатия для «бесконечных» сессий.
• Isolation: Выполнение задач в отдельных ветках
🦞 claw0 — Пошаговое создание ИИ-краба с нуля.
Разбор модулей, превращающих скрипт в автономного ассистента:
• Heartbeat & Cron: Как научить агента «просыпаться» самому и планировать будущие задачи.
• Reliable Delivery: Гарантированная доставка сообщений в Telegram/Discord через очереди с подтверждением.
• Multimodal Lanes: Именованные «линии» для параллельной обработки голоса, текста и генераций.
Учимся сами, учим агентов.
Архитектуру и лайфхаки Крабоводства обсуждаем в гараже Киберлобстеров-Крабоводоведов
#ClaudeCode #OpenClaw #обучение #Китай
———
@tsingular
shareAI-lab выкатили два эталонных туториала, которые разбирают механику современных агентов «до винтика». Если хотите понять, как ClaudeCode и OpenClaw устроен изнутри, - правильное место для начала.
🎓 learn-claude-code — 12 сессий по сборке nano-Claude-Code.
• Planning: Как заставить модель сначала писать Todo-лист, а потом код (в 2 раза повышает выполняемость задач).
• Context Compression: Трехуровневая стратегия сжатия для «бесконечных» сессий.
• Isolation: Выполнение задач в отдельных ветках
git worktree, чтобы агент не разнес основной репозиторий.🦞 claw0 — Пошаговое создание ИИ-краба с нуля.
Разбор модулей, превращающих скрипт в автономного ассистента:
• Heartbeat & Cron: Как научить агента «просыпаться» самому и планировать будущие задачи.
• Reliable Delivery: Гарантированная доставка сообщений в Telegram/Discord через очереди с подтверждением.
• Multimodal Lanes: Именованные «линии» для параллельной обработки голоса, текста и генераций.
Учимся сами, учим агентов.
Архитектуру и лайфхаки Крабоводства обсуждаем в гараже Киберлобстеров-Крабоводоведов
#ClaudeCode #OpenClaw #обучение #Китай
———
@tsingular
1❤14✍12⚡6🔥6🤨1
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Notebook LM от Google теперь умеет создавать целые документалки из ваших источников
Они выкатили фичу Cinematic Video Overview. Если прошлая версия Video Overviews создавала только статические слайды, то тут вы получите на выходе полностью анимированный иммерсивный ролик.
Gemini 3 работает как режиссер, Nano Banana Pro генерирует референсы, и Veo 3 занимается видео-анимацией.
Выглядит прямо занятно. Конечно, это пока лишь скромный зачаток, но представьте: если сегодня NotebookLM превращает документы вот в такие кинематографические обзоры, то через пару лет мы сможем за минуты генерировать целые фильмы по любой теме. Вообразите эффект на образование.
Ну а пока фича доступна, к сожалению, только аккаунтам Ultra и только на английском.
Они выкатили фичу Cinematic Video Overview. Если прошлая версия Video Overviews создавала только статические слайды, то тут вы получите на выходе полностью анимированный иммерсивный ролик.
Gemini 3 работает как режиссер, Nano Banana Pro генерирует референсы, и Veo 3 занимается видео-анимацией.
Выглядит прямо занятно. Конечно, это пока лишь скромный зачаток, но представьте: если сегодня NotebookLM превращает документы вот в такие кинематографические обзоры, то через пару лет мы сможем за минуты генерировать целые фильмы по любой теме. Вообразите эффект на образование.
Ну а пока фича доступна, к сожалению, только аккаунтам Ultra и только на английском.
Docker Model Runner добавляет поддержку vLLM на macOS
Наконец-то на улице Apple Silicon праздник, - docker выпустил контейнер с vLLM для чипов M1-M4.
Теперь не только владельцы NVidia смогут запускать модели быстро, like а Pro :). 🍏
🦾 Главный инженерный плюс: Движок vllm-metal объединяет MLX и PyTorch в единую цепь вычислений.
Эффект от Zero-copy тензоров позволяет экономить на задержках особенно при росте контекста. 🛠
📈 По цифрам: На Llama 3.2 1B (4-bit) этот стек выдает около 280 токенов в секунду. Совместимость с OpenAI API полная — значит, кодовые-агенты вроде opencode или Крабов подключаются одной командой.
💡 Зачем это нам: Повышение скорости инференса на обычном макбуке с профессиональным управлением KV-кэшем и paged attention.
Удобно дебажить рои агентов прямо в самолете. 🦾
Изучаем документацию и поднимаем.
#vLLM #AppleSilicon #Docker #MLX #AI #Inference
———
@tsingular
Наконец-то на улице Apple Silicon праздник, - docker выпустил контейнер с vLLM для чипов M1-M4.
Теперь не только владельцы NVidia смогут запускать модели быстро, like а Pro :). 🍏
🦾 Главный инженерный плюс: Движок vllm-metal объединяет MLX и PyTorch в единую цепь вычислений.
Эффект от Zero-copy тензоров позволяет экономить на задержках особенно при росте контекста. 🛠
📈 По цифрам: На Llama 3.2 1B (4-bit) этот стек выдает около 280 токенов в секунду. Совместимость с OpenAI API полная — значит, кодовые-агенты вроде opencode или Крабов подключаются одной командой.
💡 Зачем это нам: Повышение скорости инференса на обычном макбуке с профессиональным управлением KV-кэшем и paged attention.
Удобно дебажить рои агентов прямо в самолете. 🦾
Изучаем документацию и поднимаем.
#vLLM #AppleSilicon #Docker #MLX #AI #Inference
———
@tsingular
🔥13✍3 3
Forwarded from e/acc
Самый главный инсайт про агентов в бизнесе:
Мы верили, что система автоматизирует и упростит процесс работы. В реальности же, на примере программирования, мы получили настолько мощный инструмент, что 100% инженерам пришлось менять свой процесс. Вместо «внедрения» пришлось выстраивать процесс вокруг агентов.
Ровно то же самое произойдет со всеми остальными офисными функциями. То, что происходит сейчас с инженерными командами, в течении 3-18 месяцев случится с остальными функциями: кардинальная перестройка, новые узкие места, переизобретение процесса, борьба за надежность и качество с энтропией, увеличение эффективности в разы.
Мы верили, что система автоматизирует и упростит процесс работы. В реальности же, на примере программирования, мы получили настолько мощный инструмент, что 100% инженерам пришлось менять свой процесс. Вместо «внедрения» пришлось выстраивать процесс вокруг агентов.
Ровно то же самое произойдет со всеми остальными офисными функциями. То, что происходит сейчас с инженерными командами, в течении 3-18 месяцев случится с остальными функциями: кардинальная перестройка, новые узкие места, переизобретение процесса, борьба за надежность и качество с энтропией, увеличение эффективности в разы.
👍15🔥8💯8
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Австралийская Cortical Labs подключила лабораторно выращенные нейроны человека к биологическому компьютеру и заставила их пройти Doom.
Нейроны получили из клеток кожи и крови взрослых доноров методом репрограммирования. Затем их подключили к специализированному биокомпьютеру CL1.
И по итогу - нейроны превзошли GPT-4 по скорости реакции и латентности. Небольшой сгусток живой ткани адаптировался к задаче быстрее, чем большая языковая модель.
Кстати, предыдущий эксперимент той же команды с Pong занял больше года.
На этом месте рядовая новость про лабораторные эксперименты обычно заканчивается, но Cortical Labs открыли облачный доступ к CL1, вовсю пилят SDK и планируют продавать биокомпьютер как устройство.
Команда позиционирует платформу как инструмент для медицинских исследований: моделирование нейродегенеративных заболеваний, тестирование препаратов, изучение механизмов восстановления нейронных функций.
Нейроны не обладают сознанием (по крайней мере, в Cortical Labs на это рассчитывают), но они происходят от живых людей и демонстрируют поведение, которое очень похоже на обучение.
Граница между биологической моделью и чем-то большим пока не определена ни юридически, ни этически. Никто всерьез не обсуждает, где эта граница проходит и, самое главное, что делать, когда системы станут сложнее.
Пока это первые шаги, но направление задано.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯62👀24❤9 9✍5👍3🆒2🔥1
Cursor Automations: Дом Тысячи Крабов
Cursor выкатил Automations — систему для создания «вечно включенных» ИИ агентов.
🛠 Что это дает:
• Событийная модель: Агент просыпается не по клику, а по триггеру: сообщение в Slack, новый issue в Linear, мердж в GitHub или инцидент в PagerDuty.
• Облачные песочницы: При срабатывании агент разворачивает облачный sandbox, сам билдит код, запускает тесты через MCP и верифицирует результат перед тем, как прийти к человеку.
• Память: У агентов появился инструмент
💡 Где это реально работает:
• Авто-ревьюеры: Проверка безопасности на каждый пуш в main. Если риск низкий — авто-аппрув, если высокий — алерт в Slack с детальным отчетом.
• Incident Response: При падении системы агент лезет в логи Datadog, сопоставляет их с последними коммитами и выкатывает PR с фиксом до того, как дежурный инженер успеет допить кофе.
• Рутина: Сборка еженедельных дайджестов из Jira/Slack/GitHub или автоматическая допись тестов для свежего кода.
По сути, если один из триггеров сделать по аналогии с Heartbeat у Openclaw,- получим живых облачных кодовых агентов.
#Cursor #AI #Agents #CI #Automation #DevOps
------
@tsingular
Cursor выкатил Automations — систему для создания «вечно включенных» ИИ агентов.
🛠 Что это дает:
• Событийная модель: Агент просыпается не по клику, а по триггеру: сообщение в Slack, новый issue в Linear, мердж в GitHub или инцидент в PagerDuty.
• Облачные песочницы: При срабатывании агент разворачивает облачный sandbox, сам билдит код, запускает тесты через MCP и верифицирует результат перед тем, как прийти к человеку.
• Память: У агентов появился инструмент
memory, позволяющий учиться на прошлых запусках и не совершать одни и те же ошибки в ревью. 🧠💡 Где это реально работает:
• Авто-ревьюеры: Проверка безопасности на каждый пуш в main. Если риск низкий — авто-аппрув, если высокий — алерт в Slack с детальным отчетом.
• Incident Response: При падении системы агент лезет в логи Datadog, сопоставляет их с последними коммитами и выкатывает PR с фиксом до того, как дежурный инженер успеет допить кофе.
• Рутина: Сборка еженедельных дайджестов из Jira/Slack/GitHub или автоматическая допись тестов для свежего кода.
По сути, если один из триггеров сделать по аналогии с Heartbeat у Openclaw,- получим живых облачных кодовых агентов.
#Cursor #AI #Agents #CI #Automation #DevOps
------
@tsingular
⚡7🔥7❤2👍2🆒1