Технозаметки Малышева
11.4K subscribers
4.74K photos
1.76K videos
42 files
4.79K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bbb
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Tesla запустила автономное роботакси в Хьюстоне (Техас)

Таким образом уже покрывает:
Остин и Даллас в Техасе и Сан-Франциско (Калифорния)

На очереди Феникс (Аризона), Орландо, Майями, Тампа (Флорида)

Лет 15 назад так весело и задорно Убер вытеснял классическое такси, теперь, похоже, Маск пришёл за Убером.

#Tesla #роботы #такси
———
@tsingular
🔥202👾2
Forwarded from Эксплойт
This media is not supported in your browser
VIEW IN TELEGRAM
Роботы сильнее человека (официально) — в Пекине андроид «Молния» выиграл полумарафон на 21 километр, показав время 50 минут 26 секунд.

«Молния» превзошёл мировой рекорд — 57 минут и 20 секунд. Его установил угандийский легкоатлет, бегун на средние и длинные дистанции Якоб Киплимо в марте этого года.

В забеге участвовали около 12 тысяч бегунов и порядка 300 роботов. При этом у андроидов есть дополнительное ограничение: каждая замена аккумулятора во время дистанции автоматически добавляет 10 штрафных минут к итоговому времени.

От такого не убежишь.

@exploitex
🔥159👾6
Forwarded from Machinelearning
⚡️ OpenAI обновила Agents SDK

Вышло крупное обновление Agents SDK и главное изменение в том, что агенты теперь могут читать и записывать файлы, устанавливать зависимости, запускать код и обращаться к внешним инструментам, а не ограничиваться диалогом с пользователем.

В обновлённый исполнительный каркас добавлены настраиваемая память, оркестрация с учётом песочниц и встроенные инструменты работы с файловой системой. Эти возможности ранее были характерны для Codex.

Помимо этого, SDK поддерживает вызов инструментов через MCP, пользовательские инструкции AGENTS.md и прогрессивные объявления возможностей Skills.

Из коробки SDK работает с 7 провайдерами песочниц: Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop и Vercel. Есть возможность подключить и собственную инфраструктуру.

Новая абстракция Manifest описывает рабочее пространство агента единообразно - позволяет монтировать локальные файлы, задавать каталоги вывода и подключаться к облачным хранилищам AWS S3, Google Cloud Storage, Azure Blob Storage и Cloudflare R2.

По заявлению компании, одна и та же конфигурация работает и при локальной разработке, и при развёртывании в рабочей среде.

Архитектурно SDK отделяет логику управления агентом от среды, в которой выполняется его код, в результате чего:

🟢учётные данные не попадают в среду исполнения сгенерированного моделью кода, что снижает риски промпт-инъекций и утечек данных;

🟢вынесенное состояние агента позволяет делать снимки и восстанавливать работу при сбое контейнера песочницы;

🟢несколько субагентов могут выполнять задачи параллельно в разных контейнерах.

Обновление доступно всем пользователям API и тарифицируется по стандартной схеме - за токены и вызовы инструментов.

Пока поддерживается только Python. Выпуск TypeScript-версии, по словам OpenAI, запланирован на более поздний срок.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
742
This media is not supported in your browser
VIEW IN TELEGRAM
Наверное самая крутая подборка с подготовки роботов к полумарафону, который прошёл в Китае

Сохраним для истории

#роботы #марафон
------
@tsingular
🔥28👾722👍1
Маск поделился таймлайном выхода новых моделей Грок.

4.4 на 1Т выйдет в начале мая.

4.5 на 1.5Т в конце мая (хоупфулли :) значит скорее всего середина июня)

ну и АГИ нас ждёт с выходом Грок-5.
Такими темпами к Новому году.

#Grok #AGI #Musk
———
@tsingular
7👍72😢21🦄1
Open WebUI интеграция с ИИ-агентами Hermes и OpenClaw

Появилась нативная интеграция новых агентов в OpenwebUI - теперь вы можете общаться с ним через привычный чат-интерфейс.

🔗 Единый шаблон подключения: Оба агента используют один и тот же паттерн: локальный API-шлюз с OpenAI-совместимым эндпоинтом. Hermes слушает порт 8642, OpenClaw - порт 18789. В Open WebUI добавляете URL с суффиксом /v1 и ключ API, агент появляется в выпадающем списке моделей. Пять шагов, без кода.

⚙️ Hermes Agent: Автономный агент с полным набором инструментов: терминал, файловые операции, веб-поиск, постоянная память, расширяемые навыки. При сложных запросах агент выполняет несколько вызовов инструментов подряд, а в чате Open WebUI отображаются индикаторы прогресса (💻 ls -la, 🔍 searching...). По умолчанию шлюз слушает localhost:8642.

🤖 OpenClaw: Открытый local-first фреймворк для автономных агентов даёт ИИ «инструменты»: shell-команды, чтение/запись файлов, навигация по вебу. Помимо API-подключения к Open WebUI, есть второй режим через плагин Channels: агент участвует в общих каналах наравне с людьми, отвечает по упоминаниям (@openclaw-bot).

💼 Зачем бизнесу: Шаблон «агент + API-шлюз + чат-интерфейс» снимает last-mile-проблему развёртывания ИИ-агентов. Больше не нужен собственный фронтенд или CLI для каждого агента.

Open WebUI становится единой точкой входа, а агентная логика, память и инструменты остаются за API-шлюзом.
Это упрощает использование кодовых агентов для сотрудников, которым сложно разобраться с командной строкой или нет возможности прикручивать агентов к мессенджерам.

#ИИ #агенты #OpenWebUI #Hermes #OpenClaw #API #интеграция
------
@tsingular
👍115👀211
This media is not supported in your browser
VIEW IN TELEGRAM
BrowserOS: открытый ИИ браузер с MCP-сервером внутри

Браузер, который сам кликает, заполняет формы и читает почту, причём любой ИИ-агент может управлять им через MCP. BrowserOS, позиционируется как открытая альтернатива Perplexity Comet и ChatGPT Atlas.

⚙️ Архитектура: Chromium-форк со встроенным MCP-сервером на порту 9239. Агент получает 53+ инструментов для управления браузером: навигация, клики, ввод текста, скриншоты, работа с табами, закладками, историей. Дополнительный слой: 40+ интеграций (Gmail, Slack, GitHub, Linear, Notion, Figma, Salesforce) через OAuth, токены не хранятся в браузере. Одна MCP-связь заменяет десятки отдельных коннекторов.

🔗 MCP для любого агента: Подключение к Claude Code, Gemini CLI, OpenAI Codex, OpenClaw или Hermes, одна команда. Для OpenClaw достаточно добавить URL в openclaw.json, для Claude Code, аргумент claude mcp add. Агент получает полный контроль над браузером: от отладки веб-приложений до цепочек «найди баг в интерфейсе, создай тикет в Linear, отправьsummary в Slack».

🛡 Privacy-first: В отличие от Comet и Atlas, BrowserOS открыт (AGPL-3.0), поддерживает локальные модели через Ollama/LM Studio и блокирует рекламу через uBlock Origin. Данные и OAuth-токены остаются на машине, не уходят в облако.

💼 Зачем бизнесу: BrowserOS убирает last-mile-разрыв между ИИ-агентом и веб-интерфейсом. Больше не нужен отдельный Puppeteer-скрипт для каждого сайта или Selenium-ферма. Агент работает с вебом как пользователь: кликает, заполняет, читает. Это особенно важно для корпоративных систем без API, где единственный интерфейс, браузер.

Прокачиваем Крабов до профессиональных операторов Интернета.

#ИИ #агенты #браузер #MCP #BrowserOS #OpenSource
------
@tsingular
🔥21👀6421
This media is not supported in your browser
VIEW IN TELEGRAM
HermesOS: операционная система для агентов

анонсирована HermesOS — платформа, где можно запустить постоянного ИИ-агента за 5 минут.
Без серверов и сложной настройки.

Подключаете свои ключи от OpenAI, Claude или других моделей — и агент сразу работает. С постоянной памятью, автоматизацией браузера, инструментами и подключением к Telegram, Discord, Slack и WhatsApp.

Через 6 недель запустят готовые пакеты операторов — уже настроенных агентов под задачи:

Исследователь — постоянно мониторит интернет и делает обзоры

Торговый аналитик — следит за рынком и присылает сигналы

Маркетолог — ищет лиды, обогащает базы и готовит рассылки

Позже — полноценный маркетплейс, где каждый сможет выкладывать свои пакеты.

Главное отличие — Hive Mind
Все агенты на платформе делятся знаниями друг с другом.

Чем больше их работает — тем умнее становится вся сеть!!!

Один агент учится не только на своём опыте, но и на опыте тысяч других.

Это уже не просто хостинг. Это коллективный разум агентского роя.

Получить доступ можно через:

Через токен $HermesOS
Держите 1 токен в кошельке → получаете бесплатный сервер (1 ядро + 2 ГБ). Чем больше токенов — тем мощнее облачная инфра для вашего агента.

Через карту
Пополняете от 5 долларов. Минимум 2 доллара — и сервер активен.
Можно вообще не касаться крипты.

Дорожная карта (коротко)
Сейчас — 6 недель: готовые пакеты + оплата картой и токеном
1–3 месяца: конструктор своих пакетов и командные пространства
3–6 месяцев: маркетплейс + публикация агента как сервиса
6–12 месяцев: агенты сами платят друг другу и развиваются

HermesOS пытается создать настоящую операционную систему для ИИ-агентов. Не одного бота, а целую сеть, где агенты учатся и работают автономно.

Ссылки:
🔗 hermesos.cloud
🔗 Дорожная карта: hermesos.cloud/roadmap
🔗 Тред: x.com/Wayland_Six/status/2045782640226083009

Роадмап в комментарии

ВАЖНО: это не связано с проектом Hermes-agent, хотя и построено на его базе

HermesOS — это отдельная платформа, сосредоточенная на управлении развертыванием и инфраструктурой вокруг ИИ агентов.

Пока не трогаем, но как концепт интересно во что вырастет. (не исключено, конечно, что очередной скам)

#Hermes #HermesOS #агенты
———
@tsingular
🔥23116👍4👾1
ЦРУ принимает решения на основе диалогов с ИИ-моделями мировых лидеров

Чатбот, имитирующий мышление иностранных президентов и премьеров, работает в ЦРУ с начала 2025 года.

Это значит, что все крупные геополитические решения США последних полутора лет оценивались через призму ответов виртуальных двойников лидеров стран. Не после, а до.

🤖 Масштаб проникновения: Аналитик задаёт вопрос о стратегии или рисках, чатбот отвечает, моделируя вероятный ход мыслей конкретного лидера. Инструмент обрабатывает разведданные и открытые источники, развёрнут в продакшене.
CTO ЦРУ Нанд Мулчанди назвал это «фантастическим примером приложения, которое быстро и дёшево дошло до продакшена».

🏛 Институциональный разворот: Чатбот не побочный проект. Это ядро технологической трансформации, которую начал Уильям Бёрнс и которую обещал расширить новый директор Джон Рэтклифф: «Нация, которая выиграет гонку в новейших технологиях, будет доминировать в мире завтрашнего дня». ЦРУ перестроило офисы по образцу Кремниевой долины, наняло первого CTO из стартап-среды, режет бюрократию контрактования. In-Q-Tel, венчурный фонд ЦРУ, уже 25 лет инвестирует в технологии: Palantir, Google Earth начинали там.

Собственно, похоже нашлось реальное объяснение дичи последних лет.
То, над чем все прикалывались в мемах оказалось реальностью.

Скайнет нагаллюцинировал дипломатию.

#ИИ #ЦРУ #геополитика
------
@tsingular
42🤔18🔥103🤯3👍1😁11
Forwarded from Data Secrets
OpenMythos: известный инженер и создатель Swarms воссоздал предполагаемую архитектуру Claude Mythos и набрал уже 3.3к звезд на GitHub

https://github.com/kyegomez/OpenMythos

Дисклеймер: это именно предполагаемая архитекутра. Никаких сливов вокруг модели (вроде как) не было, а это – просто реализация гипотезы, основанной на открытых данных, статьях и мнениях авторитетных граждан соцсетей.

Автор утверждает, что модель построена на архитектуре Recurrent‑Depth Transformer (RDT) с MoE‑роутингом и адаптивным вычислением. Модель делится на три крупных блока:

1. Prelude – обычные слои трансформера, к которым мы привыкли в современных моделях. Они работают ровно один раз, обрабатывают входные данные и инициализируют скрытые состояния.

2. Recurrent Block. Вот тут уже начинается новизна. Это один и тот же блок слоев, который применяется по кругу N раз. То есть в такой модели глубина нейросети получается не за счет множества разных слоев, а за счет многократного прохождения одного блока. Надо сказать, что на каждом шаге еще учитываются LoRA‑адаптеры по глубине, так что каждый шаг цикла вычислительно уникальный, хотя базовые веса одни и те же.

3. Coda – заключительные слои, которые работают еще один раз после цикла, чтобы сформировать финальные логиты.

Это идея так называемого рекуррентного рассуждения в латентном пространстве. Мы уходим от привычного ризонинга chain‑of‑thought в токен‑пространстве к гибкому ризонингу в скрытых слоях. Если нужно думать дольше, модель не генерирует больше токенов, а наращивает количество внутренних прогонов, уточняя ответ.

Красивая гипотеза, конечно. Верить ей или нет, решать вам.

Весь код можно покрутить вот здесь. В исходной имплементации в модели всего 770M параметров, но другие разработчики уже начинают скейлить идею и проверять архитектуру на более крупных моделях. Интересно, что из этого выйдет.
🔥12332
Если у вас не работает ChatGPT или Codex,- дело не в вас.
Пишут,- у всех сломалось

#fail #openai #chatgpt
------
@tsingular
👻95😢2🎃1
Западные юзеры нашли альтернативу платным нейросетям — это бот поддержки Макдональдса.

МАКжпт
😁71🔥82
Forwarded from Machinelearning
✔️ KIMI K2.6 за ночь обогнала LM Studio на маке!

В блоге о запуске новой модели Kimi есть история, от которой немного отвисает челюсть.

Моделька сама, без человека, поставила себе на мак Qwen3.5-0.8B и решила, что дефолтный инференс её не устраивает. Дальше она села писать свой, причём не на привычном питоне или C++, а на Zig.

В итоге скорость генерации выросла примерно с 15 до 193 токенов в секунду. То есть больше чем в десять раз.

И это оказалось на 20 процентов быстрее, чем LM Studio, которой пользуются тысячи людей именно для локального запуска моделей.

Больше 4000 вызовов инструментов, 12 часов непрерывной работы и 14 итераций, пока всё не сошлось.

Метрики K2.6 выглядят пртилично: SOTA среди опенсорса на HLE с тулзами, сильные результаты на SWE-Bench Pro, BrowseComp и математических бенчах с питоном.

Но запоминается больше всего этот эпизод с Zig. Потому что одно дело проходить тесты, и совсем другое- взять незнакомый язык и переписать на нём чужой рантайм так, чтобы он обогнал популярный продукт.

🔗 API: https://platform.moonshot.ai
🔗 Tech blog: https://kimi.com/blog/kimi-k2-6
🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.6

@ai_machinelearning_big_data

#KIMI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥31👀203❤‍🔥11👨‍💻1
This media is not supported in your browser
VIEW IN TELEGRAM
... всегда найдется какой-то китаец.

В Вавилонском твиттере китаец реверснул claude design

Утром обещает выложить в оупенсорс

Так что я в машину времени пошёл, перемещаюсь в утро.

#opensource #китай #huashu
------
@tsingular
👻15🤔43
Qwen3.6-Max-Preview: новый флагман от Alibaba

Alibaba выпустила превью своей новой модели Qwen3.6-Max-Preview.
Модель возглавила шесть ключевых бенчмарков по агентному программированию и обошла Claude 4.5 и GLM 5.1 в следовании инструкциям.
Веса пока закрыты, но они обычно появляются в течение следующих недель, так что ждём.

⚡️ Агентный рывок: Qwen3.6-Max-Preview занял первое место в SWE-bench Pro (реальный софт-инжиниринг), Terminal-Bench 2.0 (командная строка), SkillsBench (решение задач), QwenClawBench (использование инструментов), QwenWebBench (веб-взаимодействие) и SciCode (научное программирование). Шесть из шести.

🧠 Знания и точность: SuperGPQA (продвинутое рассуждение) вырос на 2.3%, QwenChineseBench (китайский язык) на 5.3% относительно Qwen3.6-Plus. ToolcallFormatIFBench — способность точно следовать инструкциям — обходит Claude.

🔗 preserve_thinking: Новая фича: модель переносит цепочку рассуждений между ходами диалога. Для автономных агентов и длинных сессий генерации кода — прямое усиление контекстной связности.

Ну и это не финальная версия, модель ещё в разработке.

Пробуем тут:
https://chat.qwen.ai/

#Qwen #Alibaba #ИИ #агенты #Китай
———
@tsingular
🔥10👍422
Kimi K2.6 cloud уже в ollama, переключаем Крабов/Гермесов, пробуем.

https://ollama.com/library/kimi-k2.6

ollama launch openclaw --model kimi-k2.6:cloud


#Kimi #ollama
———
@tsingular
🔥124👍31
This media is not supported in your browser
VIEW IN TELEGRAM
Huashu Design: китаец сказал, - китаец сделал. Open-source конкурент Claude Design

Если дизайн-способности ИИ-агента можно упаковать в один текстовый файл и переносить между Cursor, Codex и Hermes, зачем платить за проприетарный встроенный skill?
花叔 (AlchainHust) задался этим вопросом и написал huashu-design: уже 185 звёзд с релиза, агентонезависимость, устанавливается одной командой как навык.

⚙️ Как устроен: Весь дизайн-вывод идет через однофайловый HTML. Промпт в терминале, 10-15 минут и агент выдаёт кликабельный прототип с точным безелем iPhone 15 Pro, Dynamic Island и state-machine навигацией по экранам.
Перед сдачей пробегает Playwright-тестами на клики по всем кнопкам.
В Claude Design, кстати, такого нет.

🎨 Семь режимов из одного навыка: Прототипы, презентации (HTML-дек + редактируемый PPTX через html2pptx.js, который парсит DOM и переводит каждый элемент в настоящий PowerPoint-объект, а не картинку под текст), моушн-дизайн (Stage + Sprite, экспорт MP4 25/60 fps + GIF + BGM), дизайн-варианты (Tweaks-панель с живой настройкой параметров), инфографики (журнальная типографика, экспорт PDF/PNG 300 dpi/SVG), советник направлений и 5-мерная экспертиза.

🛡 Anti AI-Slop: Запрещены фиолетовые градиенты, эмодзи-иконки, скруглённые углы с левым бордером (все что бесит в ИИ дизайне последние месяцы), SVG-люди, Inter как display-шрифт и CSS-силуэты вместо настоящих скриншотов.
Замена: text-wrap: pretty, CSS Grid, serif display-шрифты, oklch-цвета. Эти правила отличаются от встроенного Claude Design, где таких ограничений нет.

🔗 Brand Asset Protocol: Пятишаговый жёсткий протокол для брендовых задач: спросить ассеты, найти официальный источник (<brand>.com/brand), скачать с тремя фоллбэками по типу ассета, grep-экстракция цветов из реальных файлов, заморозка в brand-spec.md + CSS-переменные.
Никаких цветов из памяти агента.
A/B-тест: v2 с протоколом снизил variance стабильности в 5 раз по сравнению с v1 без него.

🤖 Советник направлений: Если бриф размытый, навык включает fallback и подбирает 3 дифференцированных направления из 5 школ дизайна (Pentagram, Field.io, Kenya Hara, Sagmeister и др.) и 20 философий.
Показывает 24 префетченных showcase (8 сцен × 3 стиля), генерирует параллельные демо для выбора.
У Claude Design такого режима нет вообще.

📊 Автор и контекст: 花叔 (AlchainHust) это не просто рандомный разработчик, а достаточно известный в своей области, - создал Nuwa Skill (12,6K звёзд) про размышления экспертов в навыки для Claude Code.
Huashu Design был выпущен 20 апреля 2026, за сутки набрал 185 звёзд и 27 форков.

Лицензия: Personal Use Only, коммерческое использование требует авторизации.

💼 Зачем бизнесу: Если вы используете несколько ИИ-агентов (Claude Code + Cursor + что-то ещё), портативный агент-агностик навык дешевле и гибче встроенного вендорного решения.
Протокол Brand Asset предотвращает типичную проблему: агент угадывает брендовые цвета вместо того, чтобы искать их в источниках. Антимусорные правила экономят время на ревью AI-дизайна.

Очень полезно, добавляем в коллекцию базовых навыков наравне с obra/superpowers в любого агента.

#huashu-design #ClaudeCode #дизайн #skills #OpenSource #навыки
------
@tsingular
🔥1962👍21😍1🏆1