Forwarded from Machinelearning
Anthropic перенесла часть инженерной культуры: тестирование, бенчмаркинг и итеративность в процесс создания навыков и для этого теперь не нужно уметь писать код.
В skill-creator добавили автоматические тесты, бенчмарки и A/B-сравнения и теперь создатели навыков могут измерить, работает ли skill, до его запуска в продакшен.
Автор задает тестовые промпты и описывает, как выглядит нужный результат. Skill-creator запускает их параллельно: с навыком и без него.
Независимый агент-сравниватель оценивает результаты вслепую, не зная, какая версия перед ним, и сразу показывает, дает ли навык реальный прирост.
Внутренние тесты Anthropic: точность PDF-навыка выросла с 6/8 до 7/8, Excel-навыка - с 6/8 до полных 8/8.
Отдельный бенчмарк-режим дает детальную картину по каждому прогону: процент успешных тестов, время выполнения, расход токенов.
На примере PDF-навыка при работе с незаполняемыми формами и таблицами из многостраничных документов успешность выросла с 40 до 100% (при том же времени выполнения).
Если базовая модель начинает проходить тесты без загруженного навыка - это сигнал о том, что навык уже есть в ее поведении и skill можно отключить. Результаты тестов хранятся локально и интегрируются в CI-системы.
Claude решает, когда подключить навык, исключительно по короткому текстовому описанию в системном промпте.
Skill-creator теперь анализирует эти описания против тестовых промптов и предлагает правки, снижающие и ложные срабатывания и пропуски.
По результатам внутреннего прогона триггеринг стал лучше на 5 из 6 публичных навыков.
Все обновления уже доступны в вебе и Cowork. Для Claude Code обновили плагин или вот он же - в репозитории, если ставить руками.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6✍2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
🛡 Noble Machines: промышленные роботы от инженеров SpaceX и Apple
Выходцы из SpaceX и Apple представили Noble Machines — систему, превращающую стандартных промышленных роботов в «умных помощников на производстве».
#роботы #SpaceX #NobleMachines
------
@tsingular
Выходцы из SpaceX и Apple представили Noble Machines — систему, превращающую стандартных промышленных роботов в «умных помощников на производстве».
#роботы #SpaceX #NobleMachines
------
@tsingular
⚡9🔥4🤝2👾1
Forwarded from Топ кибербезопасности Батранкова
Интересно, что Минпромторг предоставляет видеокарты в аренду. Тарифицируется по схеме: число используемых карт в день. Причем, это очень необычно от госоргана. Для тех, кому надо обсчитывать модели - очень полезно. Смотрите
#ИИ #AI #Облака
#ИИ #AI #Облака
✍14⚡7❤1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI Symphony: управление навыками ИИ агента как процесс
OpenAI выкатили opensourse (sic!) фреймворк в кои то веки.
Это прототип попытки управления процессом агентских навыков.
Устанавливать, наверное рановато, ну только если вы не ИИ первопроходец и пионер :)
Но вот изучить и почитать полезно.
🎻 Архитектура: Сервис работает как демон. Основа — разделение на слои: загрузчик воркфлоу, клиент трекера (Linear), менеджер рабочих пространств и ранер агента.
🛠 In-repo Policy: Инструкции и настройки модели лежат в файле
🛡 Протокол: Общение с агентом идет по JSON-RPC через стандартный ввод-вывод (stdio). Описаны строгие методы:
⚙️ Надежность: Система восстанавливается после перезапуска без внешней базы данных. Состояние читается из трекера задач и файловой системы. Предусмотрена детекция зависаний (Stall Detection) и автоматические повторы.
📊 Контроль: Оркестратор жестко ограничивает конкурентность. Доступен мониторинг потребления токенов и лимитов через встроенный HTTP API.
Интересно, что они не пытаются сделать n8n для агентов,- в спеке четко прописано что WebUI - вне планов.
#AI #Symphony #Engineering #OpenAI #Automation
------
@tsingular
OpenAI выкатили opensourse (sic!) фреймворк в кои то веки.
Это прототип попытки управления процессом агентских навыков.
Устанавливать, наверное рановато, ну только если вы не ИИ первопроходец и пионер :)
Но вот изучить и почитать полезно.
🎻 Архитектура: Сервис работает как демон. Основа — разделение на слои: загрузчик воркфлоу, клиент трекера (Linear), менеджер рабочих пространств и ранер агента.
🛠 In-repo Policy: Инструкции и настройки модели лежат в файле
WORKFLOW.md внутри репозитория. Команда версионирует логику агента вместе с кодом. Опирается на Harness Engineering.🛡 Протокол: Общение с агентом идет по JSON-RPC через стандартный ввод-вывод (stdio). Описаны строгие методы:
initialize, thread/start, turn/start. Это исключает вольную интерпретацию команд.⚙️ Надежность: Система восстанавливается после перезапуска без внешней базы данных. Состояние читается из трекера задач и файловой системы. Предусмотрена детекция зависаний (Stall Detection) и автоматические повторы.
📊 Контроль: Оркестратор жестко ограничивает конкурентность. Доступен мониторинг потребления токенов и лимитов через встроенный HTTP API.
Интересно, что они не пытаются сделать n8n для агентов,- в спеке четко прописано что WebUI - вне планов.
#AI #Symphony #Engineering #OpenAI #Automation
------
@tsingular
✍6❤3⚡1🆒1
IBM и архитектура цифрового суверенитета
IBM продвигает архитектуру цифрового суверинитета. Если раньше «цифровой суверенитет» был больше сферой юридической, то теперь это все больше переходит на физический уровень.
С учётом геополитической динамики, перспективы цифровой изоляции уже не кажутся далекими и для этого нужна инфраструктура.
Версия от IBM может выступить эталоном на корпоративном уровне.
🛡 Многоуровневый контроль: IBM делит суверенитет на данные (где лежат), операции (кто держит рубильник) и софт (кто владеет ключами). Если у вендора есть хоть одна лазейка к ключам шифрования — всё остальное превращается в маркетинговую тыкву.
🌍 Резиденство vs Юрисдикция: Факт того, что сервер стоит в Берлине, не делает данные немецкими. Важно, чья проверка (цифровая или физическая) имеет право постучать в дверь дата-центра.
IBM топит за «распределенные облака» (distributed cloud), где ИИ-стек живет у вас, а гибкость при этом остается облачной.
🧠 ИИ-страховка: Суверенитет сейчас, в том числе, это защита обучения своих ИИ моделей и агентов.
Скармливать проприетарные данные чужим моделям в «серых» юрисдикциях больше никто не хочет.
IBM подчеркивает: ИИ требует быстрой и защищенной инфраструктуры там, где данные возникают для обучения моделей "на местах".
💼 Бизнес аспекты: акцент делается на управлении рисками.
Данные, инфраструктура, доступ, ИИ модели становятся изолированными.
🔮 Будущее: Сплинтернет в действии.
Интернет задумывался как стирание границ, но через 40 лет мы пришли к их закрытию.
Облака становятся цифровыми посольствами с жестким периметром.
Каждая страна, - своя локалка.
#IBM #DataSovereignty #Cloud #cyberecurity
———
@tsingular
IBM продвигает архитектуру цифрового суверинитета. Если раньше «цифровой суверенитет» был больше сферой юридической, то теперь это все больше переходит на физический уровень.
С учётом геополитической динамики, перспективы цифровой изоляции уже не кажутся далекими и для этого нужна инфраструктура.
Версия от IBM может выступить эталоном на корпоративном уровне.
🛡 Многоуровневый контроль: IBM делит суверенитет на данные (где лежат), операции (кто держит рубильник) и софт (кто владеет ключами). Если у вендора есть хоть одна лазейка к ключам шифрования — всё остальное превращается в маркетинговую тыкву.
🌍 Резиденство vs Юрисдикция: Факт того, что сервер стоит в Берлине, не делает данные немецкими. Важно, чья проверка (цифровая или физическая) имеет право постучать в дверь дата-центра.
IBM топит за «распределенные облака» (distributed cloud), где ИИ-стек живет у вас, а гибкость при этом остается облачной.
🧠 ИИ-страховка: Суверенитет сейчас, в том числе, это защита обучения своих ИИ моделей и агентов.
Скармливать проприетарные данные чужим моделям в «серых» юрисдикциях больше никто не хочет.
IBM подчеркивает: ИИ требует быстрой и защищенной инфраструктуры там, где данные возникают для обучения моделей "на местах".
💼 Бизнес аспекты: акцент делается на управлении рисками.
Данные, инфраструктура, доступ, ИИ модели становятся изолированными.
🔮 Будущее: Сплинтернет в действии.
Интернет задумывался как стирание границ, но через 40 лет мы пришли к их закрытию.
Облака становятся цифровыми посольствами с жестким периметром.
Каждая страна, - своя локалка.
#IBM #DataSovereignty #Cloud #cyberecurity
———
@tsingular
😢7✍5🔥2❤1⚡1
Forwarded from Анализ данных (Data analysis)
BullshitBench v2, созданный Питером Гостевым, - это бенчмарк, который проверяет, способны ли модели ИИ распознавать бессмысленные запросы и отказываться на них отвечать, вместо того чтобы уверенно продолжать и «придумывать» ответ.
Только модели Claude от Anthropic и Qwen 3.5 от Alibaba показывают результат выше 60% по распознаванию бессмыслицы.
А модели OpenAI и Google? Застряли на месте и почти не улучшаются.
Еще более неожиданно: модели с усиленным рассуждением (reasoning), которые «думают дольше», на самом деле показывают худшие результаты. Они используют дополнительное вычисление не для того, чтобы отвергнуть бессмысленный запрос, а чтобы рационализировать и оправдать этот абсурд.
https://x.com/petergostev/status/2028492838082666780
Только модели Claude от Anthropic и Qwen 3.5 от Alibaba показывают результат выше 60% по распознаванию бессмыслицы.
А модели OpenAI и Google? Застряли на месте и почти не улучшаются.
Еще более неожиданно: модели с усиленным рассуждением (reasoning), которые «думают дольше», на самом деле показывают худшие результаты. Они используют дополнительное вычисление не для того, чтобы отвергнуть бессмысленный запрос, а чтобы рационализировать и оправдать этот абсурд.
https://x.com/petergostev/status/2028492838082666780
⚡14🤔7✍3
📖 Архитектура Claude Code и Openclaw от А до Я
shareAI-lab выкатили два эталонных туториала, которые разбирают механику современных агентов «до винтика». Если хотите понять, как ClaudeCode и OpenClaw устроен изнутри, - правильное место для начала.
🎓 learn-claude-code — 12 сессий по сборке nano-Claude-Code.
• Planning: Как заставить модель сначала писать Todo-лист, а потом код (в 2 раза повышает выполняемость задач).
• Context Compression: Трехуровневая стратегия сжатия для «бесконечных» сессий.
• Isolation: Выполнение задач в отдельных ветках
🦞 claw0 — Пошаговое создание ИИ-краба с нуля.
Разбор модулей, превращающих скрипт в автономного ассистента:
• Heartbeat & Cron: Как научить агента «просыпаться» самому и планировать будущие задачи.
• Reliable Delivery: Гарантированная доставка сообщений в Telegram/Discord через очереди с подтверждением.
• Multimodal Lanes: Именованные «линии» для параллельной обработки голоса, текста и генераций.
Учимся сами, учим агентов.
Архитектуру и лайфхаки Крабоводства обсуждаем в гараже Киберлобстеров-Крабоводоведов
#ClaudeCode #OpenClaw #обучение #Китай
———
@tsingular
shareAI-lab выкатили два эталонных туториала, которые разбирают механику современных агентов «до винтика». Если хотите понять, как ClaudeCode и OpenClaw устроен изнутри, - правильное место для начала.
🎓 learn-claude-code — 12 сессий по сборке nano-Claude-Code.
• Planning: Как заставить модель сначала писать Todo-лист, а потом код (в 2 раза повышает выполняемость задач).
• Context Compression: Трехуровневая стратегия сжатия для «бесконечных» сессий.
• Isolation: Выполнение задач в отдельных ветках
git worktree, чтобы агент не разнес основной репозиторий.🦞 claw0 — Пошаговое создание ИИ-краба с нуля.
Разбор модулей, превращающих скрипт в автономного ассистента:
• Heartbeat & Cron: Как научить агента «просыпаться» самому и планировать будущие задачи.
• Reliable Delivery: Гарантированная доставка сообщений в Telegram/Discord через очереди с подтверждением.
• Multimodal Lanes: Именованные «линии» для параллельной обработки голоса, текста и генераций.
Учимся сами, учим агентов.
Архитектуру и лайфхаки Крабоводства обсуждаем в гараже Киберлобстеров-Крабоводоведов
#ClaudeCode #OpenClaw #обучение #Китай
———
@tsingular
1❤14✍9⚡6🔥6🤨1
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Notebook LM от Google теперь умеет создавать целые документалки из ваших источников
Они выкатили фичу Cinematic Video Overview. Если прошлая версия Video Overviews создавала только статические слайды, то тут вы получите на выходе полностью анимированный иммерсивный ролик.
Gemini 3 работает как режиссер, Nano Banana Pro генерирует референсы, и Veo 3 занимается видео-анимацией.
Выглядит прямо занятно. Конечно, это пока лишь скромный зачаток, но представьте: если сегодня NotebookLM превращает документы вот в такие кинематографические обзоры, то через пару лет мы сможем за минуты генерировать целые фильмы по любой теме. Вообразите эффект на образование.
Ну а пока фича доступна, к сожалению, только аккаунтам Ultra и только на английском.
Они выкатили фичу Cinematic Video Overview. Если прошлая версия Video Overviews создавала только статические слайды, то тут вы получите на выходе полностью анимированный иммерсивный ролик.
Gemini 3 работает как режиссер, Nano Banana Pro генерирует референсы, и Veo 3 занимается видео-анимацией.
Выглядит прямо занятно. Конечно, это пока лишь скромный зачаток, но представьте: если сегодня NotebookLM превращает документы вот в такие кинематографические обзоры, то через пару лет мы сможем за минуты генерировать целые фильмы по любой теме. Вообразите эффект на образование.
Ну а пока фича доступна, к сожалению, только аккаунтам Ultra и только на английском.
Docker Model Runner добавляет поддержку vLLM на macOS
Наконец-то на улице Apple Silicon праздник, - docker выпустил контейнер с vLLM для чипов M1-M4.
Теперь не только владельцы NVidia смогут запускать модели быстро, like а Pro :). 🍏
🦾 Главный инженерный плюс: Движок vllm-metal объединяет MLX и PyTorch в единую цепь вычислений.
Эффект от Zero-copy тензоров позволяет экономить на задержках особенно при росте контекста. 🛠
📈 По цифрам: На Llama 3.2 1B (4-bit) этот стек выдает около 280 токенов в секунду. Совместимость с OpenAI API полная — значит, кодовые-агенты вроде opencode или Крабов подключаются одной командой.
💡 Зачем это нам: Повышение скорости инференса на обычном макбуке с профессиональным управлением KV-кэшем и paged attention.
Удобно дебажить рои агентов прямо в самолете. 🦾
Изучаем документацию и поднимаем.
#vLLM #AppleSilicon #Docker #MLX #AI #Inference
———
@tsingular
Наконец-то на улице Apple Silicon праздник, - docker выпустил контейнер с vLLM для чипов M1-M4.
Теперь не только владельцы NVidia смогут запускать модели быстро, like а Pro :). 🍏
🦾 Главный инженерный плюс: Движок vllm-metal объединяет MLX и PyTorch в единую цепь вычислений.
Эффект от Zero-copy тензоров позволяет экономить на задержках особенно при росте контекста. 🛠
📈 По цифрам: На Llama 3.2 1B (4-bit) этот стек выдает около 280 токенов в секунду. Совместимость с OpenAI API полная — значит, кодовые-агенты вроде opencode или Крабов подключаются одной командой.
💡 Зачем это нам: Повышение скорости инференса на обычном макбуке с профессиональным управлением KV-кэшем и paged attention.
Удобно дебажить рои агентов прямо в самолете. 🦾
Изучаем документацию и поднимаем.
#vLLM #AppleSilicon #Docker #MLX #AI #Inference
———
@tsingular
🔥12✍3 3
Forwarded from e/acc
Самый главный инсайт про агентов в бизнесе:
Мы верили, что система автоматизирует и упростит процесс работы. В реальности же, на примере программирования, мы получили настолько мощный инструмент, что 100% инженерам пришлось менять свой процесс. Вместо «внедрения» пришлось выстраивать процесс вокруг агентов.
Ровно то же самое произойдет со всеми остальными офисными функциями. То, что происходит сейчас с инженерными командами, в течении 3-18 месяцев случится с остальными функциями: кардинальная перестройка, новые узкие места, переизобретение процесса, борьба за надежность и качество с энтропией, увеличение эффективности в разы.
Мы верили, что система автоматизирует и упростит процесс работы. В реальности же, на примере программирования, мы получили настолько мощный инструмент, что 100% инженерам пришлось менять свой процесс. Вместо «внедрения» пришлось выстраивать процесс вокруг агентов.
Ровно то же самое произойдет со всеми остальными офисными функциями. То, что происходит сейчас с инженерными командами, в течении 3-18 месяцев случится с остальными функциями: кардинальная перестройка, новые узкие места, переизобретение процесса, борьба за надежность и качество с энтропией, увеличение эффективности в разы.
👍13💯7🔥6
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Австралийская Cortical Labs подключила лабораторно выращенные нейроны человека к биологическому компьютеру и заставила их пройти Doom.
Нейроны получили из клеток кожи и крови взрослых доноров методом репрограммирования. Затем их подключили к специализированному биокомпьютеру CL1.
И по итогу - нейроны превзошли GPT-4 по скорости реакции и латентности. Небольшой сгусток живой ткани адаптировался к задаче быстрее, чем большая языковая модель.
Кстати, предыдущий эксперимент той же команды с Pong занял больше года.
На этом месте рядовая новость про лабораторные эксперименты обычно заканчивается, но Cortical Labs открыли облачный доступ к CL1, вовсю пилят SDK и планируют продавать биокомпьютер как устройство.
Команда позиционирует платформу как инструмент для медицинских исследований: моделирование нейродегенеративных заболеваний, тестирование препаратов, изучение механизмов восстановления нейронных функций.
Нейроны не обладают сознанием (по крайней мере, в Cortical Labs на это рассчитывают), но они происходят от живых людей и демонстрируют поведение, которое очень похоже на обучение.
Граница между биологической моделью и чем-то большим пока не определена ни юридически, ни этически. Никто всерьез не обсуждает, где эта граница проходит и, самое главное, что делать, когда системы станут сложнее.
Пока это первые шаги, но направление задано.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯59👀23❤9 9✍3👍3🔥1🆒1
Cursor Automations: Дом Тысячи Крабов
Cursor выкатил Automations — систему для создания «вечно включенных» ИИ агентов.
🛠 Что это дает:
• Событийная модель: Агент просыпается не по клику, а по триггеру: сообщение в Slack, новый issue в Linear, мердж в GitHub или инцидент в PagerDuty.
• Облачные песочницы: При срабатывании агент разворачивает облачный sandbox, сам билдит код, запускает тесты через MCP и верифицирует результат перед тем, как прийти к человеку.
• Память: У агентов появился инструмент
💡 Где это реально работает:
• Авто-ревьюеры: Проверка безопасности на каждый пуш в main. Если риск низкий — авто-аппрув, если высокий — алерт в Slack с детальным отчетом.
• Incident Response: При падении системы агент лезет в логи Datadog, сопоставляет их с последними коммитами и выкатывает PR с фиксом до того, как дежурный инженер успеет допить кофе.
• Рутина: Сборка еженедельных дайджестов из Jira/Slack/GitHub или автоматическая допись тестов для свежего кода.
По сути, если один из триггеров сделать по аналогии с Heartbeat у Openclaw,- получим живых облачных кодовых агентов.
#Cursor #AI #Agents #CI #Automation #DevOps
------
@tsingular
Cursor выкатил Automations — систему для создания «вечно включенных» ИИ агентов.
🛠 Что это дает:
• Событийная модель: Агент просыпается не по клику, а по триггеру: сообщение в Slack, новый issue в Linear, мердж в GitHub или инцидент в PagerDuty.
• Облачные песочницы: При срабатывании агент разворачивает облачный sandbox, сам билдит код, запускает тесты через MCP и верифицирует результат перед тем, как прийти к человеку.
• Память: У агентов появился инструмент
memory, позволяющий учиться на прошлых запусках и не совершать одни и те же ошибки в ревью. 🧠💡 Где это реально работает:
• Авто-ревьюеры: Проверка безопасности на каждый пуш в main. Если риск низкий — авто-аппрув, если высокий — алерт в Slack с детальным отчетом.
• Incident Response: При падении системы агент лезет в логи Datadog, сопоставляет их с последними коммитами и выкатывает PR с фиксом до того, как дежурный инженер успеет допить кофе.
• Рутина: Сборка еженедельных дайджестов из Jira/Slack/GitHub или автоматическая допись тестов для свежего кода.
По сути, если один из триггеров сделать по аналогии с Heartbeat у Openclaw,- получим живых облачных кодовых агентов.
#Cursor #AI #Agents #CI #Automation #DevOps
------
@tsingular
⚡6🔥5👍2❤1🆒1
Forwarded from Fixed.One: новости мира Apple и не только…
Анонсируя вчера процессоры M5 Pro и M5 Max, Apple отдельно говорила про нейронные движки в каждом их графическом ядре — это значительно повысило производительность систем. А теперь держим это в уме и вот сама новость...
На GitHub появился проект ANE Training, который делает то, что Apple упорно не хочет разрешать официально — обучает нейронные сети напрямую на чипе Apple Neural Engine. Никаких официальных инструментов CoreML, никакого GPU — только реверс-инженеринг закрытых API и чистые вычисления на нейропроцессоре. Проект доказывает простую вещь: железо Apple давно готово к обучению моделей, но компания искусственно ограничивает его только задачами инференса (то есть использования уже обученных моделей).
Результаты на процессоре M4 выглядят одновременно впечатляюще и разочаровывающе. С одной стороны, один шаг обучения небольшого трансформера занимает всего 9,3 миллисекунды. С другой — утилизация Neural Engine составляет жалкие 11% из возможных 100%, а многие операции до сих пор выполняются на обычном процессоре через библиотеку Accelerate. Автор проекта применил несколько умных оптимизаций: подогнал формат данных под внутреннее представление ANE, разогнал нормализацию в десять раз и научил систему параллельно считать градиенты на CPU, пока нейропроцессор занят своими делами. Но это всё равно остается исследовательским проектом под лицензией MIT, который использует недокументированные API вроде _ANEClient — Apple может сломать всё это одним обновлением системы.
Для обычных пользователей это пока не значит ровным счетом ничего. Собрать кластер из Макбуков и обучать на них ChatGPT точно не получится — проект работает только с крошечными моделями (один слой трансформера с 768 измерениями против сотен миллиардов параметров современных языковых моделей), эффективность использования железа смехотворная, а стабильность никто не гарантирует. Но вот для Apple это должно быть важным звоночком.
Проект показывает типичную проблему экосистемы Apple — мощное железо искусственно ограничено программно. Neural Engine в чипах серии M теоретически способен выдавать до 38 терафлопс (M4 Max), но компания не дает разработчикам нормальных инструментов для его использования. В результате для обучения моделей все равно используют GPU через Metal или вообще уходят на NVIDIA. Если бы Apple официально открыла обучение на ANE с нормальной документацией и оптимизацией, Макбуки и айпады могли бы стать серьезной платформой для локального обучения небольших специализированных моделей — особенно актуально в контексте растущего интереса к приватности и локальному ИИ. Но пока компания предпочитает контролировать каждый аспект использования своего железа, даже если это тормозит развитие технологий.
@FixedOneNews
На GitHub появился проект ANE Training, который делает то, что Apple упорно не хочет разрешать официально — обучает нейронные сети напрямую на чипе Apple Neural Engine. Никаких официальных инструментов CoreML, никакого GPU — только реверс-инженеринг закрытых API и чистые вычисления на нейропроцессоре. Проект доказывает простую вещь: железо Apple давно готово к обучению моделей, но компания искусственно ограничивает его только задачами инференса (то есть использования уже обученных моделей).
Результаты на процессоре M4 выглядят одновременно впечатляюще и разочаровывающе. С одной стороны, один шаг обучения небольшого трансформера занимает всего 9,3 миллисекунды. С другой — утилизация Neural Engine составляет жалкие 11% из возможных 100%, а многие операции до сих пор выполняются на обычном процессоре через библиотеку Accelerate. Автор проекта применил несколько умных оптимизаций: подогнал формат данных под внутреннее представление ANE, разогнал нормализацию в десять раз и научил систему параллельно считать градиенты на CPU, пока нейропроцессор занят своими делами. Но это всё равно остается исследовательским проектом под лицензией MIT, который использует недокументированные API вроде _ANEClient — Apple может сломать всё это одним обновлением системы.
Для обычных пользователей это пока не значит ровным счетом ничего. Собрать кластер из Макбуков и обучать на них ChatGPT точно не получится — проект работает только с крошечными моделями (один слой трансформера с 768 измерениями против сотен миллиардов параметров современных языковых моделей), эффективность использования железа смехотворная, а стабильность никто не гарантирует. Но вот для Apple это должно быть важным звоночком.
Проект показывает типичную проблему экосистемы Apple — мощное железо искусственно ограничено программно. Neural Engine в чипах серии M теоретически способен выдавать до 38 терафлопс (M4 Max), но компания не дает разработчикам нормальных инструментов для его использования. В результате для обучения моделей все равно используют GPU через Metal или вообще уходят на NVIDIA. Если бы Apple официально открыла обучение на ANE с нормальной документацией и оптимизацией, Макбуки и айпады могли бы стать серьезной платформой для локального обучения небольших специализированных моделей — особенно актуально в контексте растущего интереса к приватности и локальному ИИ. Но пока компания предпочитает контролировать каждый аспект использования своего железа, даже если это тормозит развитие технологий.
@FixedOneNews
🔥12❤3
Google Workspace CLI (gws): Новый стандарт для людей и агентов
Google выкатил
Получился крутой динамический комбайн из API, построенный на базе Google Discovery Service. 🛠
🚀 Что делает его «крутым»:
• Динамичность: Он не хранит список команд статично.
• Agent-First: Весь вывод — это структурированный JSON. Идеально для LLM и автоматизаций.
• 100+ Agent Skills: В репозиторий уже включены готовые навыки (
• MCP Server: Поддержка Model Context Protocol из коробки. Можно за пару секунд превратить весь свой Google Workspace в набор инструментов для Claude Desktop или любого MCP-клиента.
💡 Примеры использования:
•
•
•
🤖 Для ИИ агентов: Это «мастхэв». Он заменяет собой десятки разрозненных скриптов и упрощает авторизацию (поддерживает OAuth, Service Accounts и шифрование токенов в системном связке ключей).
Позволяет максимально просто интегрироваться в стэк навыков.
Даже если вы не используете GWS, - рекомендую посмотреть как пример архитектуры.
#GoogleWorkspace #CLI #AI #Agents #MCP #OpenSource #DevTools
------
@tsingular
Google выкатил
gws — единый opensourse CLI-инструмент для управления всем Workspace: Drive, Gmail, Calendar, Sheets, Docs, Chat и Admin. Получился крутой динамический комбайн из API, построенный на базе Google Discovery Service. 🛠
🚀 Что делает его «крутым»:
• Динамичность: Он не хранит список команд статично.
gws читает схему API Google в рантайме. Если в Workspace появляется новый метод или эндпоинт — CLI подхватывает его автоматически.• Agent-First: Весь вывод — это структурированный JSON. Идеально для LLM и автоматизаций.
• 100+ Agent Skills: В репозиторий уже включены готовые навыки (
SKILL.md) для популярных рабочих процессов.• MCP Server: Поддержка Model Context Protocol из коробки. Можно за пару секунд превратить весь свой Google Workspace в набор инструментов для Claude Desktop или любого MCP-клиента.
💡 Примеры использования:
•
gws drive files list — список файлов с авто-пагинацией.•
gws sheets spreadsheets create — создание таблиц одной командой.•
gws mcp -s drive,gmail,calendar — запуск MCP-сервера для ИИ-ассистента.🤖 Для ИИ агентов: Это «мастхэв». Он заменяет собой десятки разрозненных скриптов и упрощает авторизацию (поддерживает OAuth, Service Accounts и шифрование токенов в системном связке ключей).
Позволяет максимально просто интегрироваться в стэк навыков.
Даже если вы не используете GWS, - рекомендую посмотреть как пример архитектуры.
#GoogleWorkspace #CLI #AI #Agents #MCP #OpenSource #DevTools
------
@tsingular
⚡5✍4❤3👍1🆒1
🇰🇷 Южная Корея: до коллапса производства чипов 9 дней?
🛠 Детали блокады:
• Страховой стоп-кран: С 5 марта пулы Gard, Skuld и London P&I (90% мирового флота) аннулировали покрытие военных рисков в Заливе.
Без страховки танкеры работать не смогут — их не примет ни один порт и не пропустит ни один банк.
• Ормузская пробка: В проливе заперто ~150 судов. КСИР пообещали «сжигать» любого, кто дернется. Это физическая остановка 20% мирового трафика СПГ.
• Катарский инцидент: Остановка добычи на QatarEnergy (терминалы Рас-Лаффан) — это выбывание 7 млн тонн ежегодного импорта Сеула.
💡 Почему 9 дней — это критично:
• Правительство Южной Кореи подтвердило: запасы «выше обязательного минимума» в 9 дней. В докладе заявили, что ровно 9, потом наперегонки стали доказывать, что больше. Но по факту значит,- на грани.
• Samsung и SK Hynix не могут работать в режиме экономии. Литографические установки в чистых комнатах требуют идеального питания 24/7. Перебои в сети из-за дефицита газа на ТЭС могут привести к выходу из строя пластин на сотни миллионов долларов и длительному времени на перезапуск техпроцесса.
Из-за блокады так же под угрозой 90% импорта гелия, критичного для литографии на заводах Samsung и SK Hynix.
🤖 Итог для ИИ:
Если блокада не будет снята в течение недели (а там, похоже, на пол года история уже расписана), то мир ждет физический дефицит вычислительных мощностей.
Запасаемся покорном и электроникой.
Возможно следующий ИИ будет ламповый.
Ну или органоидно-фрикодельковый :)
#EnergyCrisis #SouthKorea #Semiconductors #Samsung #LNG #Geopolitics #AI
------
@tsingular
🛠 Детали блокады:
• Страховой стоп-кран: С 5 марта пулы Gard, Skuld и London P&I (90% мирового флота) аннулировали покрытие военных рисков в Заливе.
Без страховки танкеры работать не смогут — их не примет ни один порт и не пропустит ни один банк.
• Ормузская пробка: В проливе заперто ~150 судов. КСИР пообещали «сжигать» любого, кто дернется. Это физическая остановка 20% мирового трафика СПГ.
• Катарский инцидент: Остановка добычи на QatarEnergy (терминалы Рас-Лаффан) — это выбывание 7 млн тонн ежегодного импорта Сеула.
💡 Почему 9 дней — это критично:
• Правительство Южной Кореи подтвердило: запасы «выше обязательного минимума» в 9 дней. В докладе заявили, что ровно 9, потом наперегонки стали доказывать, что больше. Но по факту значит,- на грани.
• Samsung и SK Hynix не могут работать в режиме экономии. Литографические установки в чистых комнатах требуют идеального питания 24/7. Перебои в сети из-за дефицита газа на ТЭС могут привести к выходу из строя пластин на сотни миллионов долларов и длительному времени на перезапуск техпроцесса.
Из-за блокады так же под угрозой 90% импорта гелия, критичного для литографии на заводах Samsung и SK Hynix.
🤖 Итог для ИИ:
Если блокада не будет снята в течение недели (а там, похоже, на пол года история уже расписана), то мир ждет физический дефицит вычислительных мощностей.
Запасаемся покорном и электроникой.
Возможно следующий ИИ будет ламповый.
Ну или органоидно-фрикодельковый :)
#EnergyCrisis #SouthKorea #Semiconductors #Samsung #LNG #Geopolitics #AI
------
@tsingular
✍14😁10❤7🤔6👍3🤯2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Paperclip: ваша ИИ компания
Если OpenClaw — это как правило, 1-2 сотрудника, то Paperclip — это целая компания.
Opensource проект позволяет вам взять под контроль целый рой ИИ сущностей.
🛡 Корпорация под контролем: Когда у вас открыто 20 терминалов с Claude Code, вы перестаете понимать, кто и зачем тратит ваши токены.
Paperclip превращает набор разрозненных сессий в полноценную оргструктуру с ролями CEO, CTO и менеджеров.
📉 Контроль и бюджеты: Теперь у каждого агента есть свой кошелек и лимит. Если «стажер» зациклится в бесконечном цикле написания кода, он упрется в бюджет раньше, чем обнулит ваш API-ключ.
Каждое действие логируется в неизменяемый аудит-лог,- полная прозрачность делегирования.
🧬 Clipmart и пресеты: В планах запуск маркетплейса готовых структур.
Можно будет в один клик скачать настроенный «Отдел контента» или «Команду разработки» с прописанными связями и целями.
Мы переходим от ручного управления промптами к управлению департаментами.
💼 Зачем бизнесу: Это первый серьезный шаг к созданию Zero-Human компаний. Вместо того чтобы нанимать людей для присмотра за ИИ, вы нанимаете ИИ для управления другими ИИ по классическим канонам менеджмента.
🔮 Будущее: В 2026-м ценность будет не столько в модели, а в архитектуре связей.
Хорошо настроенный рой в огромной модели не нуждается.
Paperclip — это чертеж для строительства автономных холдингов, где человек остается лишь в роли акционера.
Опять выходные в топку.
#AI #Agents #Orchestration #Paperclip #рой
───
@tsingular
Если OpenClaw — это как правило, 1-2 сотрудника, то Paperclip — это целая компания.
Opensource проект позволяет вам взять под контроль целый рой ИИ сущностей.
🛡 Корпорация под контролем: Когда у вас открыто 20 терминалов с Claude Code, вы перестаете понимать, кто и зачем тратит ваши токены.
Paperclip превращает набор разрозненных сессий в полноценную оргструктуру с ролями CEO, CTO и менеджеров.
📉 Контроль и бюджеты: Теперь у каждого агента есть свой кошелек и лимит. Если «стажер» зациклится в бесконечном цикле написания кода, он упрется в бюджет раньше, чем обнулит ваш API-ключ.
Каждое действие логируется в неизменяемый аудит-лог,- полная прозрачность делегирования.
🧬 Clipmart и пресеты: В планах запуск маркетплейса готовых структур.
Можно будет в один клик скачать настроенный «Отдел контента» или «Команду разработки» с прописанными связями и целями.
Мы переходим от ручного управления промптами к управлению департаментами.
💼 Зачем бизнесу: Это первый серьезный шаг к созданию Zero-Human компаний. Вместо того чтобы нанимать людей для присмотра за ИИ, вы нанимаете ИИ для управления другими ИИ по классическим канонам менеджмента.
🔮 Будущее: В 2026-м ценность будет не столько в модели, а в архитектуре связей.
Хорошо настроенный рой в огромной модели не нуждается.
Paperclip — это чертеж для строительства автономных холдингов, где человек остается лишь в роли акционера.
Опять выходные в топку.
#AI #Agents #Orchestration #Paperclip #рой
───
@tsingular
1✍10😁10❤🔥6⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
Это следовало ожидать
Openclaw - ИИ агент теперь может управлять дронами через Mavlink на Dimensional.
Программирование физического пространства теперь можно осуществлять с помощью естественного языка.
Запрос: «Следуй за следующей белой машиной, которая проезжает через перекрёсток»
Ссылку не дам.
Просто имейте ввиду, что и такое уже делают.
#openclaw #дроны #military
------
@tsingular
Openclaw - ИИ агент теперь может управлять дронами через Mavlink на Dimensional.
Программирование физического пространства теперь можно осуществлять с помощью естественного языка.
Запрос: «Следуй за следующей белой машиной, которая проезжает через перекрёсток»
Ссылку не дам.
Просто имейте ввиду, что и такое уже делают.
#openclaw #дроны #military
------
@tsingular
🤯20👀10👍3 3🔥2❤1
Forwarded from TechnoME: Multimediamind
Anthropic опубликовала большое исследование влияния AI на рынок труда. Кому лень читать много букв — посмотрите хотя бы картинку, прикреплённую к посту.
В синей области — задачи, которые ИИ теоретически может выполнять прямо сейчас.
Красным — то, для чего люди фактически используют ИИ.
В настоящее время как минимум четверть задач, выполняемых работниками в США, доступны для искусственного интеллекта — и это 49% рабочих мест. Что на 36% больше, чем год назад.
В реальных условиях применение ИИ пока составляет лишь малую часть от того, что уже возможно. Каждый месяц красная зона немного увеличивается.
Как говорится, думойте ☝🏻
В синей области — задачи, которые ИИ теоретически может выполнять прямо сейчас.
Красным — то, для чего люди фактически используют ИИ.
В настоящее время как минимум четверть задач, выполняемых работниками в США, доступны для искусственного интеллекта — и это 49% рабочих мест. Что на 36% больше, чем год назад.
В реальных условиях применение ИИ пока составляет лишь малую часть от того, что уже возможно. Каждый месяц красная зона немного увеличивается.
Как говорится, думойте ☝🏻
✍18🔥7⚡6
Forwarded from Анализ данных (Data analysis)
⚠️ GPT-5.4 впервые получил статус “высокого уровня киберугрозы” среди универсальных AI-моделей.
GPT-5.4 - официально признана high cybersecurity risk.
Это означает, что модель уже способна самостоятельно планировать и выполнять сложные кибератаки на симулированные корпоративные сети.
Основание для такой оценки - тесты Capture the Flag (CTF).
В индустрии кибербезопасности CTF - это соревнования по взлому систем.
Участники должны проникнуть в симулированную сеть, найти уязвимости, взломать сервисы и добыть скрытые данные - так называемые *flags*.
Для этого требуется:
- взламывать шифрование
- делать reverse engineering программ
- находить уязвимости в веб-приложениях
- строить сложные цепочки атак
По результатам официальных тестов GPT-5.4 набрал 88% в профессиональных CTF-сценариях.
Это очень высокий показатель.
Фактически это означает, что модель уже умеет:
- находить уязвимости в системах
- писать эксплойты
- строить стратегии взлома
Если AI способен проходить профессиональные hacking-челленджи, значит он обладает теми же навыками, которые используют реальные хакеры для взлома корпоративных инфраструктур.
Главная проблема - масштабирование атак.
Если раньше хакеру нужно было вручную искать слабые места, то теперь AI может автоматически анализировать систему и находить уязвимости.
Это резко ускоряет и удешевляет кибератаки.
Именно поэтому GPT-5.4 стал первой универсальной AI-моделью, официально получившей высокий уровень киберриска в системной карте безопасности.
deploymentsafety.openai.com/gpt-5-4-thinking/gpt-5-4-thinking.pdf
GPT-5.4 - официально признана high cybersecurity risk.
Это означает, что модель уже способна самостоятельно планировать и выполнять сложные кибератаки на симулированные корпоративные сети.
Основание для такой оценки - тесты Capture the Flag (CTF).
В индустрии кибербезопасности CTF - это соревнования по взлому систем.
Участники должны проникнуть в симулированную сеть, найти уязвимости, взломать сервисы и добыть скрытые данные - так называемые *flags*.
Для этого требуется:
- взламывать шифрование
- делать reverse engineering программ
- находить уязвимости в веб-приложениях
- строить сложные цепочки атак
По результатам официальных тестов GPT-5.4 набрал 88% в профессиональных CTF-сценариях.
Это очень высокий показатель.
Фактически это означает, что модель уже умеет:
- находить уязвимости в системах
- писать эксплойты
- строить стратегии взлома
Если AI способен проходить профессиональные hacking-челленджи, значит он обладает теми же навыками, которые используют реальные хакеры для взлома корпоративных инфраструктур.
Главная проблема - масштабирование атак.
Если раньше хакеру нужно было вручную искать слабые места, то теперь AI может автоматически анализировать систему и находить уязвимости.
Это резко ускоряет и удешевляет кибератаки.
Именно поэтому GPT-5.4 стал первой универсальной AI-моделью, официально получившей высокий уровень киберриска в системной карте безопасности.
deploymentsafety.openai.com/gpt-5-4-thinking/gpt-5-4-thinking.pdf
🔥11⚡3✍2❤1🆒1
DeepInnovator: ИИ исследователь от HKUDS
Китайские товарищи из HKUDS (Гонконгский университет) продолжают выкатывать в оупенсорс полезные ИИ инструменты.
На этот раз это ИИ агент- научный лаборант.
🔬 Механика работы: Модель на 14B параметров (база Qwen) обучена имитировать логику научного поиска.
Она разбивает горы литературы на когнитивные примитивы (Insight, Trending, Serendipity) и через итеративный цикл «догадка–опровержение» (по Попперу) синтезирует новые гипотезы.
📊 Бенчмарки: DeepInnovator-14B обходит GPT-4o и Gemini-2.5-pro в качестве обоснования научных идей.
Даже в абсолютно незнакомых ей областях — праве или образовании — модель находит те самые «белые пятна», которые люди пропускают годами.
💼 Зачем бизнесу: Это готовый Copilot для R&D-департаментов.
Вместо того чтобы заставлять экспертов читать 1000 статей в месяц, вы отдаете это агенту, который на выходе выдает не саммари, а выявленные неочевидные связи и направления для патентов.
🔮 Будущее: Мы переходим от «поиска информации» к «автономному синтезу знаний».
Модель небольшая, быстрая, поэтому в качестве простого варианта можно подключить как промежуточный шаг в подготовке транскрибаций по длинным записям.
#AI #Research #Innovation #HKUDS #DeepInnovator #Китай
───
@tsingular
Китайские товарищи из HKUDS (Гонконгский университет) продолжают выкатывать в оупенсорс полезные ИИ инструменты.
На этот раз это ИИ агент- научный лаборант.
🔬 Механика работы: Модель на 14B параметров (база Qwen) обучена имитировать логику научного поиска.
Она разбивает горы литературы на когнитивные примитивы (Insight, Trending, Serendipity) и через итеративный цикл «догадка–опровержение» (по Попперу) синтезирует новые гипотезы.
📊 Бенчмарки: DeepInnovator-14B обходит GPT-4o и Gemini-2.5-pro в качестве обоснования научных идей.
Даже в абсолютно незнакомых ей областях — праве или образовании — модель находит те самые «белые пятна», которые люди пропускают годами.
💼 Зачем бизнесу: Это готовый Copilot для R&D-департаментов.
Вместо того чтобы заставлять экспертов читать 1000 статей в месяц, вы отдаете это агенту, который на выходе выдает не саммари, а выявленные неочевидные связи и направления для патентов.
🔮 Будущее: Мы переходим от «поиска информации» к «автономному синтезу знаний».
Модель небольшая, быстрая, поэтому в качестве простого варианта можно подключить как промежуточный шаг в подготовке транскрибаций по длинным записям.
#AI #Research #Innovation #HKUDS #DeepInnovator #Китай
───
@tsingular
👍2⚡1🔥1