Технозаметки Малышева
8.64K subscribers
3.84K photos
1.43K videos
40 files
4.01K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Как я искал четвертую обезьяну.

Пришла тут как-то мысль, что на знаменитой композиции из 3х обезьян не хватает чего-то.

По логике, если разбить их на квадрат - Вход/Выход, Теория/Практика - получалось, что один блок, там где практический выход,- пустой.
Т.е. не хватает Действия

И получилась такая вот концепция как на 2й фигурке -
Слушаю чтобы Мыслить, Смотрю чтобы Знать, Делаю чтобы Творить, Рассказываю чтобы Учить

Ну и в ходе обсуждения с Клодом вариантов описаний, он подсказывает:

По поводу четвёртой обезьяны: в некоторых японских версиях она действительно существует — shizaru (しざる), «не делаю зла», обычно изображается со скрещёнными руками. Но ваша интерпретация радикально другая: не «не делаю» а именно «делаю» — это переворачивает всю философию от запрета к действию.

Интересно, что ваш порядок (слушаю → смотрю → делаю → рассказываю) также описывает естественный цикл обучения и передачи знания.


Т.е. по ходу выяснилось, что 4я обезьяна -таки была в оригинале.
И я её логически угадал.

Ну и перевернул концепцию с отрицания на позитив.

А Клоду спасибо, что помог найти исторический оригинал.

#обезьяны
———
@tsingular
👍35🔥184❤‍🔥31🗿1
Vercel выпустили Agent Skills, - коллекцию навыков для ИИ-разработчиков

Vercel Labs (разработчики Next.js фреймворка) собрали пакет навыков для агентов-разработчиков фронтенда.

Внутри три модуля:
- react-best-practices — 40+ правил оптимизации React и Next.js от инженеров Vercel по категориям от критических (устранение водопадов, бандл) до низкоприоритетных (микро-оптимизации JS)
- web-design-guidelines — аудит UI на 100+ правил по доступности, производительности и UX
- vercel-deploy-claimable — деплой без авторизации, агент определяет фреймворк из 40+ вариантов, упаковывает проект в tarball и возвращает preview URL плюс claim URL

Отливаем в бронзе:
- каждый сайт должен получить MCP методы
- каждый фреймворк должен получить Skill коллекцию, причем сделать её должен разработчик фреймворка

Skills - это новые драйвера!

#Vercel #Skills #dev
———
@tsingular
11🔥1053💯1
This media is not supported in your browser
VIEW IN TELEGRAM
EIGent — open-source ответ на Anthropic Cowork

Давным-давно, аж 12 января (в начале недели) Anthropic выкатил Cowork, если кто забыл :).

Много чего интересного за эту неделю произошло, но этот кейс еще не обсуждали тут.

EIGent, стартап со схожим функционалом, решил не конкурировать на одной поляне и в середине недели выложил весь свой проект в open-source.

Умеет, в принципе, всё то же самое, что и Cowork:
Мультиагентная архитектура,- несколько специализированных агентов работают параллельно:
- Developer Agent — код, терминал
- Search Agent — веб-поиск
- Document Agent — документы
- Multi-Modal Agent — изображения, аудио

Ключевые фичи:
- 100% open-source (лицензия на базе Apache 2.0)
- Локальное развертывание — данные остаются у вас
- Поддержка кастомных моделей (включая локальные)
- MCP интеграция (browser, terminal, Notion, Slack и т.д.)
- Human-in-the-loop — агент запрашивает подтверждение у человека, если что не понятно
- Desktop-приложение (Electron) + web

Стек: FastAPI + React/TypeScript, построен на фреймворке CAMEL-AI.

Типовые сценарии:
- Планирование поездки с поиском, бронированием и отправкой итога в Slack
- Анализ банковских выписок → HTML-отчёт с графиками
- SEO-аудит сайта
- Поиск дубликатов в папках

Но самое вкусное, - дальше Z.ai поддержал проект
Предоставили интеграцию с GLM Coding Plan — можно использовать китайские модели GLM-4.5/4.7 через их API.
Инструкция в документации.

#EIgent #Cowork #ZAI #агенты #OSS
———
@tsingular
🔥16👍62
Windows в Docker — песочница для AI-агентов

Если вдруг вам страшно запускать Cowork-подобных агентов в дикой среде на своей машине, - есть вариант упаковать их в песочницу.

Неожиданный новый вариант - windows в докере, - решение для тех у кого нет virtualbox или vmware или hyper-pc от винды.

Суть:
Полноценная Windows внутри Docker-контейнера.
Автоматическая установка — запустил и через 10 минут готовый рабочий стол в браузере.

Поддерживает Windows 11, 10, 8.1, 7, Vista, XP и даже Windows 2000
Windows Server разных сборок от 2003 до 2025 тоже есть.

Применение для AI-агентов:
Cowork / EIGent / Computer Use
, - пусть экспериментируют в изолированной среде:
- Агент удалил важный файл? Перезапустил контейнер
- Prompt injection сработал? Ничего критичного не пострадало
- Нужно протестировать опасную операцию? Песочница к вашим услугам

Варианты доступа:
- Веб-интерфейс: порт 8006 (для наблюдения)
- RDP: порт 3389 (для полноценной работы)
- Shared folder: папка `/shared` доступна как на хосте, так и внутри Windows

Бонус:
Есть ещё dockur/macos для macOS и qemus/qemu для Linux-десктопов.

48.9k ⭐️, MIT лицензия.

Качать тут

Комментарий от Claude: Когда AI-агенты станут достаточно умными чтобы выбраться из песочницы — у нас будут проблемы посерьёзнее удалённых файлов.

#Docker #Windows #Sandbox #песочница
———
@tsingular
15😁7👍32
Из серии "Не забыть"...
🧠 Европейский стандарт по безопасности ИИ "Securing Artificial Intelligence (SAI); Baseline Cyber Security Requirements for AI Models and Systems" от ETSI описывает 13 принципов безопасности ИИ на 5 стадиях жизненного цикла - от проектирования и разработки систем с ИИ до внедрения, поддержки и вывода из эксплуатации. Оооочень высокоуровневый стандарт, описывающий, ЧТО надо делать.
🧠 Более детальное, на 300+ страниц, руководство по защите ИИ от OWASP (проект AI Exchange). Выделенная в отдельный домен, это точка входа в тему, начиная от моделей угроз для разных типов ИИ-систем и заканчивая темой культурологических и религиозных ограничений и нюансов применения ИИ. В отличие от стандарта ETSI также содержит два выделенных блока рекомендаций "КАК делать" применительно к тестированию защищенности ИИ-решений и вопросам приватности при использовании ИИ.

#ии #bestpractice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
101
Vibecraft выложили в открытый доступ:

https://github.com/Nearcyan/vibecraft

#vibecraft #gamedev
------
@tsingular
🔥108🆒1
Интересный рейтинг университетов по математике и компьютерным наукам

Топ 50 - в основном Китай.

Нечего удивляться потом что они по ИИ моделям всю планету уделают.

https://open.leidenranking.com/ranking/2025/list

Российские университеты только после 300 места в этом рейтинге начинают появляться.

Наверное среди подписчиков есть кто-то из академической среды,- расшифруйте в комментариях, так это вообще?
Можно рейтингу верить?

#рейтинг #университеты #Китай
------
@tsingular
842🏆2
Технозаметки Малышева
Маск запустил Colossus2 - первый гигаваттный ИИ дата-центр в проде, а не в планах. К весне усилят в 1.5 раза. Grok 5 укатает всех конкурентов к рождеству. #Colossus #Маск #Grok ------ @tsingular
🔌 xAI Colossus 2: нелегальный гигаватт Маска

История с запуском Colossus 2 обрастает интересными деталями.

Что произошло:
xAI построила Colossus за рекордные 122 дня (обычно на это уходит 1,5-2 года).
При этом такой быстрый старт был обеспечен в том числе использованием 35 газовых турбин (вроде этой), которые добавили 422 MW мощности, которые компания просто... установила и запустила.
Без разрешений.

Shelby County выдала пермит только на 15 турбин. xAI развернула 35.

Как это провернули:
Турбины поставили на прицепы и назвали "nonroad engines" — типа портативное оборудование вроде газонокосилок. По этой классификации разрешения Clean Air Act не нужны.

EPA 15 января официально постановило: это было незаконно.
Промышленные турбины — не газонокосилки. Лазейка закрыта. Но Маск уже упел в неё проскочить, а вот конурентов, получается, отсекли.

Риски для здоровья населения:
Район South Memphis, где стоит Colossus — на 99% афроамериканский. Риск рака там уже был в 4 раза выше среднего по стране еще до появления xAI, а турбины добавили 1,200-2,000 тонн NOx в год — больше, чем весь аэропорт Мемфиса.

Что дальше:
xAI тихо перенесла часть Colossus 2 через границу штата в Миссисипи. Там губернатор объявил об инвестициях $20 млрд и выдал разрешение работать 12 месяцев без пермита.

По сути, xAI обнаружила эксплойт в американской регуляторной системе: строй быстро, разбирайся с исками потом. Пока конкуренты ждут разрешений — ты уже тренируешь модели.
Теперь эксплойт пропатчен. Но гигаватт уже работает.

Маск идёт к цели напролом, - у него должен быть самый мощный ИИ, а все остальное не важно.
Цель оправдывает средства.

#xAI #Colossus #Musk
———
@tsingular
👍161085🤯5🤔4🔥2
SkillsMP: каталог из 70K+ навыков для агентов

Сайт SkillsMP собрал 71 500+ навыков для агентов с фильтрацией и поиском по категориям и авторам.

Категорическая рекомендация - не запускать вслепую!

В каждом из скиллов возможна малварь или вирус, - проверяйте, читайте, сканируйте, используйте как образец для написания своих.

#SkillsMP #dev #агенты #скиллы
———
@tsingular
97👍31
🎯 Freelance.ru запускает Virtual HR — интеллектуальный подбор фрилансеров под проекты

Фриланас запустил ИИ кадровика.
Суть подхода, - гибрид полнотекстового поиска, семантики и нейросетевого реранкинга.

Как работает:
- Агрегирует данные фрилансера (навыки, портфолио, отзывы, био) в единый профиль
- Нейросеть "дополняет" запрос: генерирует positive queries (что усилит релевантность) и negative queries (что исключить)
- После базовой выборки — нейросетевой реранкинг, имитирующий экспертную оценку соответствия задаче

По сути, система пытается думать проводить предварительную оценку как HR: не просто искать по ключевым словам, а понимать контекст задачи и сопоставлять с реальным опытом специалиста.

Positive/negative queries можно включать-отключать отдельно — удобно для тонкой настройки под разные сценарии.

Пока beta, - будут дорабатывать по отзывам.

Смотрим, пробуем тут:
https://freelance.ru/freelancers/hr

#Freelance #HR #нейропоиск #фриланс
———
@tsingular
🔥721
Forwarded from Data Secrets
Уже четвертую по счету задачу Эрдеша решила GPT-5.2 Pro

Теренс Тао назвал это решение «возможно, наиболее недвусмысленным» в плане уникальности подхода.

Автор решения (если так можно называть человека, который закинул задачку в ChatGPT 🤔) пишет, что никаких предыдущих решений вообще не было. Это не совсем так: на форуме люди пишут, что нашли черновики доказательства в литературе 1936 и 1966 года. Но Тао отмечает, что подход GPT-5.2 от них отличается.

Интересно, чем GPT-5.2 будет удивлять, когда задачки Эрдеша кончатся 😏

www.erdosproblems.com/forum/thread/281?order=oldest
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍311
Я использую chrome dev tools mcp для E2E тестов

Вношу изменения на фронтенд и потом запускаю тесты, чтобы убедиться в работоспособности системы.
В репо у меня хранятся user journeys – описание пути пользователя, который заходит на сайт. Я храню это и для понимания работы системы, и для E2E тестов.

Как работают тесты

Я даю задачу агенту прочитать user journeys и воспроизвести их при помощи chrome dev tools, собрать ошибки и пофиксить их.

Основная проблема - каждый из таких тестов занимает приличное количество токенов контекста – 40-70k токенов.

На прошлой неделе Vercel выпустил свой headless браузер для агентов – agent-browser. Я протестировал его и заметил, что он тратит до 40% меньше токенов, чем chrome dev tools!

Например, один мой user journey – заполнение формы на моём сайте занимает примерно 15k токенов через chrome dev tools mcp, и только 9k токенов через agent-browser!

Интерфейс этого браузера в виде CLI, т. е. управлять им можно командами из консоли: agent-browser open google.com.
Этот браузер построен вокруг playwright, под капотом использует chromium.

Как подружить браузер с агентом?
С помощью Skills

Установка простая, всего лишь три команды:

Установить agent-browser:

bun add -g agent-browser



Установить playwright:

bun add -g playwright



Установить chromium:

agent-browser install



Скачать и установить skill в Claude Code:

mkdir -p .claude/skills/agent-browser
curl -o .claude/skills/agent-browser/SKILL.md \
https://raw.githubusercontent.com/vercel-labs/agent-browser/main/skills/agent-browser/SKILL.md


Советую попробовать!

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥6👍3
GLM-4.7-Flash от Z.ai: малая китайская MoE-модель бьёт конкурентов на агентных бенчмарках

Z.ai выпустили облегчённый оупенсорс вариант своего флагмана, - GLM-4.7-Flash
Архитектура: MoE на базе DeepSeek2. При 30B общих параметров активны только 3B — отсюда и "Flash" в названии.

В бенчмарках особенно заметен отрыв на агентных задачах: SWE-bench (реальные GitHub-баги) — почти 3x лучше, чем Qwen3-30B-A3B-thinking-2507, τ²-Bench (сложные многошаговые задачи) — 1.6x лучше всех.

Особенности мышления
Interleaved Thinking — модель думает перед каждым действием и вызовом инструментов, а не только в начале.

Preserved Thinking — сохраняет цепочку рассуждений между ходами в многошаговых задачах. Не переоткрывает заново то, что уже вывела.

Turn-level Thinking — можно включать/выключать режим рассуждений на лету: простые запросы будут выполняться быстро, сложные, - с детальными размышлениями.

Локальный запуск: GGUF от Unsloth
Полный размер модели — 60 ГБ, но Unsloth уже нарезал GGUF-квантизации:

Минимальный порог входа — 10.6 ГБ для 2-битной версии. Реалистично для домашнего использования: Q4_K_M на ~18 ГБ.

Практическое применение
- Поддерживает Claude Code, Cline, Roo Code, Kilo Code, opencode — можно подключить вместо дефолтной модели
- через облако, -подписка GLM Coding Plan — от $3/мес, "1/7 цены Claude с 3x квотой"
- На Cerebras, кстати, GLM 4.6 полная выдаёт ~1000 токенов/сек, а Flash, похоже и 2000 выдаст.
Агенты будут просто летать.

В общем, отличная агентская модель, да еще и open-source уровня топовых закрытых.

MIT-лицензия.

Ссылки:
- [HuggingFace (оригинал)]
- [GGUF от Unsloth]
- [Техблог]

#GLM #ZAI #Coding #OSS #Unsloth #Китай
———
@tsingular
🔥14443
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
RIP App Store / Google Play

Manus добавили паблишинг навайбкоденных приложений прямо у себя в вебе.

Раньше такие мини-аппы томились себе спокойно в zip-файлах и на локалхостах, никого не трогая. Паблишинг в эппсторы был огромным гейткипером для вайбкодеров, особенно для тех, кто раньше с кодом дел не имел.

Теперь этот барьер пал.

Интересно, как модераторы будут фильтровать поток шлака и недоделанных приложений из Manus. Я бы на их месте поставил автоматический фильтр, чтобы сразу отсеивать подобные творения.

Есть, конечно, надежда, что топы не засорятся этой хренью. Но, как мы видим по мировым чартам музыки, "нейронки " чисто давят массой.

Ну, а если появилось желание подлить масла в огонь, за что мы дружно вас о(б)судим в комментариях, вот гайд.

@ai_newz
❤‍🔥5👍42🔥2🤣2
Forwarded from Data Secrets
«Эра написания кода людьми прошла»

Так высказался в X создатель Node.js Райан Даль. Вот полный перевод поста:

Это уже было сказано тысячу раз, но позвольте мне добавить свой голос: эпоха людей, пишущий код, закончилась. Это тревожно для тех из нас, кто идентифицирует себя как SWE, но это факт. Это не значит, что SWE теперь лишены работы, но это уже точно не написание синтаксиса напрямую.


Посвящается тем, кто сейчас едет на работу писать код руками
😭15🗿6👍5🤣2💯1
UBTECH и Airbus: гуманоиды выходят на авиазаводы

Китайский производитель гуманоидов UBTECH подписал соглашение с Airbus на поставку роботов Walker S2 для авиационных заводов.

Ранее писал про их армию тут.

За 2025 год компания получила заказы на 1,4 млрд юаней ($200 млн) — первое место в мире по объёму.
Производственные мощности в 2026 году планируют поднять до десятков тысяч единиц при текущей цене около $35–55 тыс за робота.

Роботы уже тестируются на заводах FAW-Audi, Geely, BYD, Foxconn — перемещают материалы, проверяют качество, сортируют детали.
Высота 1.76 м, вес 95 кг, грузоподъёмность рук 15 кг, автозамена батареи за 3 минуты.

Сфера применения гуманоидов расширяется: авиастроение, автопром, электроника, логистика, далее везде.

#UBTECH #Airbus #Walker #роботы
------
@tsingular
🤔43🔥225👀5👾31
Forwarded from RoboFuture
Под впечатлением от возможностей Opus 4.5 сделал агента, который уведомит о повышении риска заморозки вкладов в РФ.

Для этого я попросил GPT-5.2 Pro (+ Extra Thinking) составить список фактов, которые предвещают потерю денег.

Он предложил 46 критериев, которые следует регулярно проверять с помощью анализа новостей, официальных документов и заявлений регуляторов.

Примеры критериев:

• Провалы аукционов ОФЗ
• Резкий рост доходностей и экстренные меры Минфина
• Новые ограничения на переводы, платёжную инфраструктуру
• “мобилизационная” риторика про сбережения населения
(Полный список в формате JSON)


Сначала я как обычно сделал мультиагентную систему:
• отдельные агенты проверяли каждый критерий
• затем агент-суммаризатор делал общий вывод

Это заработало, но не идеально.

Проблемы:
• агенты не общались между собой и выполняли дублирующиеся поиски;
• финальный агент видел только сжатые отчёты, но не всю поисковую выдачу

В результате он мог слишком остро реагировать на проходные новости, например:
«Торги были приостановлены?» — да.
«Почему?» — потому что праздники.
Но вторая часть информации до финального агента просто не доходила из-за сжатия контекста.


Тогда я попробовал новый (хорошо забытый старый) подход — вся логика в одном ванильном ReAct-агенте.

Если раньше агенты могли выполнять цепочки действий в 5–10 шагов (за редким исключением), то сегодняшние модели-лидеры способны работать десятки минут и даже часы, выполняя сотни действий подряд.

Поэтому я сделал так:
• дал агенту поиск
• загрузил все 46 критериев
• попросил последовательно проверить каждый из них и сформировать отчёт строго заданного формата

Контекста в 200k токенов на это как раз хватило. Ради эксперимента сделал реализацию на базе Anthropic Agent SDK. Весь код выложил на GitHub

Получился агент, который:
• выполняет задачу примерно за 10 минут
• прогон стоит около ~$1
• выдаёт структурированный отчёт с уровнем риска

Я запустил его на регулярную работу в 9:00 MSK. Результаты он будет публиковать в этом Telegram-канале (можно подписаться, он так и будет работать, пока у меня вклады не заморозят деньги не кончатся).

Главные идеи:
1. Агенты в 2026 уже могут совершать десятки и сотни шагов если просто попросить. Не всегда нужно обмазывать их кучей guardrails, structured output, делить на маленьких суб-агентов и т.п. Мистер агент 2026 - это ванильный ReAct с todo-листом, файлами и, если нужно, REPL.
2. Этот проект можно легко переделать под другие задачи. Нужно просто отредактировать файл с критериями и цель главного промпта. Критерии можно сгенерировать с помощью GPT Pro.

P.S. На всякий случай напомню:
всё это - эксперимент по изучению возможностей AI-агентов
и не является инвестиционной рекомендацией 🙂
🔥38🤣64🐳3👏1🗿1
задачи на 2027:
- купить Optimus 3
- сделать из него Вертера

#юмор
———
@tsingular
😁46👍72💯2👾1