Технозаметки Малышева
11.1K subscribers
4.57K photos
1.68K videos
41 files
4.64K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
MLflow и OpenClaw: гайд по наблюдаемости

MLflow выпустил официальный гайд по трейсингу OpenClaw-агентов. Проблема знакомая: агент автономно решает, какие инструменты дергать, в каком порядке и стоит ли спавнить саб-агентов. Когда всё работает — непонятно почему. Когда ломается — непонятно где.

🔍 Что видно в трейсе: Каждый запуск агента — иерархическое дерево спаунов. LLM-вызовы с полным промптом и ответом, инструментальные вызовы с параметрами и результатами, саб-агенты со своими вложенными шагами.
Токены, тайминги, ошибки — всё под контролем.
ReAct-цикл агента разворачивается в пошаговую хронологию.

🏠 Local-first: MLflow полностью self-hosted, Linux Foundation. Трейсы лежат на вашей машине, ни байта не уходит наружу. Для персонального агента с доступом к почте, календарю и файлам это обязательное требование.

🛡 AI Gateway: Проксирует LLM-вызовы, хранит API-ключи в одном месте (зашифрованные), и даёт глобальный бюджетный лимит по всем провайдерам. Бесконечный retry-loop саб-агента больше не сожрёт бюджет незаметно.

📊 Dashboard + Auto Eval: Дашборд показывает частоту ошибок, популярность инструментов, тренды токенов. Automatic evaluation подсвечивает проблемные паттерны без ручного анализа.

🔄 Цикл самоулучшения: Человеческий фидбек (thumbs down на трейс, заметка по сессии) превращается в датасет. Агент через MLflow CLI/скиллы может читать свои трейсы, видеть негативный фидбек и корректировать скилл-определения. Наблюдение → аннотация → обучение на собственной истории.

⚙️ Установка:

openclaw plugins install @mlflow/mlflow-openclaw

uvx mlflow server --port 5000

openclaw mlflow configure.


Трейсинг автоматический, навыки и конфиг агента менять не нужно.

💼 Зачем бизнесу: Агенты без наблюдаемости — это самолёт без приборной панели. MLflow Tracing даёт тот минимум телеметрии, при котором агент превращается из хайпа в инженерную систему. Трейсы → фидбек → датасет → оценка → итерация. Классический ML-цикл, только на уровне агента.

Для Гермесика бы еще выпустили

#MLflow #OpenClaw #трейсинг #наблюдаемость #агенты #LLM
───
@tsingular
18👍6🔥531
Используя Anthropic Mythos Firefox закрыли больше уязвимостей в апреле, чем за 15 месяцев до этого суммарно.

#Mythos #Firefox #cybersecurity
------
@tsingular
14🔥10🤔4🤯3❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Не ну без интернета дальше только так.
Без вариантов :)

#юмор #баян
------
@tsingular
😁19🔥18🤣9🤔3
Noustiny: ИИ режиссёр для Hermes

Хакатонный проект в рамках Nous Creative Hackathon 2026 принес движок, который превращает затравку истории в разветвлённое дерево сценариев с советом ИИ-критиков, клонированным голосом и видеорендером. Построен поверх Hermes Agent.

🤖 Совет критиков на каждом узле: Каждая сцена проходит через совет из трёх ролей: критик непрерывности ловит противоречия, редактор латает дыры, оценщик утверждает или отвергает правку. Вставил новый эпизод посередине дерева: каскад автоматически пересобирает все последующие сцены, пока повествование снова не станет стройным. Два типа сплайса: врезка в канон (каскад срабатывает) и параллельная ветка (каскад молчит).

🔗 12 инструментов, 13 навыков:

Состояние истории: граф дерева с канонической цепочкой, обходчик контекста, трекер лейтмотивов через всю сюжетную арку.

Непрерывность персонажей: генератор 1-4 персонажей с портретами, свободными от авторских прав. Разрешение алиасов (например «Мистер Старк» → Tony Stark). Подбор нужного портрета на каждой сцене. Детектор авторских прав: заменяет защищённые имена на описания перед вызовом генерации изображений.

Голос: подбор персоны и тембра по сюжетному запросу. Скачивание и нормализация аудио через yt-dlp + ffmpeg в 24 кГц. Клонирование голоса через ElevenLabs IVC с таймстемпами, кеш по хешу.

Рендер: один вызов через FastAPI, на выходе готовый MP4.

⚙️ Архитектура: 12 инструментов и 13 навыков, подключаются к любому развёртыванию Hermes. Рендер-цепочка: режиссёр озвучки → сборщик сэмплов → клонирование голоса → сторибук. Четыре инструмента в одном ответе модели, без оркестрации на стороне приложения.
Web-канва: Next.js 16 / React 19, splice-жесты прямо на дереве.

💼 Зачем бизнесу: Разветвлённые нарративы с автокоррекцией: вставил сцену, каскад пересобрал арку. Клонирование голоса через IVC: кинул ссылку на YouTube, получил озвученный MP4 тем же голосом, что и оригинал. Зачистка авторских прав из коробки: защищённые имена автоматически заменяются на описания перед генерацией картинок.

29 звёзд, 4 форка, TypeScript 78% / Python 21%.
Свежий хакатонный прототип (4дня), но конвейер собран на совесть.
Практически замена ComfyUI

#Noustiny #Hermes #видео #навыки
------
@tsingular
1🔥15632🆒1
Forwarded from AI Product | Igor Akimov
Специально оставил на утро внимательно почитать и потестить.
Inworld (я кажется их один из фанатов) выпустили Realtime TTS-2 – голосовую модель, заточенную под живой диалог, а не аудиокниги
Уже #1 в голосовой арене на https://artificialanalysis.ai/text-to-speech/leaderboard
То есть выше и OpenAI, и Gemini, и ElevenLabs, а теперь переходят в скорость и бьют по Cartesia, Minimax и быстрые традиционные озвучки.
Теперь еще и на 100 языках (русский и раньше был).
Пишут, что все TTS до этого учились на аудиокнигах и нарративе – модель получает текст, выдаёт звук, никогда не слыша того, кто на другой стороне. Realtime TTS-2 делает лучше – модель слышит всю аудио-историю диалога и подстраивает подачу под состояние пользователя.

Выделяют 4 фишки:
- Voice Direction – режиссёрские ремарки прямо в тексте в скобках. Не пресеты эмоций, не слайдеры, а свободный prompt в стиле LLM. Например: [speak tired but warm, like she just got home] – и модель меняет подачу. Длинные описательные промпты работают лучше коротких лейблов.
- Conversational Awareness – модель получает на вход не транскрипт, а реальное аудио предыдущих реплик. Одна и та же фраза после шутки и после плохой новости звучит по-разному, потому что модель слышала предыдущую реплику.
- Crosslingual – одна идентичность голоса в 100+ языках, включая переключение языка в середине фразы внутри одной генерации. Тембр, высота, характер сохраняются. Никаких флагов языка, никакой библиотеки голосов под каждый язык.
- Advanced Voice Design – генерация нового голоса из текстового описания. Прозой описал персонажа, сохранил как голос, дальше используешь как любой другой. Без референсного аудио.

Заявляют <200мс до первого аудио (то есть на уровне топов), совместимость с OpenAI Realtime API, клонирование голоса по 15 секундам, 3 режима (для персонажей, сбалансированный и для озвучки).

Стоимость - 3.5с за минуту, дешевле практически всего аналогичного качества (Google стоит 3.7, Cartesia 3.9, ElevenLabs 10).

Больше информации и демки: https://inworld.ai/blog/realtime-tts-2

Вот здесь можно лайкнуть на ProductHunt (сегодня у них запуск): https://www.producthunt.com/products/inworld-ai
🔥123🆒2🥰1
Google IO 19-20 мая пройдет.

Записываем в календарик.
Судя по расписанию, будет интересно.

#Google #конференции
———
@tsingular
532
Ряд пабликов пишут, что Claude начала массово блочить аккаунты россиян

При этом деньги за подписки не возвращают. Весь контент, наработки, код и аналитика улетают в трубу.

Пишите в комментах, как у вас с Клодом, это вброс или реальная проблема ?
👻12🔥8👏4😁2😢2🤣2
Пользователи: Ааа.. Клод блокирует! Зашоо! Что делать?

Так же пользователи: ну мы тут подписку за $20 одноразовую покупаем на биржах в обход блокировок, выжимаем на $7К агентами, с tool use и т.д. 24/7 фармим триллионы контекста. Антропик никогда не окупится, - ИИ скам вообще.

МА-ЛАД-ЦЫ! :)

#юмор
———
@tsingular
🤣39😁3👨‍💻2👍1💯1😐1
Правительство США официально опубликовало материалы про НЛО.

там около 100 PDF и немного видео.
Запустил Гермеса с DeepSeek Pro почитать что там опубликовали.

Удобно конечно что достаточно дать ему ссылку на deepseekOCR в ollame и дальше он сам разбирается как с её помощью все возможное из этих PDF сканов вытащить

через 4 часа обещает дать отчет.
(отчёт уже на 126 страниц)

опубликую в этой ветке

#UFO #НЛО #Hermes
———
@tsingular
🔥46👏18👀63🫡3🤣21
слушайте, я снова фанат DeepSeek.
зарядил его в несколько Гермесов и OpenCode и вот за всё время он еле еле 1 доллар потратил при том, что все задачи упорно выполняет и доводит до результата.

это просто аттракцион невиданной щедрости, - до конца месяца там скидки под 75% у них на прямом API (0,87 за лям)

а некоторые ушлые роутеры берут сразу без скидки 3.5+ бакса за 1 млн токенов.

Рекомендую, в общем.

#DeepSeek #Hermes
———
@tsingular
👍27🔥6🙏4💯1
И, кстати, что интересно - $0.79 это за 40 миллионов токенов работы агентов получается, потому что в основном всё лупит в кэш!!!
Ещё один плюс работы через Гермеса

#Гермес
———
@tsingular
🔥13🤯321🙏1
Forwarded from Russian OSINT
Специалист по кибербезопасности Маркус Хатчинс (известный тем, что остановил распространение шифровальщика WannaCry) провел эксперимент по автоматизации поиска 0-day уязвимостей с помощью ИИ-модели Claude Opus без ограничений безопасности.

По его наблюдениям, современные нейросети не обладают магическими способностями и в реальности плохо понимают архитектуру компьютера. Они работают исключительно как механизмы поиска знакомых паттернов в коде. Маркусу пришлось самостоятельно писать скрипты для подготовки драйверов Windows 11 и выстраивать жесткую логику запросов для направления ИИ в нужное русло. Хатчинс подчеркивает, что ИИ может идеально процитировать теорию (например, безупречно объяснить, что такое технология защиты ASLR или что такое Read/Write примитивы), но она не способна связать эти знания воедино на практике.

Хатчинс заявляет прямо: "Это не LLM учит меня эксплуатации уязвимостей. Это я учу её".
Чтобы ИИ смог выдать хоть какой-то адекватный результат, Маркусу пришлось:

🐍 Написать огромный фреймворк на Python
📞 Самостоятельно декомпилировать ассемблерный код в си-подобный псевдокод (потому что ИИ ужасно работает с реверс-инжинирингом ассемблера)
💻 Пришлось использовать многолетний опыт поиска уязвимостей, буквально описывая для ИИ каждый шаг и каждую потенциальную ошибку

🤖Поиск уязвимостей остался крайне дорогим и трудоемким процессом. Обработка одного файла стоила около $2, а для обнаружения одной действительно ↔️критической ошибки автору пришлось проанализировать четыре сотни драйверов.

В итоге только этап получения базового отчета обошелся в $800. Исследователь считает, что неопытным 🥷злоумышленникам будет крайне сложно генерировать эксплойты с помощью ИИ без глубоких знаний в реверс-инжиниринге и значительных финансовых вложений.

Внедрение ИИ-инструментов помогает безопасникам защитить свою инфраструктуру, а программисты получают новые возможности для быстрого исправления ошибок в своих продуктах. При этом на первый план выходит проблема неравномерного распределения ресурсов. Крупные технологические гиганты могут позволить себе оплачивать дорогостоящие вычисления, тогда как критически важные проекты с открытым исходным кодом остаются без надежной защиты.

Общественности стоит задуматься над тем, что нужно разработать новые способы совместного финансирования таких проверок для обеспечения безопасности фундаментальных программных решений.

👆Тесты проводились на 🈁 Claude Opus 4.6. Хатчинс тестировал 📖поиск уязвимостей нулевого дня в драйверах уровня ядра (kernel drivers) для Windows 11 от сторонних разработчиков.

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍432🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Результат прогона Гермеса по коллекции открытых материалов в комментарии

Там же зип файл с текстами

Анимация - Гермес
Музыка - Гермес ->Suno
Сборка - Гермес

#Hermes #UFO
———
@tsingular
🔥2063
С Праздником Великой Победы!

Низкий поклон всем тем, чей подвиг в прошлом и настоящем позволяет нам строить будущее.

#9мая
———
@tsingular
❤‍🔥86🔥26🤝107🎉6
Принстон построил биочип с живыми нейронами внутри

Пока стартапы соревнуются за GPU-оптимизацию, команда из Принстона пошла другим путём: встроила десятки тысяч живых нейронов прямо в 3D-сетку электродов.

🧠 Архитектура Inside-Out: 70 000 нейронов выращены внутри 3D-сетки из электродов, покрытых эпоксидной оболочкой, которая по мягкости совпадает с тканью мозга. Нейроны растут сквозь сетку, формируя связи, а электроды считывают и стимулируют их активность. Стабильность recordings: 6+ месяцев.

⚙️ От игрушки к инструменту: Предыдущие подходы сажали нейроны на плоскую 2D-подложку: плотность контактов мала, сигналы затухают. 3D-сетка с эпоксидным покрытием решает обе проблемы и впервые даёт стабильную двустороннюю связь с живой нейронной сетью на срок больше полугода. Демонстрация: распознавание электрических паттернов.

💼 Зачем бизнесу: Мозг потребляет ~20 Вт на задачу, которую GPU жжёт киловаттами. Если архитектура 3D-MIND масштабируется, биогибридные чипы станут альтернативой для edge-inference и нейроморфных вычислений. Применения: тестирование лекарств на живых нейронах, нейроинтерфейсы. Скоро wetware-акселераторы будут конкурентами силиконовым.

🔗 Аналогичные проекты:
FinalSpark Neuroplatform - швейцарский cloud-доступ к органоидам, $500/мес, дофаминовое обучение, 100 дней жизни органа, 34 университета
Cortical Labs CL1 - 200 000 нейронов на чипе, 6 месяцев жизни, встроенная life support, $35 000, играет Doom и Pong
Koniku Kore - чип с нейронами мыши на кремнии, «кибернетический нос»: детектирует летучие соединения (фентанил, взрывчатка, раковые клетки)
Brainoware - Indiana University, органоид на чипе для reservoir computing, распознавание речи, Nature Electronics 2023

#биочипы #нейроинтерфейсы #wetware #Принстон #Lexx
------
@tsingular
9🔥932
This media is not supported in your browser
VIEW IN TELEGRAM
Промпт для Гермеса:

Пришли мне webgl html файл по этой инструкции:

a=(x,y,d=mag(k=4*cos(x/21),e=y/8-20))=>circle((q=3*sin(k*2)+.3/k+sin(y/19)*k*(9+2*sin(e*14-d*3+t*2)))+50*cos(c=d-t)+200,q*sin(c)+d*39-475,k*k>15?2:1)
t=0,draw=$=>{t||createCanvas(w=400,w);background(9).noStroke().fill(w,116);for(t+=PI/240,i=1e4;i--;)a(i,i/235)}

Результат в комментарии

#webgl #Hermes #анимация #амеба
------
@tsingular
🔥2785🤯21
Прикол.
Курсор прислал письмо - мы видим, что вы не доделали работу вчера из-за того, что у вас закончился баланс, поэтому мы докинули вам $20 - вернитесь и доделайте, даём вам неделю. :)))

#Cursor #маркетинг
------
@tsingular
🔥56😁319👍5👏2
Media is too big
VIEW IN TELEGRAM
Гениально. Gpt Image2+ Seedance 2.0

С таким качеством и полный метр бы посмотрел.

#нейрорендер #роботы #зомби #seedance #gptimage
------
@tsingular
🔥57135🏆4👍1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё немного шейдерной красоты вам в ленту:

for(float i,g,e,s;++i<18.;){vec3 p=vec3((FC.xy-.5*r)/r.y*2.,g-.8);p.xz*=rotate2D(t*.3);s=1.;for(int i;i++<13;p=vec3(0,3.5,3)-abs(abs(p)*e-vec3(3,1.8,3)))s*=e=max(1.01,9.5/dot(p,p+cos(t*.6)*.1-.1));g+=mod(length(p.yy),p.y)/s*.5;o.rgb+=hsv(.03/g,.6*p.x,s/1e4);}


Html в комментарии (на большом экране смотрится круче)

#шейдеры
------
@tsingular
🔥2244🆒32👾1
This media is not supported in your browser
VIEW IN TELEGRAM
Будущее уже наступило, просто оно неравномерно распределено

#jarvis #мультиагенты #мстители
------
@tsingular
😁298🔥72
Forwarded from эйай ньюз
Google тестит Gemini Omni

Похоже теперь Gemini умеет в видеогенерацию, а моделям Veo, как отдельной линейке, пришёл конец. Логичный шаг, учитывая возможность Gemini выдавать на выход как аудио так и изображения. Модель скорее всего полноценно покажут на следующей неделе, на Google I/O.

@ai_newz
🔥1665👍2🤔2😐2