Технозаметки Малышева

Yandex запустил AI WAF на базе SolidWall WAF и SmartWeb Security

https://yandex.cloud/ru/services/smartwebsecurity

Эфир смотрим тут
https://scale.yandex.cloud/?utm_source=notify_sms&utm_campaign=event_mixed_15

#Яндекс #MLWAF #cybersecurity
———
@tsingular

✍4🔥2⚡1🆒1

1.45K viewsedited 09:14

Технозаметки Малышева

Яндекс запустил платформу для создания агентов на базе AI studio.

end-to-end среда с выбором моделей, ролей-промптов, поиском по файлам (локально или из хранилища знаний), очень похожая внешне на OpenwebUI, но в облаке.

Можно подключить поиск в интернете, создавать или подключать MCP сервера.

Есть свой MCP-hub ( уже завели Контур и AmoCRM)

Есть no-code среда workflows для создания готовых процессов для работы агентов в сложных сценариях.

#Яндекс #агенты #MCP
——-
@tsingular

🔥8✍2👍1

2.25K views09:33

Технозаметки Малышева

Forwarded from Битрикс24 для бизнеса

MCP-сервер Битрикс24 скоро станет публичным 🔥🔥🔥

Мы развернем МСP-сервер (Model Context Protocol), который будет маршрутизировать работу ИИ-помощников. Это позволит ИИ-агентам подключаться к внешним системам и ресурсам.

🗣

Сценарии, которые будут доступны пользователям:

✔ Работа с Битрикс24 из сторонних инструментов.
Например, если необходимо получить данные из сервиса, внести событие в календарь или загрузить файлы. Решение позволит нетехничесому персоналу самостоятельно управлять пользовательскими данными в «Битрикс24».

✔ Работа со сторонними сервисами в Битрикс24. Например, получить доступ к файлам Google, почтовому ящику, таск-трекеру или другим инструментам, чтобы обогатить информацию внутри Битрикс24.

✔ Работа внутри Битрикс24 через MCP-сервер. Решение позволит с помощью встроенного ИИ-ассистента «Марты AI» в формате чата работать с инструментами, автоматизировать процессы, составлять отчеты, анализировать нагрузку отделов внутри Битрикс24.
________
🚀 Кстати, создали новый канал, где будем рассказывать все-все про MCP, зачем он нужен и как будет работать в Битрикс24! Подписывайтесь

⚡️

Please open Telegram to view this post

VIEW IN TELEGRAM

✍10⚡4

1.47K views14:17

Технозаметки Малышева

OpenAI и SAP запускают суверенный ИИ для Германии

SAP, OpenAI и Microsoft создают суверенную версию ChatGPT для немецкого госсектора.

Инфраструктура развернется на базе Delos Cloud от SAP с 4000 GPU к 2026 году.

Все данные останутся в Германии под местным законодательством - полное соответствие GDPR и суверенитет.

SAP инвестирует €20 млрд в цифровую независимость Германии.

4000 GPU, - выглядит не серьёзно при том, что Альтман уже начал обсуждать 250 гигават на ИИ в рамках Старгейта, - а это сотни миллионов GPU получается по грубым прикидкам.

Ну и суверенный ИИ на американской технологии - звучит как "независимая зависимость".

#SAP #OpenAI #Германия
———
@tsingular

🔥10❤‍🔥2❤1⚡1

1.57K viewsedited 04:53

Технозаметки Малышева

ИИ модели используют материалы из отозванных научных статей

Исследователи из MIT обнаружили, что большие языковые модели активно цитируют и воспроизводят содержимое научных публикаций, которые позже были отозваны из-за ошибок или мошенничества.

Проблема серьёзная: 67,4% отзывов связаны с научным мошенничеством, а в 2023 году отозвали свыше 10 000 работ.

Модели не различают достоверные данные от сомнительных. Они просто заучивают всё подряд из тренировочных датасетов.

Крупные издательства вроде Taylor & Francis и Wiley заключают многомиллионные соглашения на использование контента для обучения ИИ, но механизмов отслеживания отозванных материалов нет.

Технически отфильтровать такой контент крайне сложно - нужно постоянно обновлять чёрные списки и переобучать модели.

Получается ИИ не только галлюцинирует, но ещё и цитирует лженауку.

Хавает что попало, а люди верят и пишут новые научные статьи. :)

#Retractions #Training #Data
------
@tsingular

✍7🤔3⚡2👾1

1.58K viewsedited 05:11

Технозаметки Малышева

1:33

This media is not supported in your browser

VIEW IN TELEGRAM

Skild AI показали адаптивную систему управления роботами.

Роботы проходят тесты на адаптацию к повреждениям: теряют ноги, колени, но продолжают двигаться.

Skild таким образом создали универсальный адаптивный ИИ — один «мозг» управляет разными роботами без предварительного обучения.

Роботы адаптируются к новым конечностям (например, деревянным) и внешним силам (нагрузка, толчки).

Работают с нештатными ситуациями — например, застрявшими колёсами или сломанными суставами.

ИИ при этом демонстрирует эмерджентное поведение — самообучается в реальном времени, не зная заранее, как устроен робот.

Тесты подчеркивают устойчивость и гибкость системы — роботы восстанавливают функциональность даже после серьезных повреждений.

#SkildAI #роботы
———
@tsingular

👍8🔥7👾4⚡2❤1😢1

5.04K viewsedited 05:26

Технозаметки Малышева

🚀 Qwen3-Max: эффект масштаба

Alibaba выпустили Qwen3-Max — самую крупную модель в их линейке, которая уже заняла 3-е место в Text Arena, обогнав GPT-5-Chat.

Технические характеристики:
- 1+ триллион параметров с предобучением на 36 триллионах токенов
- MoE архитектура без единого скачка loss'а во время обучения — стабильность уровня "мечта ML-инженера"
- 30% прирост MFU по сравнению с предыдущей версией благодаря PAI-FlashMoE
- Контекст 1М токенов с ChunkFlow стратегией

Результаты:
- SWE-Bench Verified: 69.6 баллов — решение реальных багов на уровне SOTA
- Tau2-Bench: 74.8 баллов — превзошли Claude Opus 4 и DeepSeek V3.1 в агентских задачах
- Qwen3-Max-Thinking — в разработке:
но уже показывает 100% на AIME 25 и HMMT — математических бенчмарках, где обычно модели "ломаются".
Секрет в параллельных вычислениях и интеграции с кодовым интерпретатором. (читеры :) )

Особенно интересно наблюдать, как китайские команды методично отстреливают западные модели по всем фронтам.
И графика с Wan 2.5 и opensource, Qwen3-Omni, Qwen3-VL, теперь вот Max.

Пробуем тут: https://chat.qwen.ai/

#Qwen #Alibaba #Qwen3 #Китай
———
@tsingular

🔥8👍2❤1

1.61K viewsedited 06:18

Технозаметки Малышева

TrendMicro: обзор уязвимостей LLM моделей

Trend Micro выпустила обзор основных уязвимостей больших языковых моделей.

Исследователи выделили три ключевые поверхности атак: прямое внедрение промптов, бэкдоры через RAG и эксплуатацию доверия между агентами.

Особенно уязвимы мультиагентные системы - они создают новые векторы атак в дополнение к традиционным уязвимостям.

Недавно обнаружили CVE-2024-7475 с оценкой 9.1 по шкале CVSS в проекте LocalAI, позволяющую выполнять произвольный код.

Атаки на уровне GPU могут снизить точность модели с 80% до 0.1% - "катастрофическое повреждение мозга".

Изучаем внимательно.

#TrendMicro #cybersecurity #LocalAI
———
@tsingular

✍6❤3⚡1

1.36K views08:53

Технозаметки Малышева

Microsoft добавляет Anthropic Claude в Copilot

Майкрософт снижает зависимость от OpenAI и интегрирует модели Claude от Anthropic в свой Copilot.

Теперь в одном Copilot можно получить ответы от разных ИИ. OpenAI наверно не в восторге от такого «партнёрства» :)

По опыту Соннет отвечает лучше и, видимо, пользователи "продавили" добавление, по-сути, конкурентной модели.

#Microsoft #Copilot #Anthropic
———
@tsingular

⚡5👍2✍1

1.32K views08:56

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

ShinkaEvolve от Sakana AI — прорыв в эволюционной оптимизации алгоритмов

Японская Sakana AI научила языковые модели проводить эволюцию алгоритмов на порядки быстрее традиционных методов.

Существующие решения типа AlphaEvolve требуют тысячи итераций для поиска решений.
ShinkaEvolve справляется за 150 попыток.

Система автоматически мутирует код, оценивает производительность и отбирает лучшие варианты.

Архитектурные инновации:
- Балансировка exploration/exploitation — умное сэмплирование "родителей" программ
- Novelty-Based Rejection Sampling — отбраковка минорных вариаций через LLM-судью новизны
- Adaptive LLM Prioritization — bandit-стратегия динамического выбора оптимальной модели из ансамбля

- Open source (Apache 2.0)
- Есть WebUI для визуализации процесса эволюции
- GitHub: github.com/SakanaAI/ShinkaEvolve
- Работает с любыми LLM-провайдерами

Когда компьют станет избыточным, - можно будет подключить к каждой модели как инструмент размышлений.
Там где сейчас REPL, например.

#ShinkaEvolve #Sakana
———
@tsingular

🔥7⚡1👍1

1.56K views09:32

Технозаметки Малышева

🔧 Google выпустил детальный технический гайд по созданию AI агентов

Полноценное техническое руководство от Google Cloud для стартапов — не маркетинговая брошюра, но практический мануал с архитектурными решениями, кодом и production-ready подходами.

Ключевые пункты:
- Agent Development Kit (ADK) — open-source фреймворк с поддержкой ReAct паттерна
- AgentOps методология — от прототипа до production с автоматизированной оценкой качества
- Model Context Protocol (MCP) — стандарт для подключения внешних источников данных
- Agent2Agent (A2A) — протокол межагентного взаимодействия

Практические архитектурные решения:
- Многослойная система памяти (долгосрочная, рабочая, транзакционная)
- Траекторный анализ для отладки цепочек рассуждений агента
Grounding через RAG → GraphRAG → Agentic RAG
- Контейнеризация через Docker для любых облачных платформ

Что особенно ценно:
Руководство построено на универсальных принципах архитектуры агентов.
Даже если вы не используете Google Cloud — концепции применимы для любых LLM-фреймворков (LangChain, CrewAI, AutoGen).

Разделы про оценку качества агентов и производственную отладку особенно полезны — область, где пока мало экспертизы на рынке.

Бонус: Agent Starter Pack — готовые Terraform-шаблоны для CI/CD, мониторинга и деплоя. Можно адаптировать под любую инфраструктуру.

В эпоху, когда каждый строит агентов на коленке — появился структурированный подход от команды, которая имеет опыт в построении масштабных ИИ архитектур планетарного масштаба.

Файл в комментарии. Изучаем (60 страниц).

#агенты #архитектура #Google #обучение
———
@tsingular

🔥12✍3👍3⚡1

2.2K views10:27

Технозаметки Малышева

2:46

This media is not supported in your browser

VIEW IN TELEGRAM

Suno v5, дамы и господа.

В принципе тему с творчеством можно закрывать.
ИИ перепоёт всех.

Это с 1 запроса.
Просто промпт - irish Acapello vocal
ничего больше, ну, кроме готового текста.

#Suno #музыка
———
@tsingular

🔥35👀12⚡3❤1👍1

8.48K viewsedited 11:23

Технозаметки Малышева

2:48

This media is not supported in your browser

VIEW IN TELEGRAM

Suno v5 - лирическая версия

https://suno.com/s/OdBz6HcqOuhgpjFm

#Suno #музыка
———
@tsingular

🔥34🤣10⚡4👀2❤1🤨1👻1

3.83K viewsedited 11:43

Технозаметки Малышева

Forwarded from эйай ньюз

1:07

Media is too big

VIEW IN TELEGRAM

ChatGPT Pulse

Теперь ChatGPT может проактивно ресёрчить топики которые считает важными и выдавать репорт каждое утро. Темы выбираются на основе недавних чатов, памяти, подключенных приложений и пожеланий пользователей. Уже доступно подписчикам Pro уровня в новой версии мобильного приложения.

@ai_newz

🔥8👍3

2.34K views18:40

Технозаметки Малышева

2:51

This media is not supported in your browser

VIEW IN TELEGRAM

Рейстлину

в 2001м году такая вот песня сложилась в армии по следам прочтения серии книг Dragonlance

Теперь можно озвучить.

#Suno
———
@tsingular

🔥29❤3

1.85K viewsedited 19:48

Технозаметки Малышева

2:45

This media is not supported in your browser

VIEW IN TELEGRAM

А еще для Премьер подписки Суно выпустил студию-редактор похожий на Fl-Studio

Studio

#Suno #Studio
———
@tsingular

🔥9❤2❤‍🔥1

1.77K viewsedited 21:05

Технозаметки Малышева

📊 OpenAI выпустили GDPval — бенчмарк для измерения реальной экономической ценности AI-моделей

Забудьте про академические тесты типа MMLU. OpenAI представили метрику, которая проверяет модели на том, за что платят деньги в реальном бизнесе.

Техническая архитектура:
- 1320 специализированных задач (220 в открытом доступе)
- 44 профессии из 9 ведущих отраслей экономики США
- Задачи создавали профессионалы с опытом 14+ лет в своих отраслях

Слепое сравнение: эксперты не знают, где работа AI, а где человека

Что внутри задач:
От юридических брифов и инженерных чертежей до планов ухода за пациентами и презентаций в PowerPoint.

Т.е. это не просто текстовые промпты — каждая задача включает референсные файлы, контекст и требует создания реальных рабочих документов.

Результаты тестирования:
- Claude Opus 4.1 — лидер с 47.6% паритета с экспертами (особенно силён в эстетике документов)
- GPT-5 high — 38.8%, хорошо показывает себя в точности и доменных знаниях

Прогресс OpenAI за год: от GPT-4o (12.4%) до GPT-5 (38.8%) — рост в 3+ раза
Скорость: модели выполняют задачи в 100x быстрее и 100x дешевле экспертов

Ограничения v1 теста:
- Пока только one-shot задачи без итераций и обратной связи.
- В реальности работа требует контекста, правок и неоднозначных решений — это в планах на следующие версии.

Датасеты и полная информация доступны тут: evals.openai.com и HF

Т.е. AI уже сейчас справляется с хорошо структурированными рутинными задачами на уровне профессионалов.
Дальше уже будет развитие доменной специфики и покрытие многоходовых сценариев.

#GDPval #OpenAI #бенчмарки
———
@tsingular

🔥8⚡3✍3👌1

1.62K views04:43

About

Blog

Apps

Platform