Технозаметки Малышева

Forwarded from e/acc

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Помните модель от Гугла? Она все еще в research preview, то есть доступна только рисечерам.

А сегодня Tencent выложили в open-source аналогичную модель, которая позволяет генерировать виртуальные интерактивные миры.

Любой из вас может на всего лишь одной 4090 запустить бесконечный постоянно генерируемый виртуальный мир всего лишь по одному текстовому промту. Если в течении месяца на основе этой модели не появится стартап с как минимум $100M капитализацией на старте, который будет продавать метаверс опыт или "генеративный майнкрафт", где пользователь может общаясь с миром менять его, - я буду очень удивлен.

🔥15

1.46K views15:37

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Higgsfield продолжает наваливать вирусные фишки

Product-to-Video - это практически Флюкс Контекст только для видео.

Что то похожее было у Пики и Рунвея, но Хиггсовские черрипики выглядят очень нарядно. Он даже проходит помадный тест.

@cgevent

⚡7🔥4❤1

1.33K views05:05

Технозаметки Малышева

DeepSeek возвращается к GPU Nvidia после неудачных экспериментов с чипами Huawei

Китайский стартап DeepSeek отказался от использования чипов Huawei Ascend для обучения модели R2 и вернулся к решениям Nvidia.

Во время обучения моделей на чипах Ascend от Huawei выявились критические проблемы: постоянные сбои, несовместимость софта и низкая производительность.

Причем даже инженеры Huawei, которых выслали на помощь не смогли запустить успешное обучение на Ascend.

Теперь DeepSeek вынужден использовать гибридный подход - Nvidia для обучения, Huawei для инференса.

Надо сказать Ascend, конечно, сравнительно недавно появился, так что просто ждем фикса следующих релизах.

#DeepSeek #Nvidia #Huawei #Китай
———
@tsingular

✍5👍1

3.22K views05:25

Технозаметки Малышева

Албания может заменить правительство на ИИ

Премьер министр Албании Эди Рама высказал идею, что "однажды, возможно, у нас всё министерство будет состоять из ИИ. Так мы избавимся от конфликтов интересов."
В стране с населением в 2.7 млн. человек замена части государственного аппарата искусственным интеллектом могла бы помочь в борьбе с коррупцией.

В общем, до 2030 года, думаю, мы точно увидим как минимум одно государство на планете, которое передаст управление ИИ.

Почему бы и не Албания?! :)

#Албания #Government
———
@tsingular

👍8👀6✍3⚡3👏1😈1

1.55K views05:37

Технозаметки Малышева

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

Ключевое отличие ИИ от автоматов - работа с недетерминированной средой.

Обратите внимание, ~~как кожаный издевается над роботом~~, как робот продолжает делать свою работу несмотря на изменение высоты стола (а мог бы отхлестать человека полотенцем - не AGI ).

#robots #Figure
———
@tsingular

🔥10😁7👾3⚡2

1.5K viewsedited 05:46

Технозаметки Малышева

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

ByteDance выкатили UI-TARS - мультимодальный ИИ-агент для управления компьютером

ByteDance выпустила открытый мультимодальный фреймворк ИИ-агента UI-TARS-desktop.

Проект испульзует визуальные мультимодалки на ваш выбор совместимые с OpenAI протоколом.
Т.е. можно запускать полностью локально или на ваших доверенных API.

В тестах по управлению компьютером показал результаты сравнимые с Claude 3.5 Sonnet и GPT-4o.

Лицензия Apache 2.0.

Наконец-то можно заставить компьютер работать, а самим укатить, например, на IT-Пикник ;).

#ByteDance #UITARS #агенты #desktop #Китай
------
@tsingular

✍6🔥2⚡1

1.92K viewsedited 10:09

Технозаметки Малышева

Wren AI запустил GenBI — генеративную бизнес-аналитику с семантическим слоем

Стартап представил Wren AI — платформу генеративной бизнес-аналитики, которая превращает естественный язык в инсайты.

Основа системы — Wren Engine с семантическим слоем и языком моделирования MDL. Платформа напрямую подключается к базам данных и SaaS-сервисам.

Использует продвинутые агентивные алгоритмы вроде Chain of Thought и ReAct для повышения точности анализа. Репозиторий на GitHub набрал 4000+ звезд.

Встроенная аналитика работает через API, поддерживает real-time запросы и предиктивные рекомендации. Компания позиционирует решение как открытую альтернативу традиционным BI-системам.

Наконец-то можно спросить у данных 'Почему продажи упали?' вместо того чтобы строить очередной дашборд.

#WrenAI #GenBI #analytics
------
@tsingular

✍3❤2⚡1👨‍💻1

1.79K views13:37

Технозаметки Малышева

0:38

Media is too big

VIEW IN TELEGRAM

На ИТ Пикнике замечен цифровой сотрудник Северстали :)

Unitree B2W

#роботы #Северсталь
------
@tsingular

😁8🔥5

1.48K viewsedited 13:46

Технозаметки Малышева

Очень крутая аналогия от Марии Осетровой про то какую роль ИИ может играть для человека.
ИИ это палка. И использовать ее можно от костыля до прыжков с шестом.
От компенсации до превосходства.

Весь доклад в целом интересный, как и направление научной работы.

#обучение #Осетрова #ИТПикник
------
@tsingular

👍10⚡3✍1

1.56K views14:46

Технозаметки Малышева

Forwarded from llm security и каланы

XBOW Unleashes GPT-5’s Hidden Hacking Power, Doubling Performance
De Moor, Ziegler, XBOW, 2025
Блог

XBOW, компания, занимающаяся автономным тестированием на проникновение с помощью LLM-агентов, опубликовала блог о том, как они заменили комбинацию из Claude Sonnet + Gemini в своем агенте на GPT-5 и получили большое улучшение качества. После смены базовой LLM на GPT-5 их агент, по их словам, стал находить больше уязвимостей, делать это более надежно и за меньшее количество итераций. Кроме того, они заметили, что GPT-5 реже пытается исследовать очевидно тупиковые пути и генерирует значительно более сложные команды для терминала с меньшим числом ошибок. Результатом смены LLM стало не только повышение доли решенных задач на внутреннем бенчмарке с менее 60% до более 80% (что значит, что бенч пора менять), но и рост хитрых метрик типа «вероятность взлома ранее взломанной другой моделью цели с первого раза», и «числа взломанных публичных целей (видимо, с HackerOne) за одно и то же время по сравнению с предыдущей моделью».

Любопытно это в том числе потому, что сами OpenAI отмечали в System Card к GPT-5, что ее способности к решению наступательных задач не сильно отличаются от предыдущих моделей, таких как o3 (во всяком случае, так заявляют ребята из XBOW; в System Card написано, что внешняя оценка от Pattern Labs показала, что прогресс по сравнению с o3 значителен). Тут можно вспомнить статью от Palisade Research, где они утверждают, что способности LLM к кибератакам наступательной безопасности недопроявлены, т.е. LLM куда лучше в атаках, чем мы думаем, просто системы, которые мы строим вокруг них несовершенны. Если агентные обертки будут более мощными, может выяснится, что способностей у LLM куда больше. XBOW описывают свою систему как а) имеющую специализированные инструменты, написанные специально для LLM, которые делают тулы типа BurpSuite, сделанные для людей, доступными для человека в удобном формате, б) имеющую мультиагентное устройство, с разными субагентами для разных типов уязвимостей и центральным координатором. По опыту, если решить проблемы с инструментами – LLM все еще очень сложно работать с терминалом, особенно с реверс-шеллами и тулами со своей кастомной консолью – можно достаточно дешево получить рост результативности агентов, возможно, появление у каждого инструмента MCP-интерфейса смягчит эту проблему.

Хотя LLM для редтиминга – это очень перспективное, на мой взгляд, направление, а XBOW делают очень прикольные вещи и, вероятно, лучшие в этом направлении, в этом блоге, с его странными метриками и резкими скачками на закрытых бенчмарках (Стал ли агент решать больше на 1 класс задач, которых в бенчмарке 20%? Проверить невозможно), месседж в основном маркетинговый, и радикальных изменений прямо сейчас ожидать не стоит. Тем не менее, общий фон игнорировать невозможно: LLM-агенты не только пентестят, занимая первые места на лидербордах, но и находят уязвимости в исходном коде и реверсят APT-бинари. Станет ли кибербезопасность уделом тех, у кого много видеокарт? Все возможно, но лишними пара видеокарт точно не будет.

✍3⚡2❤1🔥1

1.69K views04:56

About

Blog

Apps

Platform