Machinelearning

📌

NousResearch подвела итоги хакатона Hermes Agent.

NousResearch завершила хакатон, запущенный в конце февраля вслед за релизом Hermes Agent.

Из 187 заявок жюри отобрало финалистов по 3 критериям: креативность, практическая польза и качество презентации. Призовой фонд составил $11 750.

🟡

Первое место и $7 500 забрал проект Media Tool

Это набор инструментов для обработки видео и аудио, который встраивается в Hermes как нативный скилл.

Загружаете файл в чат, описываете задачу текстом и получаете результат: обрезка, сжатие, конвертация форматов, наложение субтитров, генерация GIF-файлов, создание стикеров для Telegram или нормализация звука. Под капотом - ffmpeg. Работает через Telegram, Discord и CLI.

🟡

На втором месте ($2 500) - Hermes Agentic CAD Builder.

Агент находит реальные комплектующие в каталоге McMaster-Carr, подставляет фактические размеры найденной детали в параметрическую модель FreeCAD, анализирует, какие элементы сборки конфликтуют после изменений, и ведет спецификацию.

При обнаружении повторяющихся сценариев агент сам создает новые скиллы - например, для подбора определенного типа крепежа.

🟡

Третье место ($1 000) получил Hermes Sidecar.

Браузерное расширение, которое открывает чат с Hermes Agent рядом с любой страницей. Фишка проекта - селективный контекст: агент видит только то, что пользователь выбрал (текст страницы, выделенный фрагмент, изображения, содержимое PDF). Поддерживаются кастомные темы, голосовой ввод, TTS и работа через SSH.

🟡

Четвертое место ($500) - Terminal World Map with Live News.

Спутниковые снимки рендерятся цветными юникод-блоками прямо в терминале, поверх отображаются города из OpenStreetMaps и заголовки новостей, привязанные к координатам в реальном времени. Геокодинг-пайплайн определяет локации из заголовков, расставляет приоритеты по населению и близости к другим видимым новостям. Автор собрал проект за один день, работая через Hermes Agent с Opus 4.6.

🟡

Пятое место ($250) досталось HERMES Mars Rover

Симуляция автономного марсохода. Hermes Agent управляет моделью NASA Perseverance в среде Gazebo: планирование маршрута, считывание показаний IMU, четырех камер, LIDAR и контактных сенсоров, обход препятствий и генерация отчета о миссии.

Марсианская физика с гравитацией, проскальзыванием колес и динамикой ODE. За 25 минут автономной работы точность возврата на базу ~ 22 см. Ровер останавливается при наклоне больше 25°, сохраняет удачные треки и улучшает поведение от сессии к сессии.

Кстати, Hermes Agent написал роман «The Second Son of the House of Bells» - 79 456 слов, 19 глав. Агент выстроил собственный пайплайн по схеме, похожей на Autoresearch Андрея Карпатого: мироконструирование, черновики глав, состязательное редактирование, ревью через Opus, верстка в LaTeX, генерация обложки и аудиокниги.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤23👍20🔥10👏3

21.9K views09:00

Machinelearning

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

🙂 Танцуй, как будто никто не смотрит даже если ты робот

В ресторане Haidilao в Купертино, гуманоидный робот Lingxi X2 от компании Agibot вызвал переполох, когда начал бесконтрольно танцевать и сбивать посуду со столов.

Видео инцидента стало вирусным: на нем робот в фартуке с надписью «I'm good» размахивает манипуляторами и бьет по столу, разбрасывая палочки для еды и соусы.

По заявлению представителей ресторана, это не было технической неисправностью. Робот находился в штатном режиме, но по просьбе гостей его переместили слишком близко к столу, что и привело к столкновению.

Инцидент закончился без травм, но вызвал бурные обсуждения в сети о безопасности роботов и необходимости наличия легкодоступных кнопок экстренной остановки.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣126👍37🤔17❤11🔥8😁5🙉3👻1🤗1

25.6K views05:31

Machinelearning

✔️

Фонд Питера Тиля вкладывается в ИИ-ошейники для коров.

Новозеландский стартап Halter привлекает новый раунд финансирования под лидерством Founders Fund Питера Тиля. Раунд удвоит оценку компании до более чем $2 млрд. Сделка переподписана: инвесторов так много, что финальный объем раунда еще не определен.

Halter делает то, что уже работает на 5 тыс. ферм в 3 странах. Компания производит ошейники на солнечных батареях с GPS и ИИ-начинкой.

Ошейники создают виртуальные заборы для скота и позволяют фермерам отслеживать местоположение и здоровье животных через приложение. Управление стадом дистанционное: коров направляют вибрациями и звуковыми сигналами.

Система обучена на данных сотен тысяч животных, отслеживает пищеварение, циклы фертильности и паттерны поведения в реальном времени. Компания запатентовала название алгоритма - Cowgorithm.

Работает это так: фермер открывает приложение, рисует линию на карте, которая становится забором. Когда корова приближается к границе, ошейник вибрирует.

Через 10 дней животное перестает проверять границу. Нужно перегнать стадо - одно нажатие, и сотни голов идут куда нужно сами. Без собак, без ограждений, без ручного труда.

Основал Halter в 2016 году Крейг Пигготт. Он вырос на молочной ферме в Уайкато, окончил инженерный факультет Оклендского университета и в последний год учебы устроился в Rocket Lab. Проработав 9 месяцев у Питера Бека, Пигготт решил уйти, а Бек не просто отпустил его, но и сам вложился в Halter, войдя в совет директоров.

Сегодня у компании около 350 сотрудников, а системамы Halter управляют более 700 тыс. голов скота. Американские фермеры сэкономили порядка $220 млн только на физических заборах. Бизнес-модель: подписка: от $5 до $8 за животное в месяц.

🟡

Сделка хайпует не только в венчурном мире.

Тиль - сооснователь Palantir, компании, которая строит системы анализа данных и слежки для спецслужб и военных. Эта связь моментально породила конспирологическую волну в соцсетях.

Блогеры предлагают мысленный эксперимент: убрать из описания технологии Halter слово «корова» и заменить на «человек» - получается круглосуточный GPS-трекинг, мониторинг поведения, невидимые границы и управление через вибрации.

Тезис теории в том, что Тиль якобы обкатывает на скоте технологии, которые потом перенесет на людей, но фактических подтверждений этому нет.

Прямого технологического партнерства между Palantir и Halter отсутствует. Единственная реальная связь двух компаний - это кошелек Тиля.

Контекст важен и без конспирологии: агротех переживает тяжёлые времена, волна стартапов обанкротилась, венчурные фонды отступили от сектора. На этом фоне Halter — редкий единорог, растущий вопреки тренду.

Глава Icehouse Ventures подсчитал: при нынешних темпах Halter обгонит по стоимости Fonterra (крупнейший молочный кооператив Новой Зеландии) через 11 кварталов.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤89👏60🤔36👍12😍12💯8😁7🥰3🔥2👌2💘2

19.6K views07:55

✔️

OpenAI удвоит штат сотрудников.

До конца года OpenAI планирует увеличить число специалистов почти в 2 раза - с 4500 до 8000 человек. Найм связан с желанием закрепить лидерство в B2B-сегменте и ускорить продуктовую гонку с Anthropic и Google.

Новые кадры усилят разработку, инженерию, ИИ-исследования и продажи. Акцент - на поиске экспертов, которые помогут бизнесу интегрировать инструменты OpenAI в свои процессы.

Чтобы всех разместить, стартап уже подписал договор на новый офис (общая площадь превысила 93 тыс. кв.м). Для достижения целей OpenAI предстоит нанимать в среднем по 12 человек ежедневно.
ft.com

✔️

Глава Nvidia предложил включить ИИ-токены в зарплатный пакет инженеров.

Дженсен Хуанг озвучил новую модель компенсации: помимо базовой зарплаты, сотрудникам планируют выделять бюджет в виде ИИ-токенов. По словам CEO Nvidia, базовая ставка инженера в Кремниевой долине высока и компания готова добавить бонус в токенах, эквивалентный половине средней зарплаты.

Это позволит свободно запускать ИИ-инструменты и делегировать им задачи с минимальным вмешательством человека. Идея отражает видение Хуанга об эволюции рабочих мест: инженеры будут управлять целым парком цифровых помощников.

Nvidia уже делает ставку на подобный симбиоз - глава корпорации рассчитывает, что бок о бок с 42 тыс. сотрудников будут трудиться сотни тысяч ИИ-агентов. Доступ к корпоративным ИИ-ресурсам станет одним из главных инструментов ИТ-рекрутинга.
cnbc.com

✔️

Tesla, SpaceX и xAI анонсировали строительство крупнейшей в мире фабрики.

Триада объединит усилия для создания TERAFAB - полного цикла от микросхем и чипов памяти до передовой компоновки кристаллов. Плановая мощность достигнет 1 тераватта.

Проект задуман как база для ежегодного вывода на орбиту 100 млн. тонн оборудования для сбора солнечной энергии, запуска космических ИИ-спутников и развертывания миллионов роботов Optimus.

По оценкам инженеров, только для роботов потребуется выпуск чипов мощностью от 100 до 200 гВт. Такие потребности превосходят возможности всех мировых производителей полупроводников вместе взятых и оставляют далеко позади прогнозы индустрии на 2030 год.
Tesla в сети Х

✔️

Huawei представила ИИ-ускоритель Atlas 350.

На China Partner Conference 2026 вендор выпустил ускоритель Atlas 350 на базе процессора Ascend 950PR. По заявлениям разработчиков, мощность одной карты в 2,87 раза превышает Nvidia H20. Это единственный ИИ-ускоритель на китайском рынке с поддержкой вычислений в формате FP4.

По сравнению с прошлым поколением существенно выросли векторная производительность и пропускная способность интерфейсов. Ускоритель оснащен 112 ГБ памяти HBM собственной разработки, что позволяет загружать LLM до 70 млрд. параметров на одну карту.
finance.sina.com.cn

✔️

Pokémon Go помог создать систему визуальной навигации для роботов-курьеров.

За 10 лет фанаты игры невольно собрали базу для обучения пространственного ИИ. Приложение накопило более 30 млрд. фотографий реального мира благодаря квестам, мотивирующим сканировать памятники и здания. Niantic Spatial взяло этот датасет и собрало систему визуальной навигации.

В отличие от GPS, она определяет локацию с точностью до сантиметров по визуальным маркерам. Это решает проблему навигации внутри помещений и в районах с плотной застройкой, где спутниковый сигнал искажается или пропадает.

Coco Robotics уже ставит эту систему на своих автономных курьеров. У роботов 4 камеры, они едут по улице и на ходу сверяются с 3D-картами, которые годами собирали ловцы покемонов.
the-independent.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍160❤28👏28🔥19💯16🎉9🤔3😐2🤓1

17.5K views05:06

Machinelearning

Как перейти от ИИ-экспериментов к рабочим системам

Рассказываем, где узнать реальный опыт тех, кто встроил искусственный интеллект в ключевые процессы компании и извлек из этого реальную выгоду. 22 апреля присоединяйтесь к конференции МЛечный путь от Selectel, провайдера инфраструктуры для ИИ.

Эксперты топовых ИТ-компаний расскажут:

🔺Как ускорить ML-пайплайны и снизить издержки на инференс без потери качества
🔺Как безопасно внедрить генеративные модели в ключевые процессы и управлять эффектом этого внедрения
🔺Как интегрировать модели в существующую ИТ-архитектуру

Конференция пройдет 22 апреля в Москве. Участие бесплатное, регистрируйтесь: https://slc.tl/23df5

Реклама. АО "Селектел". erid:2W5zFHnSn9f

👍32👏11🔥7🤔4🥰3😁2🤨2❤1

17.2K views08:45

Machinelearning

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

Kimodo: диффузионная модель для генерации 3D-движений людей.

NVIDIA выложила в открытый доступ проект Kimodo - генеративную модель на основе диффузии, которая создает реалистичные трехмерные движения для человеческих и робототехнических скелетов.

Kimodo принимает на вход текстовые промпты и ключевые позы всего тела, позиции и вращения конечностей, двухмерные пути и контрольные точки. Это позволяет точно управлять генерацией: от общего описания наподобие "персонаж идет и садится на стул" до детального контроля положения рук и ног в кадрах.

Всего доступно 5 вариантов модели для 3 типов скелетов: SOMA, SMPL-X и Unitree G1. Первые два ориентированы на анимацию аватаров, третий - на робота Unitree G1.

Модели, обученные на полном датасете Bones Rigplay 1 (700 часов), NVIDIA рекомендует как основные рабочие.

Варианты на сете BONES-SEED (288 часов) предназначены для бенчмаркинга и сравнения с собственными разработками.

Для работы с Kimodo предусмотрены 3 интерфейса:

🟢Интерактивное веб-демо с таймлайн-редактором;
🟢CLI-утилита для пакетной генерации;
🟢Python API для тонкой настройки .

Под инференс потребуется около 17 ГБ видеопамяти, модели запускали на RTX 3090, RTX 4090 и NVIDIA A100.

🟡

Интеграция с робототехническим стеком NVIDIA.

ProtoMotions позволяет брать сгенерированные движения и обучать на них физически корректные политики управления в GPU-ускоренной симуляции — как для аватаров, так и для Unitree G1.

Через General Motion Retargeting движения, созданные на скелете SMPL-X, можно перенести на произвольных роботов.

📌Лицензирование:

Код проекта под Apache 2.0, большинство моделей под NVIDIA Open Model License.

Вариант SMPL-X имеет более ограниченную NVIDIA R&D Model License, она допускает только исследовательское применение.

🟡

Набор моделей

🟡

Техотчет

🖥

Github

@ai_machinelearning_big_data

#AI #ML #Robotics #Kimodo #NVIDIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍108🤩28🤔20❤13👏12🔥5💯4

19.6K views09:55

Machinelearning

⚡️ Сбер выпустил крупнейшее обновление ГигаЧат — и выложил в open source.

GigaChat Ultra и GigaChat-3.1-Lightning уже под MIT-лицензией. Текущее обновление дало заметный прирост по качеству ответов, устойчивости генерации и прикладным сценариям использования. Модели можно разворачивать в закрытом контуре, адаптировать под корпоративные данные и использовать как базу для чат-ботов, внутренних ассистентов и отраслевых AI-сервисов.

🟡

Что важно в самом обновлении

В статье на Хабр команда описывает переход от Dense к MoE, переработку этапа постобучения и отдельную работу над устойчивостью генерации. Один из ключевых результатов — модели значительно реже уходят в циклы, то есть стабильнее ведут себя в длинных ответах и диалогах. В релизных материалах это вынесено как отдельное качественное улучшение.

DPO-этап переведён в нативный FP8. Практический смысл этого изменения — более эффективное использование памяти на этапе дообучения без потери качества относительно предыдущих версий. Дополнительно в ходе работы был выявлен критичный баг в SGLang, который влиял на качество и корректность замеров.

🟡

По моделям

Ultra в этом обновлении заметно усилилась в математике, задачах на рассуждение.
Lightning — компактная модель с 1,8 млрд активных параметров, ориентированная на быстрые сценарии. При этом в релизе отдельно отмечен рост качества общения, следования инструкциям и общих знаний.
ГигаЧат получил две новые функции: научился искать в интернете прямо во время диалога и научился в запоминать важные факты для пользователя — это называется долгосрочная память.

✔️ Для разработчиков это означает, что open source-релиз принёс не просто открытые веса, а более зрелую и инженерно доработанную базу, на которой можно строить как качественные, так и экономически эффективные решения. Для рынка — это шаг к развитию собственной открытой экосистемы русскоязычных моделей, пригодных для реальных продуктовых внедрений.

@ai_machinelearning_big_data

#news #ai #ml #llm #opensource

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥74🤣41👍28❤20⚡18🙈6👏3🌭3🤔1🤬1😇1

16.7K viewsedited 16:31

Machinelearning

🚨 Обнаружено, что релиз LiteLLM на PyPI версии 1.82.8 содержит вредоносный код.

Стандартная команда `pip install litellm` могла привести к утечке:
SSH-ключей, учётных данных AWS/GCP/Azure, Kubernetes-конфигов, git-доступов, всех API-ключей из переменных окружения, истории команд, SSL-ключей, CI/CD-секретов и паролей к базам данных.

И это не нишевая библиотека, у LiteLLM около 97 млн скачиваний в месяц.

Даже без прямой установки litellm вредоносный код мог попасть к пользователям через другие пакеты (например, `dspy`).

Скомпрометированную версию пакета обнаружили случайно: при установке пакета у разработчика произошёл сбой из-за утечки памяти.

Без этого сбоя атака могла оставаться незамеченной долгое время .

Supply chain атаки становятся одним из самых серьёзных рисков в современной разработке.

Подход «использовать как можно больше готовых библиотек» требует некоторого переосмысления.

Andrej Karpathy: https://x.com/karpathy/status/2036488892443140551

1. Первичный разбор (issue на GitHub): https://github.com/BerriAI/litellm/issues/24512
- подробное техническое описание вредоносного кода: что именно крадёт и как работает

2. Официальный issue от BerriAI: https://github.com/BerriAI/litellm/issues/24518
— реакция команды и обновления по ситуации

3. Блог FutureSearch (обнаружили атаку): https://futuresearch.ai/blog/litellm-pypi-supply-chain-attack/
• как баг с fork bomb в вредоносном коде уронил машину и помог выявить атаку

4. Полный таймлайн TeamPCP от ramimac: https://ramimac.me/teampcp/
— вся цепочка атаки: Trivy → Checkmarx → litellm, с точными временными метками и IOC

5. Тред на Hacker News (основной): https://news.ycombinator.com/item?id=47501729
- обсуждение в реальном времени, включая ответы от Krrish (maintainer litellm)

6. Разбор от GitGuardian:
https://blog.gitguardian.com/trivys-march-supply-chain-attack-shows-where-secret-exposure-hurts-most/
- анализ того, как утечка CI/CD-секретов запустила всю цепочку атаки

@ai_machinelearning_big_data

#llm #ml #cybersecurity

2🤔94🤬30👀17🔥16❤12😨8👍7😢7💔2🗿1

23.6K views17:35

Machinelearning

📱

Claude - вторая по популярности LLM после ChatGPT и уже обгоняет Gemini.

Хотя Anthropic изначально делала ставку на корпоративный сегмент, им удалось уверенно выйти и на массовый рынок.

Обновления выходят почти каждый день.

Anthropic смогли стереть границу между «бизнес-инструментом» и «продуктом для всех».

А последние релизы показывают: они не просто догоняют тренды, а начинают их задавать.

Пользуетесь ли вы Claude?
Какое из последних обновлений зашло больше всего? 👇

@ai_machinelearning_big_data

#Claude

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤184🤔79👍47🔥22🎉16💯11🥰7😐3👀1🙊1

19.6K views18:35

Machinelearning

📌

Google разработала алгоритм квантования KV-кэша без потери точности.

Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.

TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.

KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.

Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.

🟡TurboQuant - двухэтапный пайплайн.

Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.

На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.

Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".

Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.

При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.

Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.

Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.

🟡

Статья

🟡