Технозаметки Малышева
5.55K subscribers
2.79K photos
927 videos
38 files
3.06K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 MiniMax продолжают жечь и выпускают генератор речи

🧁 Voice Design — продвинутая кастомизация генерации голоса:
• Позволяет задавать текст, голос, тон, эмоции, можно клонировать голос.
• Продвинутая кастомизация и мультиязычная поддержка

Попробовать можно здесь →https://minimax.io/audio

@ai_machinelearning_big_data


#audio #ai #ml #MiniMax
6🔥4👍3
Forwarded from Machinelearning
📌 State of Foundation Models 2025 — краткое изложение отчёта Innovation Endeavors

Венчурный фонд Innovation Endeavors, основанный бывшим CEO Google Эриком Шмидтом, выпустил 126-страничный обзор о состоянии и тенденциях фундаментальных ИИ-моделей в 2025 году.

🟢 2025 — год, когда генеративный ИИ стал по-настоящему массовым.

Каждый восьмой работник на планете использует ИИ-инструменты хотя бы раз в месяц, а 90 % прироста аудитории произошло за последние полгода. Многие «ИИ-приложения» уже приносят индустрии миллиарды долларов в год, охватывая инженерию, дизайн, бухгалтерию, юриспруденцию и другие сферы.

🟠LLM уже обходят людей на сложных тестах.

Современные языковые модели превосходят врачей по целому ряду диагностических задач и решают олимпиадную геометрию лучше, чем 99 % людей.

Самое неожиданное: если дать небольшой модели время подумать, то она может обойти гораздо более крупную – эксперименты показали, что 3B-модель с reasoning-механизмом обойдет 70B-модель.


🟠По всем техническим метрикам масштаб моделей растет экспоненциально.

Производительность, интеллект и окна контекста увеличиваются более чем в 10× каждый год. Например, окна контекста выросли примерно с 8 тысяч до миллиона токенов, а стоимость генерации одного токена на крупных моделях упала почти в 1000 раз за пару лет. Средняя «длительность» задачи, которую модель может завершить сама, удваивается примерно каждые 7 месяцев.

🟠 Эксперты резюмируют: «умные модели сначала думают, потом говорят».

Модели рассуждения, обученные через CoT, дают новый путь к масштабированию и требуют активного посттренинга (RL с reward-моделями). Возможно, скоро именно дообучение станет важнее предобучения.

🟠 Экономика фундаментальных моделей запутана.

Крупнейшие игроки генерируют сотни миллионов выручки, но обучение топ-моделей дороже: LLaMA 4 ≳ $300 млн, GPT-4 ≈ $100 млн, а совокупные расходы OpenAI на обучение и данные достигают ~$3 млрд в год. Новая модель устаревает за три недели — конкуренция так высока, что open-source почти сравнялся с закрытыми платформами.

🟠Структура команд меняется под давлением ИИ.

Выяснилось, что функции «узких» специалистов часто уходят к универсалам с ИИ-ассистентам, а профессии уровня "middle management" вымирают.

🟠 MCP становится стандартом интеграции.

Model Context Protocol соединяет модели с почтой, дизайном, чатами и другими сервисами, а «клиентом» всё чаще выступает другой ИИ: крупные CRM и базы данных само-настраиваются через агентов.

🟠 Железо не отстаёт.

В ИИ-облаках важнее продавать «сырые» GPU-часы, чем комплексное ПО; допвремя на GPU обычно выгоднее оптимизаций. NVIDIA остаётся безусловным лидером: отчёт Q1 зафиксировал 10× генерации токенов на инференсе за год. Появилась волна стартапов с трансформер-чипами — теперь переписывать ИИ-ПО под новое железо оправдано: вычислительные затраты многократно превышают зарплаты инженеров.

🟠 Капитал хлынул в ИИ.

Доля венчура выросла с 10% в 2024 до 50+% в 2025. Компании вроде Anthropic показывают $2 млрд годового дохода с двукратным ростом, но их оценивают в 30 годовых выручек, что вызывает опасения перегрева. Некоторые стартапы привлекают инвестиции ещё на этапе идеи, без MVP, усиливая риски "пузыря".

🟠 Осторожнее с трендами:

75 % ИИ-фото-приложений потеряли основную выручку всего за полгода после пика, напоминая, что не каждое модное направление = устойчивый бизнес, тем более когда модели устаревают с космической скоростью.


Полный отчёт
Видео

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8721
Google покупает энергию термоядерного синтеза

Google заключил сделку с Commonwealth Fusion Systems на покупку 200 МВт энергии от первой коммерческой станции термоядерного синтеза в Вирджинии. Запуск в начале 2030-х.

Правда, энергопотребление Google растет быстрее, чем появляются новые источники. Выбросы выросли на 50% с 2019 года. Дата-центры потребляют 30 ТВт-ч — как вся Ирландия.

Интересно, что Google не раскрывает, сколько именно энергии тратит на ИИ. Хотя все понимают, что львиная доля роста связана именно с развитием AI-сервисов.

#Google #fusion #AI
------
@tsingular
6👀21😁1🍓1
This media is not supported in your browser
VIEW IN TELEGRAM
В Steam появилась игра Virtual Girlfriend

В Steam появилась новая игра Virtual Girlfriend — симулятор виртуальных отношений с ИИ-персонажем.

Игра позволяет создать собственную виртуальную подругу и общаться с ней через продвинутую систему искусственного интеллекта.

Персонаж с LLM и TTS может поддерживать разговоры, запоминать детали общения и развивать отношения.

Такие проекты становятся все популярнее на фоне развития ИИ-технологий. Границы между реальным и виртуальным общением продолжают размываться.

#Steam #AI #Gaming
------
@tsingular
🔥7🤔531👍1🆒1
Forwarded from Machinelearning
🌟 WM-ABench: тестирование VL-моделей на понимание физики реального мира.

Мaitrix Org разработали WM-ABench, бенчмарк для оценки VLM в качестве так называемых «моделей мира». Идея проста: проверить, насколько хорошо топовые модели способны не просто распознавать картинки, а понимать окружающую действительность и предсказывать ее изменения.

Создатели, опираясь на когнитивную науку, создали фреймворк, который тестирует 15 самых популярных моделей по 23 параметрам, разделяя процесс на 2 ключевых этапа: восприятие и прогнозирование.

В основе бенчмарка - огромный датасет из более чем 100 тысяч примеров, сгенерированных в 6 различных симуляторах, от ThreeDWorld и Physion до Carla.

Чтобы модели не искали легких путей и не полагались на поверхностные совпадения, в тест добавили «сложные негативы» - контрфактические состояния, которые заставляют систему действительно анализировать происходящее.

Весь процесс был разделен на оценку восприятия (распознавание объектов, пространства, времени, движения) и прогнозирования (симуляция физики, транзитивный и композиционный вывод). Для калибровки сложности задач были установлены базовые показатели, основанные на результатах людей.

🟡Результаты.

С простым визуальным восприятием, то есть с определение цвета или формы, все модели справляются отлично. Однако когда дело доходит до трехмерного пространственного мышления, динамики движения или временных последовательностей, начинаются серьезные проблемы.

Выяснилась и другая любопытная деталь: VLM склонны «спутывать» физические понятия. Например, если в сцене изменить только цвет объекта, модель может внезапно ошибиться в оценке его размера или скорости.

Оказалось, что цвет и форма являются самыми влиятельными атрибутами, которые искажают восприятие других, не связанных с ними характеристик.

🟡Но главная проблема кроется глубже.

Точное восприятие мира совершенно не гарантирует точного прогноза.

Исследование показало, что даже при идеально верном распознавании текущего состояния сцены модели проваливают предсказание физических взаимодействий.

Разрыв с человеческими способностями явный: в задачах на транзитивный вывод он достигает 46%, а композиционный вывод выполняется на уровне случайного угадывания.

🟡Бенчмарк подсветил фундаментальный недостаток:

У современных VLM отсутствуют базовые знания физики, необходимые для симуляции даже простейших событий. Они видят мир, но не понимают, по каким законам он живет.


📌Лицензирование: Apache 2.0 License.


🟡Страница проекта
🟡Arxiv
🟡Датасет


@ai_machinelearning_big_data

#AI #ML #VLM #Benchmark #Maitrix
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
63❤‍🔥1
Forwarded from Machinelearning
🔟 Open‑source Deep Research Assistants 🤖

Глубокие исследовательские агент
ы — не просто чат‑боты, а полноценные ИИ‑ассистенты, способные искать информацию, взаимодействовать с инструментами, планировать и писать отчёты. Ниже — 10 мощных open‑source проектов, которые уже можно протестировать:

1. DeerFlow — модульная система от Bytedance: DeerFlow — open‑source фреймворк от Bytedance для создания модульных LLM-агентов.
Поддерживает:
- планирование действий,
- анализ кода,
- генерацию отчётов (включая Text-to-Speech),
- адаптивную интеграцию инструментов.
Создан для исследований, автоматизации и построения сложных агентных пайплайнов.
https://github.com/bytedance/deer-flow

2. Alita — самообучающийся агент с поддержкой Model Context Protocols (MCP), всё в одном модуле. Alita — агент, который сам придумывает, как ему расширить себя, не полагаясь на заранее написанные сценарии, и уже демонстрирует топовые результаты на сложных тестах.
https://github.com/CharlesQ9/Alita

3. WebThinker — автономный веб‑поиск с логикой "думай‑ищи‑пиши", RL‑обучением и глубокой навигацией
https://github.com/RUC-NLPIR/WebThinker

4. SimpleDeepSearcher — это лёгкий, но эффективный open‑source фреймворк от RUCAIBox, предназначенный для автономного веб-поиска через импровизированные многотуровые сессии:

- Использует Supervised Fine‑Tuning (SFT) вместо сложного RL, что значительно упрощает обучение и снижает вычислительные затраты
- Генерирует реалистичные траектории поиска и рассуждений, симулируя поведение пользователя в живом поисковом окружении .
- Критически отбирает данные по нескольким критериям качества: разнообразие запросов, сложность, структура ответов

5. AgenticSeek — приватный on‑device ассистент с выбором эксперта под задачу и голосовым управлением
https://github.com/Fosowl/agenticSeek

6. Suna — универсальный ассистент: браузер, CLI, работа с файлами, API, деплой
https://github.com/kortix-ai/suna

7. DeepResearcher — это комплексный open-source фреймворк от GAIR‑NLP, предназначенный для обучения LLM‑агентов, способных проводить глубокие исследования в автономном режиме, взаимодействуя с вебом. Использует несколько агентов‑браузеров, которые совместно исследуют веб и обрабатывают информацию
https://github.com/GAIR-NLP/DeepResearcher

8. Search‑R1 — агент на PPO/GRPO с поддержкой LLaMA3, Qwen2.5 и кастомных поисковиков. Агент учится эффективному циклу «думай — ищи — думай — отвечай» через RL, достигая важных улучшений в точности ответов и эффективности поиска.
https://github.com/PeterGriffinJin/Search-R1

9. ReCall — это фреймворк на основе RL, который учит LLM "должным образом" вызывать и комбинировать инструменты, используя сгенерированные задачи, без необходимости вручную собирать примеры вызовов — и всё это в открытом доступе.
https://github.com/Agent-RL/ReCall

10. OWL — мультиагентная система на CAMEL‑AI для динамического взаимодействия между агентами
https://github.com/camel-ai/owl

Агенты умеют планировать, взаимодействовать с браузером, запускать скрипты, интегрироваться с API и работать автономно.

Всё проекты — с открытым кодом. Можно изучить, собрать и доработать под свои задачи.

@ai_machinelearning_big_data

#ml #rl #aiagents #ai #agents
Please open Telegram to view this post
VIEW IN TELEGRAM
62
ИИ-инфраструктура делит мир на два лагеря

Только 32 страны имеют специализированные ИИ-дата-центры, большинство в Северном полушарии. Более 150 стран остались без вычислительных мощностей.

Пока OpenAI строит дата-центр за $60 млрд больше Центрального парка в Техасе, профессор из Аргентины запускает свой ИИ-хаб в переоборудованной университетской аудитории.

Американские и китайские компании контролируют 90% всех ИИ-дата-центров мира. Африка и Южная Америка практически исключены из гонки.

Нехватка GPU от Nvidia и астрономические затраты на инфраструктуру создают новый цифровой разрыв. Страны без собственных мощностей теряют таланты, стартапы и научные возможности.

#AI #compute #divide
------
@tsingular
💯10553
Британское правительство требует перестройки главного ИИ-института страны

Министр технологий Питер Кайл потребовал кардинальной перестройки Института Алана Тьюринга — ведущего центра ИИ-исследований в Великобритании.

Институт должен сместить фокус с здравоохранения и экологии на оборону и нацбезопасность. Правительство хочет развивать "суверенные возможности" в области ИИ, чтобы государство могло контролировать собственные технологии.

Кайл намекнул на смену руководства института, заявив, что нужны лидеры с опытом в сфере безопасности. Сейчас институт проходит реструктуризацию под руководством Джин Иннес, в ходе которой уже запущены сокращения.

При этом правительство выделило институту £100 млн на пять лет, но может пересмотреть финансирование в следующем году.

Со здравоохранения на нацбезопасность, - по-русски значит с гражданской сферы на военную.
П-Приоритеты.

#AI #Defense #UK
------
@tsingular
8🤔82🤯2
Школы возвращают рукописные экзамены из-за ИИ-мошенничества

До 89% студентов используют ChatGPT для учёбы, что заставляет университеты кардинально менять подход к оценке знаний.

Техасский университет, Флорида и UC Berkeley массово возвращают старые добрые "синие книжки" - тетради для рукописных экзаменов. Логика проста: если писать от руки в аудитории, ChatGPT не поможет.

Проблема в том, что ИИ научился мимикрировать под человеческий стиль письма настолько хорошо, что учителя в слепых тестах не могут отличить ИИ-текст от студенческого. Даже софт для детекции плагиата работает неточно.

Т.е. идея переписывать научные статьи вручную монахами как в старину в монастырях не такая уж и шутка.

#AI #education #cheating
------
@tsingular
13😁8👏64👨‍💻2
Salesforce проанализировал миллион разговоров с ИИ-агентами

С октября 2024 года Agentforce обработал миллион запросов клиентов — от серьезных до абсурдных типа «Как варить спагетти?» и «Отвечай только рэп-текстами».

Главный вывод: недостаточно сделать ИИ умным — нужна эмпатия. Изначально компания снизила передачу к живым операторам до 1%, но клиенты были недовольны. Пришлось поднять до 4%.

Теперь в критических ситуациях вроде сбоев агент сначала выражает сочувствие: «Понимаю, как это расстраивает», а потом предлагает решение. 740 тысяч примеров диалогов помогают давать точные ответы, но без человечности это бесполезно.

#Salesforce #AI #CustomerService
------
@tsingular
54🗿2
Anthropic опубликовала руководство по использованию ИИ кандидатами

Создатели Claude выложили официальные правила использования ИИ при трудоустройстве. Компания прямо заявляет: мы ищем людей, которые умеют работать с ИИ.

Разрешено использовать Claude для подготовки к собеседованиям, исследования компании и улучшения резюме. Запрещено - генерировать ответы на технические задания и полностью автоматизировать процесс.

Интересный момент: даже это руководство написано человеком в сотрудничестве с Claude. Anthropic использует ИИ везде - от создания вакансий до анализа метрик найма, но финальные решения принимают люди.

#Anthropic #hiring #AI
------
@tsingular
44🍾1
Forwarded from Machinelearning
🔥 Google DeepMind представили новую open-source библиотеку на Python для сборки асинхронных AI‑пайплайнов в реальном времени!

Новая библиотека позволяет собирать AI-процессы из компонентов — как LEGO для ИИ-агентов.

🔧 Особенности:
- Построение асинхронных, компонуемых пайплайнов
- Поддержка Gemini и Gemini Live API
- Основана на asyncio
- Обрабатывает мультимодальные данные: текст, изображения, аудио
- Внутри готовые агенты: real-time агент, исследователь, live-комментатор

💡 Подходит для:
- Разработки ИИ-агентов
- Генеративных моделей, работающих в реальном времени
- Быстрой сборки MVP с мультимодальными возможностями

Установка:


pip install genai-processors


Открытый код, готовые компоненты и интеграция с API.

Repo: https://github.com/google-gemini/genai-processors
Blog: https://developers.googleblog.com/en/genai-processors/

@ai_machinelearning_big_data


#DeepMind #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
433🍾1
Docker запустил ИИ-помощника Gordon

Ask Gordon встроен в Docker Desktop и CLI как персональный ИИ-ассистент для разработчиков. Он понимает локальное окружение — исходный код, Dockerfiles и образы — и дает персонализированные советы.

Gordon умеет исправлять ошибки контейнеров, оптимизировать Dockerfiles и предлагать миграцию на Docker Hardened Images для безопасности. Доступен через иконку в интерфейсе и команду `docker ai`.

Пока в бета-версии и не готов для продакшена. Все данные шифруются при передаче, но не хранятся постоянно. Можно отключить в настройках, если есть опасения по приватности.

#Docker #Gordon #AI
------
@tsingular
3🔥2🎉2👍1
ИИ может симулировать миллиарды атомов одновременно

Команда из USC Viterbi создала революционную модель Allegro-FM, которая симулирует поведение более 4 миллиардов атомов с эффективностью 97.5%. Это в 1000 раз больше существующих подходов.

Главная цель — создать углеродно-нейтральный бетон. Оказывается, можно захватывать CO2 и закачивать его обратно в бетон: "Просто поместите CO2 в бетон, и он станет углеродно-нейтральным", — объясняет профессор Накано.

Такой бетон не только решает экологические проблемы (производство бетона даёт 8% глобальных выбросов), но и служит в разы дольше обычного. Римский бетон стоял 2000 лет, современный — всего 100.

#AI #materials #simulation
------
@tsingular
🔥9👍411👀1
Трамп объявил о $90 млрд инвестиций в ИИ-инфраструктуру Пенсильвании

На энергетическом саммите в Пенсильвании частные компании объявили о масштабных инвестициях в ИИ-инфраструктуру на фоне призывов "drill, baby, drill".

Крупнейшие объявления: Google вложит $25 млрд в дата-центры в регионе PJM, Blackstone — $25 млрд в энергетическую инфраструктуру, CoreWeave — $6 млрд в ИИ-дата-центр.

Парадокс в том, что штат позиционирует себя как ИИ-хаб, опираясь на газовые ресурсы. Эксперты предупреждают: к 2030 году американские дата-центры могут производить столько же CO2, сколько вся Франция. При этом энергопотребление дата-центров может утроиться к 2028 году.

#AI #Pennsylvania #Energy
------
@tsingular
4
ИИ-компании не готовы к рискам создания систем человеческого уровня

Исследование Future of Life Institute показало шокирующие результаты: ни одна из крупных ИИ-компаний не получила оценку выше D по "планированию экзистенциальной безопасности".

Оценивали семь гигантов: Google DeepMind, OpenAI, Anthropic, Meta, xAI и китайские Zhipu AI и DeepSeek. Лучший результат у Anthropic — C+, OpenAI получил C, DeepMind — C-.

Парадокс в том, что компании обещают создать искусственный общий интеллект в ближайшее десятилетие, но у них нет "связного, практического плана" обеспечения безопасности. Макс Тегмарк из MIT сравнил это с постройкой ядерной электростанции в центре Нью-Йорка без плана предотвращения аварии.

#AGI #safety #AI
------
@tsingular
5👾3
Ученые нашли способ сделать ИИ похожим на человеческий мозг

Исследователи из Rensselaer Polytechnic Institute предложили добавить к нейросетям третье измерение — «высоту». Если сейчас ИИ имеет только ширину (количество нейронов в слое) и глубину (количество слоев), то новая архитектура включает внутренние связи между нейронами одного слоя.

Это похоже на боковые связи в коре головного мозга, отвечающие за высшие когнитивные функции. Система получает обратную связь и может «дорабатывать» свои решения, как мозг человека.

Проблема трансформеров в том, что их «закон масштабирования» больше не работает — просто увеличивать размер моделей бесполезно. Новый подход может стать ключом к созданию AGI — искусственного интеллекта уровня человека.

#AI #neuroscience #AGI
------
@tsingular
73🔥3🍾2😁1
Google Gemini получил золото на математической олимпиаде

Продвинутая версия Gemini Deep Think решила 5 из 6 задач Международной математической олимпиады, набрав 35 из 42 баллов — результат золотой медали.

Главный прорыв: система работает полностью на естественном языке, без перевода в формальные математические языки. Прошлогодние AlphaProof и AlphaGeometry требовали экспертного перевода задач и работали по несколько дней. Gemini уложился в стандартные 4,5 часа соревнований.

Основа успеха — параллельное мышление: модель одновременно исследует несколько путей решения, а не идет линейно. Плюс обучение на подкрепляющем обучении с корпусом качественных математических решений.

По словам президента олимпиады: «Их решения поразительны — четкие, точные и легко читаемые».

#Gemini #Mathematics #AI
------
@tsingular
🔥51
Forwarded from Machinelearning
🧠 Qwen3-MT — Alibaba продолжает жечь и выпускаетновую модель для машинного перевода.

🌍 Поддерживает 92+ языка, на которых говорит 95% населения мира

📚 Обучен на триллионах токенов из интернета, открытых документов и книгах, субтитров из видео.

🔬 Что внутри:
- Модель Qwen3-MoE-72B с архитектурой Mixture-of-Experts
- Заточена на переводческие фишки, поддерживает сложную терминологию и даже очень редкие слова.
- RLHF: обучение с подкреплением повышает точность и естественность модели

Возможности:
Обеспечивает качественный перевод в реальном времени
Контроль стиля и терминов
Масштабируемость для API и продакшена
Цена — от $0.5 за миллион токенов

🟡 Попробовать демку: https://huggingface.co/spaces/Qwen/Qwen3-MT-Demo
🟡 ModelScope: https://modelscope.cn/studios/Qwen/Qwen3-MT-demo
🟡 Документация API: https://alibabacloud.com/help/en/model-studio/translation-abilities
🟡 Блог с подробностями: https://qwenlm.github.io/blog/qwen-mt/

@ai_machinelearning_big_data


#Qwen #Alibaba #ml #llm #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
42🔥1
В n8n завезли обновлений

в 1.103.2 версии доступны крутые штуки теперь.

1. Инструменты - агенты.
Наконец-то можно создать мультиагентов с оркестратором на одном экране, без необходимости прыгать по вкладкам.
подробнее.

2. Выбор модели в зависимости от сценария внутри ноды агента.
Т.е. если у вас есть необходимость менять ИИ модель на лету в зависимости от роли пользователя, например, или от того, что он выбирает в настройках сам для себя, - теперь не нужно создавать отдельные ветки.
подробнее

3. Конвертация нод в подпроцесс одной кнопкой.
Если нужно упрятать с экрана ветку в другой подпроцесс или вообще сделать его самостоятельным просто так, чтобы переиспользовать из других нод.
подробнее

4. Целевые метрики для автотестов с ИИ.
Тоже полезно, если нужно прогнать ноды через типовые тесты с измеримым ИИ результатом.
подробнее

#n8n #releasenotes
———
@tsingular
🔥11👍832