Машинное обучение RU
17.7K subscribers
1.58K photos
208 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
✔️ ByteDance представила Depth Anything 3.

Depth Anything 3 может предсказывает пространственно-согласованную геометрию по одному или нескольким изображениям, даже без известных параметров камеры. Ключевая особенность релиза - в радикальном упрощении архитектуры.

Под капотом единый трансформер и унифицированное представление depth-ray. Одна и та же модель теперь решает целый спектр задач: от монокулярной оценки глубины и определения поз камеры до прямой генерации 3D гауссианов для синтеза новых ракурсов.

В тестах DA3 превзошла предыдущие версии. Команда выпустила веса моделей, инструментарий CLI и WebUI на Gradio.
depth-anything-3.github.io
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
🧠 Anthropic и Claude - одни из главных бенефициаров 2025 года.

Claude продемонстрировал самую долгую автономную работу ИИ-агента на сегодня4 часа 49 минут без участия человека.

Это соответствует 50% time horizon и является текущим рекордом в агентных системах.

Но картина не такая однозначная.

У флагманской модели Claude Opus 4.5:
- 80% time horizon составляет всего 27 минут
- это примерно уровень прошлых моделей
- и меньше, чем у GPT-5.1-Codex-Max (32 минуты)

Что это значит по сути:

- Anthropic действительно впереди по длительной устойчивой автономности
- но при более жёстких критериях надёжности лидерство пока не закреплено
- конкуренты остаются очень близко

Гонка не закончена и победитель не определён.
Развитие ИИ-агентов идёт по экспоненте, а не по прямой.

Каждый новый релиз сдвигает ключевую границу:
насколько долго ИИ может работать самостоятельно,
не ломаясь и не теряя качества.

И именно время автономной устойчивой работы, а не классические бенчмарки,
становится главным показателем прогресса в агентном ИИ.
5👍2
Боль 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
😁35🔥2👍1😢1
✔️ Z.ai выпустила GLM-4.7.

GLM-4.7 - обновление линейки моделей, оптимизированное для разработчиков. При размере в 358 млрд. параметров модель показала существенный прирост производительности в программировании, работе с терминалом и созданию чистого UI-кода (функция Vibe Coding). На SWE-bench Verified модель улучшила результат до 73.8%, а в тестах на сложное математическое рассуждение прирост составил более 12%.

Архитектурное новшество релиза — развитие механизмов мышления. Функция Preserved Thinking позволяет модели сохранять и переиспользовать CoT между репликами, а механизм Interleaved Thinking дает время на анализ перед каждым вызовом внешних инструментов.

GLM-4.7 уже доступна через API и на OpenRouter, а веса модели выложены на HuggingFace и ModelScope.
z.ai
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1
Российские генеративные модели Kandinsky 5.0 Video Lite и Pro в международной text-to-video арене

🔘Pro версия является ТОП-1 опенсорсом в мире

🔘Lite версия (2B параметров) лучше первой версии Sora

🔘На данный момент Сбер уступает только топовым мировым бигтех компаниям: Google (Veo 3.1, Veo 3), OpenAI (Sora 2), Alibaba (Wan 2.5), KlingAI (Kling 2.5, 2.6); в паритете с Luma AI (Ray 3), MiniMax (Hailuo 2.3) — отрыв по ELO максимум 3 балла, при 95% доверительном интервале оценивания +-21 балла

🔘Для российских генеративных моделей выход на международную арену — уникальное событие

🚀 Полезные ссылки:
🔘Посмотреть весь лидерборд: lmarena
🔘Почитать подробнее про Kandinsky 5.0: пост, техрепорт
🔘Open Source Kandinsky 5.0: github и hf
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
💡 Dario Amodei об AGI и будущем работы.

CEO Anthropic говорит прямо: ИИ может впервые реально убрать необходимость массового человеческого труда.

Ключевое:

• AGI ведёт к технологической безработице
ИИ способен выполнять большую часть экономически полезной работы быстрее и дешевле человека.

• Работа перестаёт быть условием выживания
В будущем труд - это выбор.
Смысл смещается к семье, творчеству и развитию.

• Такой переход нельзя навязать
Общество будет перестраиваться постепенно, а не по указу.

• Изменения идут с разной скоростью
Компании - быстро, отрасли - медленнее, ценность человека вне работы - дольше всего.

Вопрос не в том, придёт ли это.
Вопрос - что сломается раньше: рынок труда или наше представление о ценности человека.
5👎3🤔3😁1
🧠 MiroThinker: Инновационный исследовательский агент

MiroThinker — это открытый исследовательский агент, который улучшает возможности рассуждений и поиска информации. Он поддерживает инструментальную помощь и демонстрирует выдающиеся результаты на различных бенчмарках, включая HLE и BrowserComp.

🚀 Основные моменты:
- 💡 Поддержка интерактивного масштабирования для глубоких взаимодействий.
- 📚 Доступ к уникальному набору данных MiroVerse с 147k образцами.
- 🔧 Инфраструктура для стабильного обучения моделей.
- 🤖 Совместимость с множеством бенчмарков и инструментов.

📌 GitHub: https://github.com/MiroMindAI/MiroThinker

#python
🤔2
А что, если можно проверить свой уровень в Data Science без собеседований, звонков и HR-скрининга?

Авито вместе с getmatch сделали тест по Data Science, основанный на реальных интервью DS-специалистов компании.

Что даёт тест:

🔍 Оценка компетенций
Поймёте, какие навыки уже хорошо прокачаны, а где есть точки роста – выводы основаны на практике, а не на абстрактной теории.

⚡️ Шанс стать заметнее для рекрутеров
Можно открыть доступ к результатам теста и повысить шансы на оффер.

☑️ Подробный разбор
В течение дня на почту придёт письмо с анализом ответов и рекомендациями.

Отличная возможность спокойно проверить себя на праздниках и понять, куда двигаться дальше.

Ссылку на тест оставили здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
✔️ Qwen обновила Qwen-Image-Edit.

Новая версия Qwen-Image-Edit-2511 пришла на смену сборке 2509 и предлагает ряд качественных изменений. Теперь модель лучше сохраняет консистентность персонажей и общую структуру кадра при внесении локальных правок.

Помимо стабильности, усилили способности к геометрическому рассуждению и генерации промышленного дизайна. Попробовать новинку можно через веб-интерфейс Qwen Chat, а веса для локального развертывания уже на HuggingFace и ModelScope.
TongyiLab в сети Х
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Учёные Гарварда заявили о реальном квантовом прорыве для будущего суперкомпьютеров.

Новая экспериментальная платформа решает одну из самых жёстких проблем масштабирования квантовых машин - поддержание управления и когерентности в больших системах связанных кубитов. Это ещё не полное решение, но шаг к аппаратуре, где огромные устойчивые квантовые архитектуры становятся реальнее.

🔹 Почему это важно?
Квантовые компьютеры годами застревали на уровне небольших шумных устройств. Прорыв в масштабировании - это движение к машинам, которые смогут моделировать химию, материалы, климат и криптографию, недоступные обычным суперкомпьютерам.

Квант наконец начинает выглядеть как будущее, а не демонстрационный стенд.

Но путь впереди тяжёлый: одно открытие - легко, а вот построить миллионы одинаково стабильных кубитов — почти невыполнимая задача. Полноценный квантовый суперкомпьютер всё ещё далеко, но теперь он стал немного ближе.
5🤔2🔥1
✔️«АльфаСтрахование» создаст ИИ-решения на технологиях Yandex B2B Tech для корпоративной инфраструктуры.

В 2026 году компания реализует более десяти проектов, охватывающих инженерные, аналитические и офисные сценарии.

Технологическая основа:
— SourceCraft Code Assistant — LLM-система для поддержки разработки, ускоряющая работу свыше 500 инженеров.
— Yandex SpeechSense — платформа речевой аналитики, обрабатывающая более 20 тыс. звонков в сутки и формирующая обучающие датасеты для NLP-моделей.
— Yandex AI Studio — среда для создания ИИ-агентов, автоматизирующих обработку документов, протоколирование встреч и HR-воркфлоу.

В фокусе партнёрства — построение распределённой экосистемы Generative AI, где ИИ-сервисы становятся ядром корпоративных процессов.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🔥1
⚡️ NVIDIA: как объединять распределённые дата-центры в одну AI-фабрику

NVIDIA предлагает смотреть на дата-центры как на единый вычислительный организм, даже если они находятся на расстоянии десятков и сотен километров.

Ключевая идея — Scale-Across Networking.

Что это значит по-простому:

– Раньше масштабировали внутри сервера (scale-up)
– Потом внутри дата-центра (scale-out)
– Теперь — между дата-центрами, как будто это один большой кластер

Для этого NVIDIA представила Spectrum-XGS Ethernet — сетевую архитектуру, которая позволяет нескольким дата-центрам работать как одна AI-фабрика.

Что внутри:

– Те же Spectrum-X коммутаторы и ConnectX-8 SuperNIC
– Учет расстояния и задержек на уровне сети
– Адаптивный роутинг и контроль перегрузок
– Предсказуемая латентность для обучения и инференса

Почему это важно:

– Можно обучать и запускать большие модели на географически распределённых ресурсах
– Не нужно строить один гигантский дата-центр
– GPU в разных локациях работают как единый пул
– До 1.9× ускорение NCCL all-reduce по сравнению с обычным Ethernet

По сути, NVIDIA двигает индустрию к модели:
AI-фабрика = сеть дата-центров, а не одно здание

И это критично для следующего поколения LLM, агентных систем и промышленных AI-платформ.
🎥🚀 Wan-Move: Motion-Controlled Video Generation

Wan-Move представляет собой инновационную платформу для генерации видео с управлением движением, обеспечивая высокое качество и точность. Используя новаторское руководство по латентным траекториям, проект позволяет создавать 5-секундные видео с точным контролем на уровне объектов, интегрируясь с существующими моделями без изменений архитектуры.

🚀 Основные моменты:
- 🎯 Высококачественная генерация видео 480p с SOTA контролем движений.
- 🧩 Новая методология латентного управления траекторией.
- 🕹️ Точный контроль движений объектов с помощью плотных точечных траекторий.
- 📊 Уникальный бенчмарк MoveBench для оценки движений.

📌 GitHub: https://github.com/ali-vilab/Wan-Move
2
Как управлять поведением больших языковых моделей (LLM) не через дообучение, а прямо во время работы модели, с помощью специальных методов, похожих на нейростимуляцию.

🧠 В видео объясняют:
• зачем управлять поведением моделей без тонкой настройки (fine-tuning)
• как это достигается с помощью небольшого кода и библиотек типа Transformers
• почему это важно для практических приложений ИИ
• почему такой подход может быть альтернативой классическим fine-tune-методам

Это интересная и перспективная альтернатива дообучению модели - она позволяет быстрее и гибче корректировать поведение ИИ без больших затрат.

Видео: https://www.youtube.com/watch?v=-x3jjAzAhPU
HF: https://huggingface.co/spaces/dlouapre/eiffel-tower-llama
👍31🔥1