Машинное обучение RU
17.7K subscribers
1.58K photos
209 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
Российские генеративные модели Kandinsky 5.0 Video Lite и Pro в международной text-to-video арене

🔘Pro версия является ТОП-1 опенсорсом в мире

🔘Lite версия (2B параметров) лучше первой версии Sora

🔘На данный момент Сбер уступает только топовым мировым бигтех компаниям: Google (Veo 3.1, Veo 3), OpenAI (Sora 2), Alibaba (Wan 2.5), KlingAI (Kling 2.5, 2.6); в паритете с Luma AI (Ray 3), MiniMax (Hailuo 2.3) — отрыв по ELO максимум 3 балла, при 95% доверительном интервале оценивания +-21 балла

🔘Для российских генеративных моделей выход на международную арену — уникальное событие

🚀 Полезные ссылки:
🔘Посмотреть весь лидерборд: lmarena
🔘Почитать подробнее про Kandinsky 5.0: пост, техрепорт
🔘Open Source Kandinsky 5.0: github и hf
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
💡 Dario Amodei об AGI и будущем работы.

CEO Anthropic говорит прямо: ИИ может впервые реально убрать необходимость массового человеческого труда.

Ключевое:

• AGI ведёт к технологической безработице
ИИ способен выполнять большую часть экономически полезной работы быстрее и дешевле человека.

• Работа перестаёт быть условием выживания
В будущем труд - это выбор.
Смысл смещается к семье, творчеству и развитию.

• Такой переход нельзя навязать
Общество будет перестраиваться постепенно, а не по указу.

• Изменения идут с разной скоростью
Компании - быстро, отрасли - медленнее, ценность человека вне работы - дольше всего.

Вопрос не в том, придёт ли это.
Вопрос - что сломается раньше: рынок труда или наше представление о ценности человека.
5👎3🤔3😁2
🧠 MiroThinker: Инновационный исследовательский агент

MiroThinker — это открытый исследовательский агент, который улучшает возможности рассуждений и поиска информации. Он поддерживает инструментальную помощь и демонстрирует выдающиеся результаты на различных бенчмарках, включая HLE и BrowserComp.

🚀 Основные моменты:
- 💡 Поддержка интерактивного масштабирования для глубоких взаимодействий.
- 📚 Доступ к уникальному набору данных MiroVerse с 147k образцами.
- 🔧 Инфраструктура для стабильного обучения моделей.
- 🤖 Совместимость с множеством бенчмарков и инструментов.

📌 GitHub: https://github.com/MiroMindAI/MiroThinker

#python
🤔2
А что, если можно проверить свой уровень в Data Science без собеседований, звонков и HR-скрининга?

Авито вместе с getmatch сделали тест по Data Science, основанный на реальных интервью DS-специалистов компании.

Что даёт тест:

🔍 Оценка компетенций
Поймёте, какие навыки уже хорошо прокачаны, а где есть точки роста – выводы основаны на практике, а не на абстрактной теории.

⚡️ Шанс стать заметнее для рекрутеров
Можно открыть доступ к результатам теста и повысить шансы на оффер.

☑️ Подробный разбор
В течение дня на почту придёт письмо с анализом ответов и рекомендациями.

Отличная возможность спокойно проверить себя на праздниках и понять, куда двигаться дальше.

Ссылку на тест оставили здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
✔️ Qwen обновила Qwen-Image-Edit.

Новая версия Qwen-Image-Edit-2511 пришла на смену сборке 2509 и предлагает ряд качественных изменений. Теперь модель лучше сохраняет консистентность персонажей и общую структуру кадра при внесении локальных правок.

Помимо стабильности, усилили способности к геометрическому рассуждению и генерации промышленного дизайна. Попробовать новинку можно через веб-интерфейс Qwen Chat, а веса для локального развертывания уже на HuggingFace и ModelScope.
TongyiLab в сети Х
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Учёные Гарварда заявили о реальном квантовом прорыве для будущего суперкомпьютеров.

Новая экспериментальная платформа решает одну из самых жёстких проблем масштабирования квантовых машин - поддержание управления и когерентности в больших системах связанных кубитов. Это ещё не полное решение, но шаг к аппаратуре, где огромные устойчивые квантовые архитектуры становятся реальнее.

🔹 Почему это важно?
Квантовые компьютеры годами застревали на уровне небольших шумных устройств. Прорыв в масштабировании - это движение к машинам, которые смогут моделировать химию, материалы, климат и криптографию, недоступные обычным суперкомпьютерам.

Квант наконец начинает выглядеть как будущее, а не демонстрационный стенд.

Но путь впереди тяжёлый: одно открытие - легко, а вот построить миллионы одинаково стабильных кубитов — почти невыполнимая задача. Полноценный квантовый суперкомпьютер всё ещё далеко, но теперь он стал немного ближе.
5🤔2🔥1
✔️«АльфаСтрахование» создаст ИИ-решения на технологиях Yandex B2B Tech для корпоративной инфраструктуры.

В 2026 году компания реализует более десяти проектов, охватывающих инженерные, аналитические и офисные сценарии.

Технологическая основа:
— SourceCraft Code Assistant — LLM-система для поддержки разработки, ускоряющая работу свыше 500 инженеров.
— Yandex SpeechSense — платформа речевой аналитики, обрабатывающая более 20 тыс. звонков в сутки и формирующая обучающие датасеты для NLP-моделей.
— Yandex AI Studio — среда для создания ИИ-агентов, автоматизирующих обработку документов, протоколирование встреч и HR-воркфлоу.

В фокусе партнёрства — построение распределённой экосистемы Generative AI, где ИИ-сервисы становятся ядром корпоративных процессов.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🔥1
⚡️ NVIDIA: как объединять распределённые дата-центры в одну AI-фабрику

NVIDIA предлагает смотреть на дата-центры как на единый вычислительный организм, даже если они находятся на расстоянии десятков и сотен километров.

Ключевая идея — Scale-Across Networking.

Что это значит по-простому:

– Раньше масштабировали внутри сервера (scale-up)
– Потом внутри дата-центра (scale-out)
– Теперь — между дата-центрами, как будто это один большой кластер

Для этого NVIDIA представила Spectrum-XGS Ethernet — сетевую архитектуру, которая позволяет нескольким дата-центрам работать как одна AI-фабрика.

Что внутри:

– Те же Spectrum-X коммутаторы и ConnectX-8 SuperNIC
– Учет расстояния и задержек на уровне сети
– Адаптивный роутинг и контроль перегрузок
– Предсказуемая латентность для обучения и инференса

Почему это важно:

– Можно обучать и запускать большие модели на географически распределённых ресурсах
– Не нужно строить один гигантский дата-центр
– GPU в разных локациях работают как единый пул
– До 1.9× ускорение NCCL all-reduce по сравнению с обычным Ethernet

По сути, NVIDIA двигает индустрию к модели:
AI-фабрика = сеть дата-центров, а не одно здание

И это критично для следующего поколения LLM, агентных систем и промышленных AI-платформ.
🎥🚀 Wan-Move: Motion-Controlled Video Generation

Wan-Move представляет собой инновационную платформу для генерации видео с управлением движением, обеспечивая высокое качество и точность. Используя новаторское руководство по латентным траекториям, проект позволяет создавать 5-секундные видео с точным контролем на уровне объектов, интегрируясь с существующими моделями без изменений архитектуры.

🚀 Основные моменты:
- 🎯 Высококачественная генерация видео 480p с SOTA контролем движений.
- 🧩 Новая методология латентного управления траекторией.
- 🕹️ Точный контроль движений объектов с помощью плотных точечных траекторий.
- 📊 Уникальный бенчмарк MoveBench для оценки движений.

📌 GitHub: https://github.com/ali-vilab/Wan-Move
2
Как управлять поведением больших языковых моделей (LLM) не через дообучение, а прямо во время работы модели, с помощью специальных методов, похожих на нейростимуляцию.

🧠 В видео объясняют:
• зачем управлять поведением моделей без тонкой настройки (fine-tuning)
• как это достигается с помощью небольшого кода и библиотек типа Transformers
• почему это важно для практических приложений ИИ
• почему такой подход может быть альтернативой классическим fine-tune-методам

Это интересная и перспективная альтернатива дообучению модели - она позволяет быстрее и гибче корректировать поведение ИИ без больших затрат.

Видео: https://www.youtube.com/watch?v=-x3jjAzAhPU
HF: https://huggingface.co/spaces/dlouapre/eiffel-tower-llama
👍31👎1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ PANDAS-ТРЮК

Если нужно быстро найти дубликаты, но сразу увидеть, *чем* именно строки отличаются — используй сравнение через groupby + nunique.

Это позволяет ловить «почти одинаковые» строки без сложных проверок. Подписывайся, больше фишек каждый день !


import pandas as pd

df = pd.DataFrame({
"name": ["Tom", "Tom", "Alice", "Alice"],
"age": [25, 25, 30, 31],
"city": ["NY", "NY", "LA", "LA"]
})

diff = (df
.groupby("name")
.nunique()
.reset_index())

print(diff)

# Показывает, какие поля у одинаковых ключей различаются
🔥8🤔2
🚀 VulnLLM-R-7B - первый специализированный reasoning LLM для поиска уязвимостей, сразу с agent-scaffold.

Что важно:
- Заточен именно под vulnerability detection
- Использует рассуждения, а не только шаблонный паттерн-матчинг
- Может работать как агент для анализа кода

Полный стек уже доступен:
📜 Paper: https://alphaxiv.org/abs/2512.07533
💻 Code: https://github.com/ucsb-mlsec/VulnLLM-R
🤗 Model & Data: https://huggingface.co/collections/UCSB-SURFI/vulnllm-r
🕹️ Demo: https://huggingface.co/spaces/UCSB-SURFI/VulnLLM-R

Хороший пример того, как узкоспециализированные LLM начинают превосходить универсальные модели в реальных задачах безопасности.
🔥3