Анализ данных (Data analysis)
46.3K subscribers
2.34K photos
275 videos
1 file
2.07K links
Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml

РКН: clck.ru/3FmyAp
Download Telegram
🚀 Анализируй графики за секунды с SmolVLM

Часы ручного разбора сложных визуализаций — в прошлое.
SmolVLM позволяет:
🔹 Автоматически извлекать ключевые выводы прямо из графика
🔹 Отвечать на конкретные вопросы без долгих расчётов
🔹 Мгновенно находить закономерности и ускорять принятие решений

💡 Пример: модель определяет, что курящие клиенты приносят больше выручки за заказ, а пик продаж приходится на пятницу и субботу.

📈 От картинки — к готовым инсайтам за пару секунд.

@data_analysis_ml
7👍6🔥4🤨2
🚀 Двойной прирост скорости инференса для diffusion-моделей с помощью Torch-TensorRT от NVIDIA

Что нового?
С помощью Torch-TensorRT (компилятора для PyTorch + TensorRT) можно без изменения PyTorch-кода:
- Удвоить скорость инференса для diffusion-моделей — без изменений API и минимальных усилий
- На примере модели FLUX.1-dev (12 млрд параметров):
- ×1.5 быстрее по сравнению с родной PyTorch FP16
- до ×2.4 при добавлении FP8-квантизации

Почему это важно:
- Минимальный код — максимальный эффект: достаточно одной строки, чтобы включить ускорение
- Гибкость: поддержка современных workflows, LoRA, ControlNet — перефит и ре-компиляция происходят на лету, без дополнительных шагов

Если вы работаете с Hugging Face Diffusers и diffusion-моделями в PyTorch — Torch-TensorRT откроет новую скорость с минимумом усилий!

🔗 Подробнее

@data_analysis_ml
🔥54👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Alibaba выпустила код и веса FantasyPortrait

Мультипортретная анимация персонажей

В комплекте Multi-Expr Dataset — первый датасет для анимации нескольких лиц с разными выражениями

🟠 Лицензия Apache 2.0

https://huggingface.co/acvlab/FantasyPortrait

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥5👍4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Tencent выложила в открытый доступ Hunyuan-GameCraft — инструмент для генерации интерактивных игровых видео с высокой реалистичностью.

Что это значит:
• Из одной картинки сцены и команд пользователя (клавиатура, мышь) создаётся полноценное игровое видео от первого или третьего лица.
• Движения плавные и точные: можно контролировать скорость, угол поворота и строить сложные траектории, а не только примитивную анимацию.
• Среда тоже живая — облака, дождь, снег, вода и другие эффекты генерируются динамически.
• Картинка остаётся чёткой даже при резких перемещениях — сохраняется информация о сцене.
• Работает быстро и дёшево: за счёт оптимизаций и квантования 13B-модель тянет даже RTX 4090, без дорогого рендера и сложного 3D-моделирования.

Построен на базе HunyuanVideo.

🟠Project Page: https://hunyuan-gamecraft.github.io
🟠Code: https://github.com/Tencent-Hunyuan/Hunyuan-GameCraft-1.0
🟠Technical Report: https://arxiv.org/abs/2506.17201
🟠Hugging Face: https://huggingface.co/tencent/Hunyuan-GameCraft-1.0

@data_analysis_ml

#AI #GameDev #VideoGeneration #HunyuanVideo #OpenSource #Tencent #GamingAI
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥4👍2
🚀 DeepSeek R2 могут выпустить между 15 и 30 августа на чипах Huawei Ascend 910B.

Мощность: 512 PFLOPS FP16 (примерно как 91% кластера NVIDIA A100) при этом затраты меньше на 97%.

Загрузка чипов — около 82%.

Архитектура: гибридный Mixture of Experts — при обработке токена активируются только нужные эксперты (78B из 1.2T параметров), что ускоряет работу и снижает вычисления.

Ходят слухи о собственном стеке для распределённого обучения, но подтверждений пока нет.

Все технические данные совпадают с предыдущими утечками по железу.
11👍9🔥6🥱1
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 GPT-5 прошёл Pokémon Red!

6 470 шагов против 18 184 у o3 — колоссальный прогресс в эффективности.

• GPT-5 гораздо реже «галлюцинирует» — главный фактор ускорения.
• Лучшая пространственная логика: o3 часто пытался «пробиться» сквозь стены и путался в сложных локациях, а GPT-5 умеет планировать длинные последовательности действий с минимумом ошибок.
• Более чёткое планирование целей и их последовательное выполнение.

Теперь посмотрим, как он справится с финальным испытанием! 🔥


🔜 Следующий челлендж: GPT-5 играет Pokémon Crystal. Старт скоро на Twitch!

Livestream: https://twitch.tv/gpt_plays_pokemon
👍157🔥2😁2
Разбираем тестовое задание в Яндекс на позицию Junior аналитика данных

Тестовое задание — важная часть трудоустройства аналитика. Это шанс показать свои навыки на практике и получить оффер мечты.

Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет тестовое задание в Яндекс на позицию Junior аналитика данных.

⚡️На вебинаре вы:
🟠узнаете, какие навыки и знания необходимы для успешного выполнения заданий;
🟠поймёте, что хочет увидеть работодатель;
🟠получите советы и лайфхаки;
🟠вместе с Андроном разберете в прямом эфире реальный пример тестового 🔥


Чему именно научимся на вебинаре:
🟠С помощью Pandas проанализируем Яндекс-запросы за несколько недель, загрузив их из json-файла;
🟠Найдем закономерности и отличия использования сервиса на мобильных устройствах и компьютерах;
🟠Разберем фишки Pandas: сложную агрегацию, маппинг, конкатенацию, чейнинг и др.


🕗 Настоятельно рекомендуем не пропускать — для зрителей у нас есть особый бонус, который обеспечит вам уверенный старт в вашей карьере.

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3
🖥 MongoDB выпускает MCP Server — теперь любой может стать дата-инженером

MongoDB представили открытый MCP сервер, который позволяет AI-инструментам вроде Claude, Cursor и GitHub Copilot напрямую общаться с вашей MongoDB-базой.

Теперь даже без знаний запросов можно просто написать:
• «Покажи самых активных пользователей»
• «Создай нового пользователя с правами только на чтение»
• «Как устроена коллекция orders?»

⚙️ MCP Server поддерживает:
• MongoDB Atlas
• Community Edition
• Enterprise Advanced

📌 Главное — не нужен SQL, не нужно знать синтаксис. Достаточно обычного языка.

💡 Под капотом: AI превращает ваши фразы в рабочие Mongo-запросы.
Открытый исходный код. Готово к продакшену.

📌 GitHub

#MongoDB #AItools #OpenSource #MCP

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍9🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Stand-In (BowenXue) — лёгкий и plug-and-play фреймворк для генерации видео с сохранением личности

📌 Что делает:
- Генерирует видео, сохраняя лицо или стиль персонажа, обучив всего ~1 % новых параметров на базе модели генерации видео. Результат сопоставим с полным переобучением, но быстрее и легче.
- Поддерживает генерацию по тексту с контролем идентичности, смену стиля, pose-guidance, face-swap, стилизацию и даже генерацию не-людей.
- Лицензия Apache-2.0 — открытое использование и модификация.

Что нового:
- Версия v1.0 (153 M параметров) с весами на базе Wan2.1-14B-T2V и кодом для инференса.
- Интеграция с ComfyUI: выпущен preprocessing-нод для улучшенной поддержки, особенно после сторонней интеграции.

https://huggingface.co/BowenXue/Stand-In

#opensource #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥2
🚀 GPT-5 бьёт рекорды в офтальмологии — почти идеальная точность и лучший бюджетный режим “mini-low”

🧪 В исследовании сравнили 12 конфигураций GPT-5 с o1, o3 и GPT-4o на 260 закрытых вопросах American Academy of Ophthalmology BCSC.

Ответы давались без примеров в промпте, в формате: одна буква + одно предложение-обоснование — для максимально строгой проверки.

🎯 Результаты:
- GPT-5-high — 96,5% точности
- o3-high — 95,8%
- o1-high — 92,7%
- GPT-4o — 86,5%
- GPT-5-nano-low — 77,3%

📊 “Reasoning effort” — настройка глубины размышлений модели. Минимальный режим показал худшие результаты и был исключён.
По оценке Bradley-Terry, GPT-5-high в 1,66× сильнее o3-high и в 5,10× — o1-high по точности, а по качеству объяснений — на 11% лучше o3-high.

💰 На графике «точность / стоимость» выявлен Pareto-фронтир: от GPT-5-nano-low до GPT-5-high.
Лучший баланс цены и качества — GPT-5-mini-low: дешевле и точнее всех альтернатив в своём сегменте.

📌 Выводы:
- GPT-5-high — для задач, где важна максимальная точность.
- GPT-5-mini-low — оптимален для масштабного применения с ограниченным бюджетом.
- GPT-5-medium — близок к o3-high по балансу цены и качества.

📌 Читать полностью
10👍2🥱2🔥1
Только что в России начали работать нейросети от Google — без обхода блокировок и без смены региона.

Пробуем тут.

@data_analysis_ml
24🥴10👍8🤯4🔥3🥱3😁2❤‍🔥1