Анализ данных (Data analysis)
46.3K subscribers
2.3K photos
264 videos
1 file
2.04K links
Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml

РКН: clck.ru/3FmyAp
Download Telegram
💴 Опубликованы цены на API Gemini 2.5 Pro по сравнению с OpenAI GPT-4.5/o1.

- $1.25/1M input for <200K tokens
- $10/1M output for <200K tokens

- $2.50/1M input for >200K tokens
- $15/1M output for >200K tokens

Как вы считаете OpenAI завышает цены или Google демпингует ... 🤣

📌 Цены

@data_analysis_ml
👍12🔥65
🔥 ​DiffSynth-Studio-Lora-Wan2.1-ComfyUI - дистиллированный WAN!

Это LoRA для интеграции с ComfyUI, основанные на Wan2.1-T2V-1.3B.

: Поддерживается 4, 5, 6, 8, 10 и более шагов, что позволяет балансировать между качеством и временем генерации.​

На тестах получаются потрясающие результаты всего за 5 шагов!

🟡HF
🟡Пример
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5🔥2
📌 FastRAG — фреймворк, предлагающий разработчикам современные инструменты для создания оптимизированных RAG-пайплайнов. Этот сервис, построенный на базе Haystack и Hugging Face, фокусируется на эффективном сочетании информационного поиска с генеративными возможностями LLM.

Фреймворк предоставляет готовые компоненты для работы с современными методами семантического поиска, оптимизированные под современные аппаратные ускорители, включая процессоры Intel Xeon и AI-акселераторы Gaudi.
При этом FastRAG активно развивается — от поддержки мультимодальности до примеров динамического синтеза промптов.

🤖 GitHub

@data_analysis_ml
👍135🔥2
🔥 OpenThinker2-32B: превосходит DeepSeekR1-32B в математике и Кодинге.

OpenThinker2-32B набирает 76,7 баллов на AIME24, 90,8 на MATH500 и 64,1 на GPQA-D.

Он набрал 90,8 баллов по MATH500, обойдя R1-Distill-32B (90. 0) .

Это новый лидер на бенчмарке GPQA-D лидирует с результатом 64,1 по сравнению с R1-Distill-32B с результатом 65,8.

https://huggingface.co/bartowski/open-thoughts_OpenThinker2-32B-GGUF

@data_analysis_ml
👍75🔥3🤨2
Forwarded from Machinelearning
🦙 Встречайте, дамы и господа, LLaMA 4: мультимодальные MoE модели!

Llama 4 Omni разработана для понимания и обработки информации модальностей, а не только текста.

Доступна в 3х вариантах: Llama 4 Scout и Llama 4 Maverick, Llama 4 Behemoth.

У Llama 4 Scout (109B) контекстное окно размером 10 М, 17B активных параметров, 16 экспертов, может быть запущена на 1ом GPU!

Llama 4 Maverick (400B) окно в 1M, 128 экспертов, 17B активных параметров.

У Бегемота окно в 2T!!!, 16 экспертов, 288B активных параметров.

- Model Card
- Веса
- Релиз

@ai_machinelearning_big_data
👍157🔥6
📌 Как быстро запустить Llama 4 за 10 минут

Если вы хотите попробовать новую Llama 4 Scout (п вот краткое руководство:

 Вам нужна машина с четырьмя H100 на сервисе (пример под hyperbolic, вы можете арендовать в другом месте https://app.hyperbolic.xyz/compute)
 Подключитесь по SSH к серверу и запустите в терминале:


>> sudo apt-get update && sudo apt-get install -y python3-pip
>> pip install -U vllm
>> pip install -U "huggingface_hub[cli]"


 Запустите Llama 4 с помощью vllm:


>> vllm serve meta-llama/Llama-4-Scout-17B-16E-Instruct --tensor-parallel-size 4 --max-model-len 10000


 Проверьте работу модели, открыв новый терминал и выполнив запрос:

>> curl https://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "meta-llama/Llama-4-Scout-17B-16E-Instruct",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "What can I do in SF?"}
]
}


Всего несколько команд и вы получите локально развернутую модель Llama 4 Scout и сможете работать с ней.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥84
🎮 Microsoft представила нейро-версию Quake II на базе Muse и WHAMM.

Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.

Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.

ИИ генерирует кадры в реальном времени, анализируя действия игрока.

Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.

Модель помнит последние 0,9 секунды, что добавляет случайности.

Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.

🔗 Играть в ИИ-версию Quake II можно здесь.

@vistehno

#microsoft #ai #quake #muse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
😈AnimeGamer — это модель, разработанная лабораторией ARC компании Tencent, предназначенная для создания бесконечных симуляций жизни в аниме-стиле.

Она использует мультимодальные большие модели (MLLMs) для генерации динамичных анимационных сцен, отображающих движения персонажей и изменения их состояний.

Учитывая исторический визуальный контекст, AnimeGamer обеспечивает последовательность и увлекательность игрового процесса.

Применяя мультимодальные представления, ориентированные на действия, и видеодиффузионную модель, AnimeGamer создает высококачественные видеоролики, формируя захватывающий и постоянно развивающийся игровой опыт.

https://huggingface.co/TencentARC/AnimeGamer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🔥2
Когда потратил 3 часа на отладку сгенерированного кода, который написал бы за час.

@data_analysis_ml
🔥38😁27👍86💯3🙏2💔1
⚡️ Pydoll — это библиотека на Python, предназначенная для автоматизации браузеров на движке Chromium (Chrome и Microsoft Edge) без использования WebDriver.

Инструмент имитирует «реальные» действия пользователя и обеспечивает гибкость при работе с элементами интерфейса и сетевыми запросами.

🔗 Ключевые особенности
- Асинхронная автоматизация без WebDriver

- Позволяет обойтись без установки и настройки драйверов WebDriver, что упрощает процесс интеграции и обслуживания.

- Реализована на базе asyncio, поэтому поддерживает запуск нескольких задач одновременно.

- Обход Cloudflare Turnstile

- Имеется встроенный механизм для автоматического прохождения CAPTCHA:

- Синхронная блокировка (context manager), когда выполнение кода приостанавливается до момента решения задачи.

- Фоновый режим (non-blocking), когда автоматизация продолжает работу, пока CAPTCHA решается в фоне.

- Поддерживает «человеко-подобный» набор текста (имитация пауз, скорости).

- Распознаёт специальные клавиши и сочетания клавиш (нажатия SHIFT, CTRL, ALT и т.д.).

- Подключение к существующим сессиям

- Можно подсоединяться к уже запущенным экземплярам Chrome или Edge, что удобно для отладки или интеграции с имеющимися сессиями пользователя.

Благодаря отсутствию необходимости в WebDriver и возможности имитировать взаимодействие «как настоящий пользователь», Pydoll будет полезен в проектах, где требуется гибкая и реалистичная автоматизация.

📌 Github


@data_analysis_ml
🔥26👍98
🎥 Минутное видео по тексту? Новый подход к генерации от исследователей!

Генерация длинных видео — всё ещё вызов для ИИ. Self-attention не тянет по скорости, Mamba — по сложности сюжета. Но тут на сцену выходят TTT-слои (Test-Time Training) — и делают шаг вперёд.

🧠 В чём суть: — TTT-слои умеют использовать выразительные скрытые состояния, которые сами являются нейросетями.
— Их добавляют в уже обученный трансформер — и он начинает генерировать минутные видео по текстовому сценарию с плавным движением и логичной историей.
— Проверяли на мультстиле Tom & Jerry — и получили +34 Elo-балла в человеческой оценке по сравнению с Mamba 2 и другими сильными базовыми методами.

ИИ уже близок к тому, чтобы полностью воспроизводить стили старых мультфильмов или аниме. Это может кардинально изменить производство анимации — вместо создания вручную, студии смогут "дообучать" модель и просто писать сценарии.

Прикрепленное минутное видео, было создано с помощью промпта и обучено на сотнях часов Тома и Джерри.

Вот его полный промпт.

⚠️ Да, пока есть артефакты и ограничения — модель на 5B параметров и только минутные ролики. Но подход уже выглядит перспективным.

Следим за развитием.

📌Demos: https://test-time-training.github.io/video-dit/
📌Paper: https://test-time-training.github.io/video-dit/assets/ttt_cvpr_2025.pdf
📌Github: https://github.com/test-time-training/ttt-video-dit

@data_analysis_ml
👍87🔥4
📊Бесплатный вебинар: «Построение эффективных дашбордов с помощью Power BI» 

💡На вебинаре вы узнаете:
+ Как загрузить данные в Power BI Desktop из различных источников 

+ Построение наглядных дашбордов для анализа данных 

+ Интерактивные возможности в Power BI - взаимодействие с визуальными элементами 

+ Применение базовых визуальных элементов и их настройка для лучшего понимания данных 

+ На практике вместе построим дашборд в Power BI

Кому будет полезен вебинар:
- Аналитикам данных
- Маркетологам
- Продуктовым менеджерам
- Всем, кто хочет визуализировать данные для принятия решений

16 апреля(среда) в 20:00 мск

Вебинар в рамках курса «BI-аналитика»
🎁После вебинара для вас активен промо-код со скидкой 5% до 18 мая: BI_04

👉Регистрация на вебинар: OTUS.RU

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

#реклама
О рекламодателе
🔥4👍1