Generative AI
2.4K subscribers
152 photos
42 videos
4 files
143 links
@haarrp - по всем вопросам
Download Telegram
🔥 Курс «Основы искусственного интеллекта» — Python, машинное обучение, глубокое обучение, наука о данных!

🕞 Продолжительность: 10:22:25

🔗 Ссылка: *клик*

#курс #ai #datascience #deeplearning

freecourses
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
📖 Эта статья посвящена оптимизации производительности моделей глубокого обучения!

💡 Автор рассматривает три ключевых компонента, влияющих на эффективность работы: вычисления (compute), пропускная способность памяти (memory bandwidth) и накладные расходы (overhead). Понимание того, какой из этих факторов является узким местом в конкретной системе, позволяет целенаправленно применять оптимизационные стратегии.

🔗 Ссылка: *клик*

#deeplearning
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
🚀 Релиз: Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом!

🔹 80B параметров, но активируется только 3B на токен → тренировка и инференс 10x дешевле и быстрее, чем у Qwen3-32B (особенно при 32K+ контексте).
🔹 Гибридная архитектура: Gated DeltaNet + Gated Attention → сочетает скорость и точность.
🔹 Ultra-sparse MoE: 512 экспертов, маршрутизируется 10 + 1 общий.
🔹 Multi-Token Prediction → ускоренное speculative decoding.
🔹 По производительности обходит Qwen3-32B и приближается к Qwen3-235B в рассуждениях и long-context задачах.

🟢Qwen3-Next-80B-A3B-Instruct показатели почти на уровне 235B flagship.
🟢 Qwen3-Next-80B-A3B-Thinking превосходит Gemini-2.5-Flash-Thinking.

Попробовать: https://chat.qwen.ai
Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list
HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d
ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a
Kaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b
Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj

@ai_machinelearning_big_data

#AI #LLM #Qwen #DeepLearning #MoE #EfficientModels #LongContext #Reasonin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21