FSCP – Telegram

FSCP

#ByteDance представили ИИ-модель #Doubao-1.5-pro, вот её характеристики и сравнение с DeepSeek-R1

Doubao-1.5-pro - закрытая ИИ-модель с акцентом на оптимальный баланс производительности и эффективности использования ресурсов.

1. Архитектурные характеристики :
- Использует разреженную MoE (Mixture of Experts) архитектуру
- Достигает 7-кратного увеличения эффективности параметров по сравнению с плотными моделями
- Требует значительно меньше активных параметров при сохранении высокой производительности
- Превосходит показатели Llama3.1-405B при меньших вычислительных затратах

2. Мультимодальные возможности:
- Встроенная поддержка обработки изображений и речи
- Оригинальная система динамического разрешения для работы с изображениями
- Улучшенное понимание визуального контекста
- Интеграция речевых возможностей на уровне архитектуры

3. Производительность:
- На MMLU: 88.6%
- GPQA: 65.0%
- Показывает сильные результаты в задачах рассуждения (BBH: 91.6)

Сравнение с DeepSeek-R1.
Ключевые различия в подходах:

1. Doubao-1.5-pro фокусируется на эффективности и мультимодальности, стремясь достичь максимальной производительности при минимальных ресурсах.

2. DeepSeek-R1 делает акцент на улучшении способностей к рассуждению через масштабное обучение с подкреплением.

Практические выводы:

- Doubao-1.5-pro может быть предпочтительнее для задач, требующих эффективного использования ресурсов и мультимодальных возможностей.

- #DeepSeek-R1 лучше подходит для сложных задач рассуждения и может быть легче интегрирован благодаря открытому исходному коду

Обе модели представляют собой значительный шаг вперёд в развитии языковых моделей, но с разными приоритетами в своей архитектуре и оптимизации.

_______
Источник | #blockchainRF
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

All about AI, Web 3.0, BCI

ByteDance unveils Doubao-1.5-pro that seems to be world class, comparable or better to GPT-4o, latest Gemini, DS & Claude.

Its MoE architecture explores balance bw model & reasoning.

It build highly autonomous data production system & not using data from…

1.3K views13:55

FSCP

Новый флагман от Alibaba - Qwen2.5-Max , которая превосходит #Deepseek-V3 в нескольких ключевых бенчмарках

В день китайского Нового года команда Alibaba представила свою новую языковую модель Qwen2.5-Max, которая не просто конкурирует с последними достижениями в области AI, но и превосходит их по ряду показателей.

Qwen2.5-Max — это масштабная MoE (Mixture-of-Experts) ИИ-модель, обученная на более 20 триллионов токенов.

В сравнительных тестах Qwen2.5-Max показывает выдающиеся результаты, превосходя DeepSeek V3 в ключевых бенчмарках:

- Arena-Hard (тест на соответствие человеческим предпочтениям)
- LiveBench (оценка общих возможностей)
- LiveCodeBench (тестирование навыков программирования)
- GPQA-Diamond

Qwen2.5-Max доступна через несколько каналов:
1. Qwen Chat — для прямого взаимодействия с моделью
2. API Alibaba Cloud — для интеграции в собственные проекты
3. Демо-версия на платформе Hugging Face

API Qwen полностью совместим с OpenAI API.

_______
Источник | #blockchainRF
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney

Qwen

Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model

QWEN CHAT API DEMO DISCORD
It is widely recognized that continuously scaling both data size and model size can lead to significant improvements in model intelligence. However, the research and industry community has limited experience in effectively scaling…

1.5K views00:58

FSCP

Сэм Альтман впервые поддержал open source, а также рассказал об изменениях в экономике из-за ИИ

Сегодня в ночи глава OpenAI выпустил в своем блоге новое эссе, где он размышляет об экономических изменениях, которые возникают из-за ИИ, но нас удивило несколько вещей.

Во-первых, насколько радикально изменилась его риторика в сторону открытости - очевидно, из-за #DeepSeek . Хотя, если внимательно читать, он очень осторожен в формулировках и нигде прямо не обещает открыть код моделей OpenAI. Это больше похоже на признание общего тренда в индустрии, чем на заявление о смене курса компании.

Что ждёт нас в ближайшем будущем по Альтману?

1. ИИ-агенты как виртуальные коллеги
2. Первой серьезно изменится сфера разработки ПО
3. Научный прогресс значительно ускорится
4. Большинство товаров подешевеет
5. Предметы роскоши и земля подорожают.

Его три наблюдения об экономике ИИ:

1. Стоимость ИИ падает в 10 раз каждые 12 месяцев (против закона Мура 2x/18мес). К 2035г. 1 человек сможет получить доступ к интеллектуальным возможностям, равным всем людям 2025г. вместе взятым.

2. Очень интересны его мысли о будущем рынка труда. Он говорит о появлении совершенно новых профессий, и мы видим здесь целый спектр возможностей: от операторов команд ИИ-агентов до специалистов по человеко-ИИ взаимодействиям. Похоже, что самыми ценными станут навыки направления и координации ИИ, а не выполнение конкретных задач.

3. Его прогноз о ценах тоже заставляет задуматься. Получается интересный парадокс: большинство товаров подешевеет благодаря ИИ и автоматизации, но настоящая роскошь - вещи, которые нельзя масштабировать или воспроизвести с помощью ИИ - станет еще дороже. Земля, уникальный человеческий опыт, ручная работа - всё это может стать новым определением премиум-сегмента.

Что нас действительно впечатлило - это его видение демократизации ИИ. Идея "вычислительных бюджетов" для каждого человека звучит почти как универсальный базовый доход, только в сфере ИИ. Хотя опять же, он оставляет открытым вопрос о том, как именно это будет реализовано.

_______
Источник | #blockchainRF
@F_S_C_P

-------
Секретики!
-------

Sam Altman

Three Observations

Our mission is to ensure that AGI (Artificial General Intelligence) benefits all of humanity.

Systems that start to point to AGI* are coming into view, and so we think it’s important to...

1.0K viewsedited 12:49

FSCP

#DeepSeek и #Kimi представили технологии, которые могут изменить возможности языковых моделей

Сразу 2 китайские компании
DeepSeek и Kimi почти одновременно анонсировали технологии, которые могут кардинально изменить возможности языковых моделей.

DeepSeek представили NSA , а Kimi выпустила MoBA - два подхода к решению одной из главных проблем современных ИИ систем - неэффективной работы с длинными текстами.

Современные ИИ модели тратят до 80% времени обработки длинных текстов на механизм внимания. Это приводит к огромным затратам на вычисления. Ограничивает возможности работы с большими документами, кодовыми базами и длинными диалогами.

DeepSeek NSA предлагает трехуровневый подход:
- Сжатие токенов для общего контекста
- Умное выделение важных частей текста
- Локальный анализ через "скользящее окно".

Kimi MoBA использует:
- Разделение контекста на блоки
- Умную систему выбора релевантных блоков
- Плавное переключение между полным и разреженным вниманием.

Результаты:
- NSA: ускорение до 11.6 раз при декодировании. NSA оптимизирован под современные GPU архитектуры.
- MoBA: ускорение в 6.5 раз в производственной среде. MoBA предоставляет открытый исходный код.
- Оба решения сохраняют или улучшают качество работы моделей. Обе технологии можно интегрировать в существующие системы.

Для бизнеса преимущества:

- Снижение стоимости использования ИИ

- Возможность работы с большими документами

- Более эффективная автоматизация процессов.

Эксперты отмечают несколько ключевых моментов:

1. Технологии переходят от простой оптимизации к фундаментальным изменениям в работе ИИ.
2. Найден баланс между возможностями и стоимостью вычислений.
3. Открываются новые возможности для практического применения.

_______
Источник | #blockchainRF
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney

All about AI, Web 3.0, BCI

#DeepSeek introduced NSA: A Hardware-Aligned and Natively Trainable Sparse Attention mechanism for ultra-fast long-context training & inference

Core components of NSA:

1. Dynamic hierarchical sparse strategy
2. Coarse-grained token compression
3. Fine-grained…

1.1K viewsedited 16:44

FSCP

Вот это конкуренция! #DeepSeek обваливает цены на экономику ИИ, а OpenAI делает Deep research массовым - это демократизация ИИ

Свежие анонсы лидеров ИИ подтверждают прогноз нашего канала @blockchainrf о том, что базовые ИИ-модели станут товаром, а реальная ценность будет в агентах и специализированных решениях.

DeepSeek сегодня объявил сразу 2 важных анонса:

1. Ценовая война. С сегодняшнего дня компания вводит агрессивные скидки в непиковые часы (16:30-00:30 UTC):
- DeepSeek-V3: -50%
- DeepSeek-R1: -75% (!)

Вдумайтесь: стоимость вывода для R1 падает с $2.19 до $0.550 за миллион токенов. Это прямое подтверждение тезиса о том, что базовые ИИ-модели становятся товаром.

2. Технологическая демократизация. DeepSeek выпускает DeepGEMM — высокоэффективную библиотеку с выдающимися характеристиками. Подробности тут.

А OpenAI движется к модели "интеллект как сервис"

Одновременно OpenAI делает серию анонсов, показывающих переход от продажи доступа к моделям к продаже уровней интеллекта:

1. Deep research для всех платных пользователей.
- Plus, Team, Edu и Enterprise получают 10 запросов/месяц
- Pro пользователи — 120 запросов/месяц

2. Advanced Voice на базе GPT-4o mini для бесплатных пользователей:
- Бесплатный доступ к технологии, но с ограничениями
- Plus и Pro получают расширенные возможности

В то же время Alibaba бросает вызов в сфере ИИ-видео и выпускает Wan2.1 — набор продвинутых моделей для видео:
- Генерация в 2,5 раза быстрее SOTA моделей
- Превосходная работа со сложными движениями и физикой
- Работает на китайском и английском языках.

Что это значит для рынка ИИ?

1. Базовые модели становятся товаром. Как мы писали ранее, базовые ИИ-модели станут как ОС — широкодоступными и дешевыми. Мы наблюдаем это в реальном времени с ценовой политикой DeepSeek.

2. Смещение ценности к специализированным решениям.
OpenAI фокусируется на создании функций вроде Deep research — это уже не просто API, а готовое решение конкретной проблемы.

3. Многоуровневая стратегия монетизации.
Компании четко сегментируют функциональность по уровням подписки:
- Бесплатный уровень: базовые возможности
- Plus/Team: доступ к продвинутым функциям с ограничениями
- Pro/Enterprise: максимальные возможности

4. Эффективность вместо сырой мощности. DeepSeek с их компактным, но мощным DeepGEMM подтверждает, что "алгоритмы становятся эффективнее" и "маленькие дистиллированные модели показывают хорошие результаты".

_______
Источник | #blockchainRF
@F_S_C_P

⚙️ Разработка ботов Telegram от 5000 руб

Все о блокчейн/мозге/space/WEB 3.0 в России и мире

❗️Смена экономики:не ИТ-железо и не базовые ИИ-модели будут иметь долгосрочную ценность

Почему гонка за строительством ЦОДов может оказаться ошибкой, и как ИИ- агенты изменят расстановку сил в технологическом секторе?

В то время как участники WEF в Давосе…

1.1K viewsedited 18:26

About

Blog

Apps

Platform