FSCP – Telegram

FSCP

#ByteDance представили ИИ-модель #Doubao-1.5-pro, вот её характеристики и сравнение с DeepSeek-R1

Doubao-1.5-pro - закрытая ИИ-модель с акцентом на оптимальный баланс производительности и эффективности использования ресурсов.

1. Архитектурные характеристики :
- Использует разреженную MoE (Mixture of Experts) архитектуру
- Достигает 7-кратного увеличения эффективности параметров по сравнению с плотными моделями
- Требует значительно меньше активных параметров при сохранении высокой производительности
- Превосходит показатели Llama3.1-405B при меньших вычислительных затратах

2. Мультимодальные возможности:
- Встроенная поддержка обработки изображений и речи
- Оригинальная система динамического разрешения для работы с изображениями
- Улучшенное понимание визуального контекста
- Интеграция речевых возможностей на уровне архитектуры

3. Производительность:
- На MMLU: 88.6%
- GPQA: 65.0%
- Показывает сильные результаты в задачах рассуждения (BBH: 91.6)

Сравнение с DeepSeek-R1.
Ключевые различия в подходах:

1. Doubao-1.5-pro фокусируется на эффективности и мультимодальности, стремясь достичь максимальной производительности при минимальных ресурсах.

2. DeepSeek-R1 делает акцент на улучшении способностей к рассуждению через масштабное обучение с подкреплением.

Практические выводы:

- Doubao-1.5-pro может быть предпочтительнее для задач, требующих эффективного использования ресурсов и мультимодальных возможностей.

- #DeepSeek-R1 лучше подходит для сложных задач рассуждения и может быть легче интегрирован благодаря открытому исходному коду

Обе модели представляют собой значительный шаг вперёд в развитии языковых моделей, но с разными приоритетами в своей архитектуре и оптимизации.

_______
Источник | #blockchainRF
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

All about AI, Web 3.0, BCI

ByteDance unveils Doubao-1.5-pro that seems to be world class, comparable or better to GPT-4o, latest Gemini, DS & Claude.

Its MoE architecture explores balance bw model & reasoning.

It build highly autonomous data production system & not using data from…

1.2K views13:55

FSCP

Новый флагман от Alibaba - Qwen2.5-Max , которая превосходит #Deepseek-V3 в нескольких ключевых бенчмарках

В день китайского Нового года команда Alibaba представила свою новую языковую модель Qwen2.5-Max, которая не просто конкурирует с последними достижениями в области AI, но и превосходит их по ряду показателей.

Qwen2.5-Max — это масштабная MoE (Mixture-of-Experts) ИИ-модель, обученная на более 20 триллионов токенов.

В сравнительных тестах Qwen2.5-Max показывает выдающиеся результаты, превосходя DeepSeek V3 в ключевых бенчмарках:

- Arena-Hard (тест на соответствие человеческим предпочтениям)
- LiveBench (оценка общих возможностей)
- LiveCodeBench (тестирование навыков программирования)
- GPQA-Diamond

Qwen2.5-Max доступна через несколько каналов:
1. Qwen Chat — для прямого взаимодействия с моделью
2. API Alibaba Cloud — для интеграции в собственные проекты
3. Демо-версия на платформе Hugging Face

API Qwen полностью совместим с OpenAI API.

_______
Источник | #blockchainRF
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney

Qwen

Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model

QWEN CHAT API DEMO DISCORD
It is widely recognized that continuously scaling both data size and model size can lead to significant improvements in model intelligence. However, the research and industry community has limited experience in effectively scaling…

1.5K views00:58

FSCP

Сэм Альтман впервые поддержал open source, а также рассказал об изменениях в экономике из-за ИИ

Сегодня в ночи глава OpenAI выпустил в своем блоге новое эссе, где он размышляет об экономических изменениях, которые возникают из-за ИИ, но нас удивило несколько вещей.

Во-первых, насколько радикально изменилась его риторика в сторону открытости - очевидно, из-за #DeepSeek . Хотя, если внимательно читать, он очень осторожен в формулировках и нигде прямо не обещает открыть код моделей OpenAI. Это больше похоже на признание общего тренда в индустрии, чем на заявление о смене курса компании.

Что ждёт нас в ближайшем будущем по Альтману?

1. ИИ-агенты как виртуальные коллеги
2. Первой серьезно изменится сфера разработки ПО
3. Научный прогресс значительно ускорится
4. Большинство товаров подешевеет
5. Предметы роскоши и земля подорожают.

Его три наблюдения об экономике ИИ:

1. Стоимость ИИ падает в 10 раз каждые 12 месяцев (против закона Мура 2x/18мес). К 2035г. 1 человек сможет получить доступ к интеллектуальным возможностям, равным всем людям 2025г. вместе взятым.

2. Очень интересны его мысли о будущем рынка труда. Он говорит о появлении совершенно новых профессий, и мы видим здесь целый спектр возможностей: от операторов команд ИИ-агентов до специалистов по человеко-ИИ взаимодействиям. Похоже, что самыми ценными станут навыки направления и координации ИИ, а не выполнение конкретных задач.

3. Его прогноз о ценах тоже заставляет задуматься. Получается интересный парадокс: большинство товаров подешевеет благодаря ИИ и автоматизации, но настоящая роскошь - вещи, которые нельзя масштабировать или воспроизвести с помощью ИИ - станет еще дороже. Земля, уникальный человеческий опыт, ручная работа - всё это может стать новым определением премиум-сегмента.

Что нас действительно впечатлило - это его видение демократизации ИИ. Идея "вычислительных бюджетов" для каждого человека звучит почти как универсальный базовый доход, только в сфере ИИ. Хотя опять же, он оставляет открытым вопрос о том, как именно это будет реализовано.

_______
Источник | #blockchainRF
@F_S_C_P

-------
Секретики!
-------

Sam Altman

Three Observations

Our mission is to ensure that AGI (Artificial General Intelligence) benefits all of humanity.

Systems that start to point to AGI* are coming into view, and so we think it’s important to...

978 viewsedited 12:49

About

Blog

Apps

Platform