Китайская команда создала AI-инструмент "Woodpecker" для коррекции галлюцинаций
- Ученые из Университета науки и технологии Китая (USTC) и лаборатории YouTu компании Tencent разработали инструмент Woodpecker.
- Он создан для коррекции галлюцинаций в моделях больших языковых систем (MLLMs), когда AI генерирует неточную или неверную информацию, не основанную на реальных событиях или данных.
- Woodpecker использует подход без обучения для коррекции галлюцинаций в сгенерированном тексте, используя три предварительно обученные AI-модели: GPT-3.5 turbo, Grounding DINO и BLIP-2-FlanT5.
- Разработка решает проблемы на уровне объектов и атрибутов, предлагая структурированную базу визуальных знаний для коррекции.
- Инструмент уже открыт для интерактивного изучения и простой интеграции с любыми MLLMs.
С корректором галлюцинаций Woodpecker диалоги с AI станут более достоверными и точными.
#Woodpecker #AI #Tencent
- Ученые из Университета науки и технологии Китая (USTC) и лаборатории YouTu компании Tencent разработали инструмент Woodpecker.
- Он создан для коррекции галлюцинаций в моделях больших языковых систем (MLLMs), когда AI генерирует неточную или неверную информацию, не основанную на реальных событиях или данных.
- Woodpecker использует подход без обучения для коррекции галлюцинаций в сгенерированном тексте, используя три предварительно обученные AI-модели: GPT-3.5 turbo, Grounding DINO и BLIP-2-FlanT5.
- Разработка решает проблемы на уровне объектов и атрибутов, предлагая структурированную базу визуальных знаний для коррекции.
- Инструмент уже открыт для интерактивного изучения и простой интеграции с любыми MLLMs.
С корректором галлюцинаций Woodpecker диалоги с AI станут более достоверными и точными.
#Woodpecker #AI #Tencent
iTnews Asia
Chinese researchers develop AI hallucination correction tool
With better accuracy compared to baseline models.
Tencent совершенствует AI-кластеры: сеть Xingmai 2.0 поддерживает уже 100 000 GPU
Китайский гигант Tencent модернизировал сеть Xingmai 2.0 для высокопроизводительных вычислений:
• Поддержка 100 000 GPU в одном кластере
• Рост эффективности сетевого взаимодействия на 60%
• Увеличение скорости обучения LLM на 20%
Компания оптимизирует существующую инфраструктуру одновременно с закупками новых процессоров.
Tencent продвигает свои LLM в корпоративном секторе и предлагает услуги по разработке ИИ-моделей.
В Китае постоянно появляются новые выгодные предложения в сфере ИИ: Tencent сделала облегченную версию Hunyuan бесплатной.
Согласно опросам, Поднебесная лидирует по внедрению генеративного ИИ в мире.
При этом, ожидается рост рынка ИИ-чипов на $389,25 млрд к 2027му году.
Пора, все-таки, выучить китайский уже.
#Tencent #Xingmai #HPC
-------
@tsingular
Китайский гигант Tencent модернизировал сеть Xingmai 2.0 для высокопроизводительных вычислений:
• Поддержка 100 000 GPU в одном кластере
• Рост эффективности сетевого взаимодействия на 60%
• Увеличение скорости обучения LLM на 20%
Компания оптимизирует существующую инфраструктуру одновременно с закупками новых процессоров.
Tencent продвигает свои LLM в корпоративном секторе и предлагает услуги по разработке ИИ-моделей.
В Китае постоянно появляются новые выгодные предложения в сфере ИИ: Tencent сделала облегченную версию Hunyuan бесплатной.
Согласно опросам, Поднебесная лидирует по внедрению генеративного ИИ в мире.
При этом, ожидается рост рынка ИИ-чипов на $389,25 млрд к 2027му году.
Пора, все-таки, выучить китайский уже.
#Tencent #Xingmai #HPC
-------
@tsingular
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
GameGen-O: революция в создании видеоигр с открытым миром
Tencent представила GameGen-O - первую диффузионную трансформер-модель для генерации видеоигр с открытым миром.
Разработка симулирует функции игрового движка: персонажей, окружение, действия и события.
Модель обучена на OGameData - наборе данных из сотни игр с открытым миром.
Двухэтапное обучение включает предварительную тренировку и настройку инструкций через InstructNet.
GameGen-O сочетает креативную генерацию с интерактивным контролем, предлагая альтернативу традиционным техникам рендеринга.
Скоро геймдизайнеры будут просто описывать идею игры или фильма, а ИИ сделает всю черновую работу.
Разработчикам и сценаристам достаточно будет на словах описать свою идею.
А нужны ли они будут тогда?
Может игрок или зритель сам скажет что хочет увидеть сегодня. 🎮🤖
#GameGen #Tencent #Games #Китай
———
@tsingular
Tencent представила GameGen-O - первую диффузионную трансформер-модель для генерации видеоигр с открытым миром.
Разработка симулирует функции игрового движка: персонажей, окружение, действия и события.
Модель обучена на OGameData - наборе данных из сотни игр с открытым миром.
Двухэтапное обучение включает предварительную тренировку и настройку инструкций через InstructNet.
GameGen-O сочетает креативную генерацию с интерактивным контролем, предлагая альтернативу традиционным техникам рендеринга.
Скоро геймдизайнеры будут просто описывать идею игры или фильма, а ИИ сделает всю черновую работу.
Разработчикам и сценаристам достаточно будет на словах описать свою идею.
А нужны ли они будут тогда?
Может игрок или зритель сам скажет что хочет увидеть сегодня. 🎮🤖
#GameGen #Tencent #Games #Китай
———
@tsingular
🔥35🤔8👏6👍4👀3❤2
Tencent выпускает самую мощную открытую MoE модель в мире
Hunyuan-Large устанавливает новый стандарт производительности языковых моделей с 389 млрд параметров.
Архитектура Mixture of Experts, контекстное окно в 256K токенов.
Система превосходит LLama3.1-405B на 2.6% в MMLU и на 3.6% в математических тестах.
Модель демонстрирует выдающиеся результаты в задачах на китайском языке, программировании и научных вычислениях.
HuggingFace
GitHub
Китайские модели умеют в оптимизацию, получается. При меньшем объеме показывают лучший результат. 😎
#Tencent #Hunyuan #MoE #Китай
-------
@tsingular
Hunyuan-Large устанавливает новый стандарт производительности языковых моделей с 389 млрд параметров.
Архитектура Mixture of Experts, контекстное окно в 256K токенов.
Система превосходит LLama3.1-405B на 2.6% в MMLU и на 3.6% в математических тестах.
Модель демонстрирует выдающиеся результаты в задачах на китайском языке, программировании и научных вычислениях.
HuggingFace
GitHub
Китайские модели умеют в оптимизацию, получается. При меньшем объеме показывают лучший результат. 😎
#Tencent #Hunyuan #MoE #Китай
-------
@tsingular
🔥4
Media is too big
VIEW IN TELEGRAM
Tencent выпустила фреймворк генерации видео по тексту HunyuanVideo
13B параметров, открытый исходный код на PyTorch.
Использует мультимодальный текстовый энкодер для понимания промптов, что даёт лучший эффект, чем T5 XXL.
Встроенный CausalConv3D модуль эффективно сжимает видеопоток.
Поддерживает полноформатное разрешение и различные соотношения сторон при генерации.
Запуск через Docker с поддержкой CUDA 11.8/12.0+
В планах: поддержка ComfyUI по умолчанию, нескольких GPU одновременно и диффузеров.
Домашний нейрорендер всё круче и круче 🎬
#Tencent #HunyuanVideo #нейрорендер #Китай
-------
@tsingular
13B параметров, открытый исходный код на PyTorch.
Использует мультимодальный текстовый энкодер для понимания промптов, что даёт лучший эффект, чем T5 XXL.
Встроенный CausalConv3D модуль эффективно сжимает видеопоток.
Поддерживает полноформатное разрешение и различные соотношения сторон при генерации.
Запуск через Docker с поддержкой CUDA 11.8/12.0+
В планах: поддержка ComfyUI по умолчанию, нескольких GPU одновременно и диффузеров.
Домашний нейрорендер всё круче и круче 🎬
#Tencent #HunyuanVideo #нейрорендер #Китай
-------
@tsingular
🔥7👍1
Tencent выпустил Hunyuan T1
Tencent выпустил свою передовую языковую модель с рассуждениями:
Hunyuan T1
Пишут, что лучше чем OpenAI GPT 4.5 и DeepSeek R1.
87.2 баллов в MMLU Pro против 84 у DeepSeek-R1, но меньше, чем 89.3 у OpenAI’s o1.
78.2 в AIME
Цены: US$0.14 за 1 млн. токенов
Web:
https://llm.hunyuan.tencent.com/#/chat/hy-t1
HF:
https://huggingface.co/spaces/tencent/Hunyuan-T1
#Tencent #Hunyuan #T1 #Китай
------
@tsingular
Tencent выпустил свою передовую языковую модель с рассуждениями:
Hunyuan T1
Пишут, что лучше чем OpenAI GPT 4.5 и DeepSeek R1.
87.2 баллов в MMLU Pro против 84 у DeepSeek-R1, но меньше, чем 89.3 у OpenAI’s o1.
78.2 в AIME
Цены: US$0.14 за 1 млн. токенов
Web:
https://llm.hunyuan.tencent.com/#/chat/hy-t1
HF:
https://huggingface.co/spaces/tencent/Hunyuan-T1
#Tencent #Hunyuan #T1 #Китай
------
@tsingular
👍6
Tencent наращивает инвестиции в ИИ и расширяет глобальное присутствие
Китайский технологический гигант Tencent опубликовал финансовые результаты за Q1 2025, демонстрирующие стратегический разворот в сторону искусственного интеллекта и международной экспансии:
Ключевые финансовые показатели:
• Выручка: 180 млрд юаней ($25.1 млрд) — рост 13% год к году
• Чистая прибыль: 47.8 млрд юаней ($6.7 млрд) — рост 14% год к году
• R&D расходы: 18.9 млрд юаней ($2.63 млрд) — рост 21% год к году
• Капитальные затраты: 27.5 млрд юаней ($3.8 млрд) — рост 91% год к году
• Игровое направление в Китае: 42.9 млрд юаней — рост 24% год к году
• Международные игры: 16.6 млрд юаней — рост 23% год к году
• Маркетинговые услуги: 31.9 млрд юаней — рост 20% год к году
Стратегия развития ИИ:
• Масштабное обновление GPU-инфраструктуры для обучения моделей
• Акцент на разработке собственных чипов для ИИ-инференса
• Дальнейшее развитие LLM Hunyuan и чат-бота Yuanbao
• Внедрение ИИ в рекламные платформы
• Интеграция ИИ в WeChat для интерактивного взаимодействия и повышения продуктивности
Международная экспансия:
• Вице-президент Tencent Ли Цян сообщил о планах инвестировать 150 млн долларов на Ближнем Востоке для создания первого дата-центра компании в Саудовской Аравии
• Дополнительные инвестиции в размере 500 млн долларов будут направлены в Индонезию для строительства третьего дата-центра компании в этой стране
• По словам Ли Цяна, как глобально расширяющийся провайдер облачных вычислений, Tencent Cloud поддерживал двузначный рост международного бизнеса в течение последних трех лет
• Сегодня компания обслуживает более 10 000 зарубежных клиентов в более чем 80 странах и регионах
• Стратегические партнерства в ключевых регионах (ZainTech на Ближнем Востоке, GoTo в Индонезии)
Перспективы развития:
• Увеличение операционной прибыли до 39% (с 37% в прошлом году)
• Стабильный рост MAU WeChat до 1.4 млрд пользователей (+3% год к году)
• Фокус на прибыльном росте финтех-сервисов и облачных решений
• Капитализация на тренде электронной коммерции внутри экосистемы WeChat и Weixin
• Долгосрочные инвестиции в технологии ИИ как основа будущей стратегии роста
Tencent демонстрирует стратегический подход к ИИ-трансформации, инвестируя как в технологические возможности, так и в международную экспансию.
Ключевой акцент делается на оптимизацию существующих высокорентабельных направлений для финансирования долгосрочных ИИ-инициатив, которые должны обеспечить устойчивое конкурентное преимущество на глобальном рынке.
#Tencent #Китай
———
@tsingular
Китайский технологический гигант Tencent опубликовал финансовые результаты за Q1 2025, демонстрирующие стратегический разворот в сторону искусственного интеллекта и международной экспансии:
Ключевые финансовые показатели:
• Выручка: 180 млрд юаней ($25.1 млрд) — рост 13% год к году
• Чистая прибыль: 47.8 млрд юаней ($6.7 млрд) — рост 14% год к году
• R&D расходы: 18.9 млрд юаней ($2.63 млрд) — рост 21% год к году
• Капитальные затраты: 27.5 млрд юаней ($3.8 млрд) — рост 91% год к году
• Игровое направление в Китае: 42.9 млрд юаней — рост 24% год к году
• Международные игры: 16.6 млрд юаней — рост 23% год к году
• Маркетинговые услуги: 31.9 млрд юаней — рост 20% год к году
Стратегия развития ИИ:
• Масштабное обновление GPU-инфраструктуры для обучения моделей
• Акцент на разработке собственных чипов для ИИ-инференса
• Дальнейшее развитие LLM Hunyuan и чат-бота Yuanbao
• Внедрение ИИ в рекламные платформы
• Интеграция ИИ в WeChat для интерактивного взаимодействия и повышения продуктивности
Международная экспансия:
• Вице-президент Tencent Ли Цян сообщил о планах инвестировать 150 млн долларов на Ближнем Востоке для создания первого дата-центра компании в Саудовской Аравии
• Дополнительные инвестиции в размере 500 млн долларов будут направлены в Индонезию для строительства третьего дата-центра компании в этой стране
• По словам Ли Цяна, как глобально расширяющийся провайдер облачных вычислений, Tencent Cloud поддерживал двузначный рост международного бизнеса в течение последних трех лет
• Сегодня компания обслуживает более 10 000 зарубежных клиентов в более чем 80 странах и регионах
• Стратегические партнерства в ключевых регионах (ZainTech на Ближнем Востоке, GoTo в Индонезии)
Перспективы развития:
• Увеличение операционной прибыли до 39% (с 37% в прошлом году)
• Стабильный рост MAU WeChat до 1.4 млрд пользователей (+3% год к году)
• Фокус на прибыльном росте финтех-сервисов и облачных решений
• Капитализация на тренде электронной коммерции внутри экосистемы WeChat и Weixin
• Долгосрочные инвестиции в технологии ИИ как основа будущей стратегии роста
Tencent демонстрирует стратегический подход к ИИ-трансформации, инвестируя как в технологические возможности, так и в международную экспансию.
Ключевой акцент делается на оптимизацию существующих высокорентабельных направлений для финансирования долгосрочных ИИ-инициатив, которые должны обеспечить устойчивое конкурентное преимущество на глобальном рынке.
#Tencent #Китай
———
@tsingular
🔥4👍3❤1🐳1
This media is not supported in your browser
VIEW IN TELEGRAM
Tencent представил HunyuanVideo-Avatar — ИИ для создания говорящих персонажей
Новая модель от Tencent превращает статичную картинку и аудиозапись в реалистичное видео с говорящим персонажем.
Основные возможности:
- Анимация любых изображений: фото, мультяшки, 3D-рендер
- Контроль эмоций через референсное изображение
- Поддержка нескольких персонажей в одном видео
- Генерация портретов, поясных и полноростовых видео
Технология основана на multimodal diffusion transformer с тремя ключевыми модулями: инъекция персонажа, извлечение эмоций из аудио и маскирование лиц для мультиперсонажных сцен.
Применение: e-commerce, стриминг, соцсети, создание контента.
Прямой конкурент Аватар4 Heygen
#AIAvatar #нейрорендер #Tencent #Китай
------
@tsingular
Новая модель от Tencent превращает статичную картинку и аудиозапись в реалистичное видео с говорящим персонажем.
Основные возможности:
- Анимация любых изображений: фото, мультяшки, 3D-рендер
- Контроль эмоций через референсное изображение
- Поддержка нескольких персонажей в одном видео
- Генерация портретов, поясных и полноростовых видео
Технология основана на multimodal diffusion transformer с тремя ключевыми модулями: инъекция персонажа, извлечение эмоций из аудио и маскирование лиц для мультиперсонажных сцен.
Применение: e-commerce, стриминг, соцсети, создание контента.
Прямой конкурент Аватар4 Heygen
#AIAvatar #нейрорендер #Tencent #Китай
------
@tsingular
👍6⚡5🔥2🤝1🆒1
Forwarded from Machinelearning
Первая полностью open-source, готовая к продакшену PBR 3D генеративная модель!
PBR (Physically Based Rendering) - это технология, при которой внешний вид 3D-объектов рассчитывается с учётом реальных физических законов взаимодействия света и поверхности.
✅ Модель выдает кинематографичное качество: синтез PBR-материалов — кожа, бронза и другие поверхности выглядят фотореалистично с красивыми эффектами освещения.
✅ Open source: доступны веса модели, код для обучения и инференса, пайплайны — всё можно доработать под себя.
✅ Запускается даже на потребительских GPU (Модель тестировалась на GPU A100 с Python 3.10 и PyTorch 2.5.1+cu124.) — с моделью создавать 3D-контент могут не только студии, но и любые разработчики и малые команды.
▪ Модель: https://huggingface.co/tencent/Hunyuan3D-2.1
▪ Github: https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1
▪ Hunyuan 3D Creation Engine: https://3d.hunyuan.tencent.com
@ai_machinelearning_big_data
#Hunyuan3D #OpenSource #3DCreation #tencent
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
✍5👍3⚡2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Tencent выпустили новую модель для 3D-генерации
Hunyuan3D-PolyGen — первая модель "арт-уровня" для создания профессиональных 3D-моделей. Генерирует готовые ассеты за 8-20 секунд против 40 минут у конкурентов.
Технология BPT сжимает mesh-последовательности на 75% без потери деталей. Модель создает объекты с 8000+ полигонами и правильной топологией для игр и кино.
Tencent уже использует систему в Honor of Kings — время создания персонажей сократилось на 90%. Поддерживает Unity, Unreal Engine и форматы GLB/OBJ/FBX.
Если если китайская авторизация попробовать можно тут
На GitHub есть 2.1, это еще не PolyGen, но близко.
#3D #Китай #Tencent #Hunyuan #PolyGen
———
@tsingular
Hunyuan3D-PolyGen — первая модель "арт-уровня" для создания профессиональных 3D-моделей. Генерирует готовые ассеты за 8-20 секунд против 40 минут у конкурентов.
Технология BPT сжимает mesh-последовательности на 75% без потери деталей. Модель создает объекты с 8000+ полигонами и правильной топологией для игр и кино.
Tencent уже использует систему в Honor of Kings — время создания персонажей сократилось на 90%. Поддерживает Unity, Unreal Engine и форматы GLB/OBJ/FBX.
Если если китайская авторизация попробовать можно тут
На GitHub есть 2.1, это еще не PolyGen, но близко.
#3D #Китай #Tencent #Hunyuan #PolyGen
———
@tsingular
🔥8🤯6
Moonshot AI (Tencent) выпустила Kimi K2 — триллионный MoE-гигант
Китайская Moonshot AI представила Kimi K2 — модель с триллионом параметров из которых 32B активируются при инференсе.
Это MoE трансформер, обученный с помощью оптимизатора Muon.
Особенность модели — сильные агентские способности и умение работать с инструментами.
По мощности, - лучше, чем DeepSeek V3 0324, но слабее Claude Opus4
И, конечно, далеко до Грока4, который теперь уже новая норма, но его даже нет в сравнительной таблице тут.
Зато бесплатно, если у вас есть 1Тб видеопамяти.
Полный размер - 1 терабайт
Контекстное окно - 128К
чат: https://www.kimi.com/
Доступна через API, совместимый с OpenAI и Anthropic.
Веса выложены на Hugging Face под модифицированной MIT-лицензией.
Поддерживает vLLM и SGLang.
#Tencent #Kimi #Moonshot #Китай
———
@tsingular
Китайская Moonshot AI представила Kimi K2 — модель с триллионом параметров из которых 32B активируются при инференсе.
Это MoE трансформер, обученный с помощью оптимизатора Muon.
Особенность модели — сильные агентские способности и умение работать с инструментами.
По мощности, - лучше, чем DeepSeek V3 0324, но слабее Claude Opus4
И, конечно, далеко до Грока4, который теперь уже новая норма, но его даже нет в сравнительной таблице тут.
Зато бесплатно, если у вас есть 1Тб видеопамяти.
Полный размер - 1 терабайт
Контекстное окно - 128К
чат: https://www.kimi.com/
Доступна через API, совместимый с OpenAI и Anthropic.
Веса выложены на Hugging Face под модифицированной MIT-лицензией.
Поддерживает vLLM и SGLang.
#Tencent #Kimi #Moonshot #Китай
———
@tsingular
🔥4❤1⚡1👍1🎉1