PythonTalk
4.77K subscribers
1.45K photos
48 videos
7 files
1.32K links
Привет, меня зовут Олег Булыгин 👋

🐍 Здесь я делюсь полезной информацией для тех, кто пишет код на Python: от разработки до Data Science.

По вопросам: @obulygin91
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🇨🇳 Tencent за последнюю пару недель выкатила в опенсорс сразу две нейросети. Одна озвучивает видео, а вторая — метит в убийцы DeepL.

Посмотрите, что делает Hunyuan Video-Foley. Берем немое видео, пишем промпт... и получаем норм такой саунд-дизайн.

Это полноценный Foley — то самое искусство создания звуковых эффектов, которым занимаются целые студии. И теперь Tencent отдает эту технологию в паблик. Можно "потрогать" самому, если у вас есть что-то вроде RTX 3090/4090.

Второй релиз — Hunyuan-MT. Это семейство моделей-переводчиков, которое, по заявлениям Tencent, уже взяло первое место на конкурсе WMT25.

Что там интересного:
1️⃣ Есть модель-"редактор" Chimera. Она не переводит сама, а берет несколько вариантов перевода и "собирает" из них лучший. Впервые такой подход в опенсорсе.
2️⃣ Можно файн-тюнить. Самое ценное для нас, разрабов. Можно дообучить модель на своей специфической лексике (юр, мед, IT-термины) и получить переводчик, который реально понимает ваш контекст.

Кому интересно залезть под капот и запустить это у себя — читайте: Разбор новых SOTA-моделей для перевода (MT) и озвучки видео (Video-Foley) ◀️◀️

Лайтовый видеопересказ здесь ◀️

#щупаем_сорцы
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1🔥1🙏1🆒1