Машиннное обучение | Наука о данных Библиотека
16.9K subscribers
759 photos
10 videos
21 files
656 links
админ - @workakkk

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram - 🔥лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

№ 5037635661
Download Telegram
💻 Модель для генерации субтитров в Яндекс Браузере: как работает и что под капотом?

Начнём с новости: Яндекс Браузер теперь умеет создавать субтитры для любых русскоязычных видео в интернете, нейросеть встроена прямо в десктопный браузер. Фича не только поможет, когда нет наушников под рукой, но и откроет весь видеоконтент на русском языке для людей с нарушением слуха.

Разработчики для этого сократили потребление оперативной памяти в 5 раз, теперь эту нейросеть могут тянуть компьютеры с маленькой мощностью. На это понадобилось три волны оптимизации: например, на этапе декодирования было сохранено более 400 Мб, а 450 Мб памяти выиграли на уменьшении разных буферов и очистке памяти на заморозке префикса.

Архитектура состоит из двух очень разных частей: свёрточной и трансформерной. Причём трансформерная часть подверглась частичной квантизации, чтобы не затрагивать сложные слои, такие как softmax.

В итоге получилась модель, которая потребляет всего 150 Мб. Осталось нажать только одну кнопку, чтобы она сгенерировала субтитры. Планируют добавить в нейросеть больше языков и расширить её на другие устройства. Подробности про процесс команда рассказала в статье на Хабре.
👍6
Learn Python, Break Python
A Beginner's Guide to Programming


https://learnpythonbreakpython.com/
🔥4
Крупнейший русскоязычный датасет отзывов на организации
Автор: Яндекс

На Гитхабе появился датасет с 500 тыс. отзывов на организации, который поможет производить лингвистический и сентимент-анализ. Подробнее о датасете можно прочитать в статье на Хабре.
👍73
Яндекс опубликовал плейлист с записями докладов своей хардовой конференции Practical ML, где ключевые инженеры крупных компаний делятся опытом практического применения ML.

Внутри доклады по 8 направлениям: генеративные модели, Research, NLP, Hardware, CV, RecSys, MLOps и Ecomm.

Например:
— Руководитель группы модернизации нейронных сетей Алексей Морозов из Поиска поделился кейсом, как избавить ML-инженеров и исследователей от переживаний за работоспособность инфраструктуры и дать им возможность автоматически масштабироваться во время работы.
— Валерий Ильин, руководитель группы разработки компьютерного зрения и бизнес-процессов, связанных с роботами, рассказал, как работает компьютерное зрение в роботах, которые используются на складах Яндекс Маркета.

Смотрите больше по ссылке.

#PracticalMLConf #AI #ML #машинноеОбучение #новостиAI #технологии
👍42🔥2