VF | Science

👀 Про аудио кодеки в Deep Learning School Сегодня выложили 2 части лекции и она немножко затянулась, примерно на 100 минут :) На лекции мы обсудили основополагающую технологию VQ-VAE и дошли до современных подходов к обучению аудиокодеков. Попутно рассмотрели…

Ноутбук для семинара, в котором мы обучим поверх кодов Mimi кодека классификатор голосов на мужской и женский 😄

Используем 8 кодбуков, обучаем 8 трансформер-энкодеров, делаем темпоральный пулинг по токенам, а затем атеншн пулинг между энкодерами. Потом обычный классификатор. Из прикольного - визуализация атеншна на разные уровни RVQ.

Научились работать с RVQ и в качестве упражнения можете посчитать разные статистики для кодовых книг, например perpexity по кодбуку (покажет насколько равномерно используются коды) или утилизацию кодов на разных уровнях/на первом. Или попробовать другую простенькую задачу и посмотреть как интерпретируются уровни RVQ, вероятно на разных уровнях содержится разная семантика/смысл.

https://colab.research.google.com/drive/1L6sTCrpdxybkSOOrc4G2E4AuRnQLWZQj#scrollTo=cHGzcgj8oRVi

Google

Copy of Копия блокнота

Colab notebook

👍6❤3

5.32K viewsedited 16:29

VF | Science

Forwarded from Ученый без степени | AI-блог Ани

Интерактивный tutorial по аудио кодекам от Kyutai labs 😎

https://kyutai.org/next/codec-explainer

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5

1.63K views12:33

VF | Science

12го ноября прилечу в Питер к Сергею Николенко (@sinecor), буду рассказывать в главном здании СПбГУ все, что знаю про дискретные репрезентации и выбор между непрерывными фичами, это будет экстраполяция семинара про аудио кодеки на весь ML

Пишите/заходите на огонек, запись будет на ютубе у Сергея

🔥14❤103🥴1

1.42K viewsedited 09:09

VF | Science

Очень я рад, именно лекции Сергея Николенко дали мне лучшую теорию и погружение в математику ML. Безусловно этот человек мой кумир. Очень классно совмещает знание истории и математики в своих лекциях. Впрочем, Сергей чемпион мира по ЧГК и автор множества книг :)

👍12🔥9⚡7

1.58K viewsedited 09:12

VF | Science

Forwarded from Sinекура

Доклад вчера, кстати, безусловно удался. Большое спасибо Захару, он отлично подготовился, и этот семинар уже точно будет частью курса DL в этом году.)

Спасибо всем, кто пришёл, ну а дальше будет опять something completely different...

❤‍🔥19💘5🍾41

1.28K views08:22

VF | Science

В команду успешной музыкальной платформы с 15-летней историей ищем талантливого ML-разработчика, для качественного усиления, в связи с ростом. Плеер гитарных табов (https://www.songsterr.com/) — наш основной продукт, которым ежемесячно пользуются миллионы.

Мы работаем над сложными задачами в ML, включая разработку моделей для автоматической транскрипции музыки. Наши модели уже успешно создают табулатуры из аудио — вот пример результата (https://www.youtube.com/watch?v=rM4nAZOJoTQ). Это лишь часть наших проектов в области AI и музыки.

Требуемые навыки:
• Разработка и оптимизация DL-моделей, внедрение в прод
• Глубокое знание современных DL-архитектур
• Опыт тренировки на multi-GPU, оптимизация гиперпараметров
• Работа с грязными user-generated датасетами: фильтрация, очистка
• Желательно: аудиообработка и music information retrieval

Стек:
• Python + PyTorch
• Accelerate/DeepSpeed/W&B
Проекты завязаны на музыке и обучении — интерес к темам плюс. Главное — умение выдавать результат.

Условия:
• Полностью удалёнка, ставка от $9900/mo gross.
• Оформление на контракт, можно из РФ/РБ.
• Предпочитаем фулл-тайм, но график гибкий, сами выбираете когда работать. Хотите больше — допчасы с пропорциональной оплатой. В годовой уже ставке учтены месяц отпуска, 7 дней больничных, 14 праздников и компенсация техники, потому отдельно не оплачиваются.

Процесс отбора:
• Код-тест
• Фидбек по тесту от нас
• Если все ок — оплачиваемое тестовое (испытательный срок парт-тайм): реальная задача, график свободный, можно совмещать с текущей работой — никаких рисков

Связь: @rammusin

Songsterr Tabs with Rhythm

Guitar Tabs with Rhythm | Songsterr

Access over 1 million guitar, bass, and drum tabs with free play-along original audio. Create accurate tabs from YouTube links using advanced AI technology.

🍓7🔥6🤯4⚡1👀1

1.36K views05:16

VF | Science

Мои друзья в поиске MLщиков, ребята тоже делают транскрипцию музыки и много чего еще, попробуйте податься!) Мои доклады и посты в помощь 🤭

❤7🔥4

1.2K views05:18

VF | Science

Forwarded from Audio2MIDI Channel

Audio2MIDI вошёл в ТОП-100 рейтинга Платформы университетского технологического предпринимательства

В 2025 году на отбор подали заявки более 2300 команд со всей России, и наш проект сразу оказался в первой сотне 💯

Мы продолжаем развитие сервиса и уже внедряем улучшения, чтобы вывести конвертацию аудио в MIDI на новый уровень. Спасибо за ваше доверие❤️

——————
Audio2MIDI has entered the TOP 100 of the University Technological Entrepreneurship Platform ranking.

In 2025, over 2,300 teams from across Russia applied for the selection, and our project immediately made it into the top hundred 💯

We continue to develop the service and are already implementing improvements to take audio-to-MIDI conversion to the next level. Thank you for your trust ❤️

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥20👍6🔥4🆒22

873 views13:49

VF | Science

Audio2MIDI Channel

Audio2MIDI вошёл в ТОП-100 рейтинга Платформы университетского технологического предпринимательства В 2025 году на отбор подали заявки более 2300 команд со всей России, и наш проект сразу оказался в первой сотне 💯 Мы продолжаем развитие сервиса и уже внедряем…

Позвольте похвастаться

💯16🙏9😁3🍾3🏆1

936 views13:49

VF | Science

Продолжайте следить за каналом, потому что цели на 2025: ✔️ Понять какие цели и пути мне реально важны)) *️⃣Научиться грамотно распределять время и свои ресурсы *️⃣Расширять свои знания и навыки за пределы аудио ML *️⃣Сделать 100+ классных постов и стримов…

Штош, что то достиг, другое отодвинул ибо переосмыслил и стало неважно, третье не успел. Но вообще, недурно 👍

Даже слишком быстро все пошло, я даже не понимаю, что достигать дальше, отделено от выполненных целей. Будто бы делать качественнее и преумножать то, что есть. Но все же выделю несколько новых. После праздников 🥳

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥3🤝3

596 viewsedited 17:53

VF | Science

Цель номер 2 остается и горит 😇

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1💯1🤝1

598 views17:54

VF | Science

А писать посты с разборами статей как то приелось, также есть нейронки, да и хочется делиться тем, что я знаю на практике длиною в год и более. Я в этом году много говорил про кодеки и авторегрссию в домене аудио (музыка, речь). Дальше будет порционно что-то иное, в течение года.

Я просто выложу список самых интересных и ценных работ.

По вопросам моей деятельности/таким-то инсайдам всегда можете обращаться в коменты/лс.

С наступающим, всех благ!)

2❤12👍5🔥3

633 viewsedited 17:56

About

Blog

Apps

Platform