Всем привет! Начинаем знакомить вас с докладами ML-трека на Saint HighLoad++, который пройдет при поддержке VK.
Любовь Рожкова из S7 TechLab расскажет об аналитике по самолетам S7: pets vs cattle.
⠀
📋 https://bx.vc/xzxnub
⠀
Для нас полеты это поиск билетов и "пристегните ремни". Для программистов в авиакомпании это полное т/о самолетов раз в два года, проверки раз в два дня, штрафы в сотни тысяч долларов за задержку в десять минут. Бизнес хочет, чтобы программисты как можно точнее предсказывали время обслуживания самолета по совсем скромному количеству исторических данных.
⠀
Узнаем, как специфика авиации и небольшое количество, по меркам HighLoad, данных заставляет их искать необычные подходы. Пока все обучают AI на океанах размеченных данных, они используют "немодные" решающие деревья, которые можно обучить на выборке в сотни строк. Создают системы, которые объясняют инженерам оценки и позволяют им самим делать "очистку" данных.
⠀
✅ Программа ML-трека - https://bx.vc/b3dkve
⠀
До скорой встречи в Питере 🙌
Любовь Рожкова из S7 TechLab расскажет об аналитике по самолетам S7: pets vs cattle.
⠀
📋 https://bx.vc/xzxnub
⠀
Для нас полеты это поиск билетов и "пристегните ремни". Для программистов в авиакомпании это полное т/о самолетов раз в два года, проверки раз в два дня, штрафы в сотни тысяч долларов за задержку в десять минут. Бизнес хочет, чтобы программисты как можно точнее предсказывали время обслуживания самолета по совсем скромному количеству исторических данных.
⠀
Узнаем, как специфика авиации и небольшое количество, по меркам HighLoad, данных заставляет их искать необычные подходы. Пока все обучают AI на океанах размеченных данных, они используют "немодные" решающие деревья, которые можно обучить на выборке в сотни строк. Создают системы, которые объясняют инженерам оценки и позволяют им самим делать "очистку" данных.
⠀
✅ Программа ML-трека - https://bx.vc/b3dkve
⠀
До скорой встречи в Питере 🙌
👍2
Всем привет!
⠀
На конференциях в основном принято говорить о своих победах и крутых результатах, а вот об ошибках рассказывают гораздо меньше. В этот раз на Saint HighLoad++ мы собрали фейл-секцию, которая состоит только из ошибок, чтобы вы их не повторяли.
⠀
👉 Fail митап: This is fine или все делают это
📋 https://bx.vc/tkb0p5
⠀
Это серия коротких выступлений про самые тривиальные, неочевидные или болезненные фейлы из живого опыта.
⠀
Расскажем, что случилось и как случилось, ответим на вопросы. Если останется свободное время, участники смогут поделиться своими историями.
⠀
Без камер, записи и трансляции.
⠀
До скорой встречи в Питере 🙌
⠀
✅ Подробная информация о конференции, расписание и билеты здесь - https://bx.vc/31h0ny
⠀
На конференциях в основном принято говорить о своих победах и крутых результатах, а вот об ошибках рассказывают гораздо меньше. В этот раз на Saint HighLoad++ мы собрали фейл-секцию, которая состоит только из ошибок, чтобы вы их не повторяли.
⠀
👉 Fail митап: This is fine или все делают это
📋 https://bx.vc/tkb0p5
⠀
Это серия коротких выступлений про самые тривиальные, неочевидные или болезненные фейлы из живого опыта.
⠀
Расскажем, что случилось и как случилось, ответим на вопросы. Если останется свободное время, участники смогут поделиться своими историями.
⠀
Без камер, записи и трансляции.
⠀
До скорой встречи в Питере 🙌
⠀
✅ Подробная информация о конференции, расписание и билеты здесь - https://bx.vc/31h0ny
Как понять, что проекту плохо, если вы инженер? Узнаем из доклада Юлии Белозеровой
⠀
📋 https://bx.vc/evpn2b
⠀
На примере проекта про миграцию в облако Юлия расскажет, на что инженеру обращать внимание, чтобы вовремя поднять флажок и проект не зафейлился.
⠀
В командах часто есть проблема: инженеры работают работу, а все происходящее между менеджером и заказчиками остается загадкой. Поговорим, какие вопросы задать менеджеру, чтобы понять общую картину проекта.
⠀
Узнаем, как понять, что проект провалится до того, как это заметит менеджер. Покажет, на чем фокусироваться, чтобы исправить курс проекта и увеличить шансы на успех, даже когда все уже плохо.
⠀
Ждем вас на Saint HighLoad++ 22 и 23 сентября в Петербурге или онлайн по всему миру ✋
⠀
✅ Программа конференции и билеты здесь - https://bx.vc/057pgc
⠀
📋 https://bx.vc/evpn2b
⠀
На примере проекта про миграцию в облако Юлия расскажет, на что инженеру обращать внимание, чтобы вовремя поднять флажок и проект не зафейлился.
⠀
В командах часто есть проблема: инженеры работают работу, а все происходящее между менеджером и заказчиками остается загадкой. Поговорим, какие вопросы задать менеджеру, чтобы понять общую картину проекта.
⠀
Узнаем, как понять, что проект провалится до того, как это заметит менеджер. Покажет, на чем фокусироваться, чтобы исправить курс проекта и увеличить шансы на успех, даже когда все уже плохо.
⠀
Ждем вас на Saint HighLoad++ 22 и 23 сентября в Петербурге или онлайн по всему миру ✋
⠀
✅ Программа конференции и билеты здесь - https://bx.vc/057pgc
➡️ Про векторный поиск в ClickHouse узнаем от Артура Филатенкова
⠀
📋 https://bx.vc/6guezw
⠀
ClickHouse быстро выполняет все виды запросов, но его можно ускорить. Это касается работы с многомерными данными, которые могут возникать, например, при работе с текстами или картинками. Такие задачи часто встречаются в аналитике, и для них есть готовые решения. Особенно интересными являются индексы, такие как Faiss, HNSW и Annoy.
⠀
Из доклада Артура узнаем о новом виде индексов для ускорения запросов поиска похожих многомерных объектов. Он расскажет об их устройстве, тонкостях использования и о различиях между индексами на основе разных алгоритмов.
⠀
Ждем вас 22 и 23 сентября в Санкт-Петербурге и онлайн по всему миру 🙌
⠀
✅ Подробно о конференции, программа и билеты здесь - https://bx.vc/xxj6rc
⠀
📋 https://bx.vc/6guezw
⠀
ClickHouse быстро выполняет все виды запросов, но его можно ускорить. Это касается работы с многомерными данными, которые могут возникать, например, при работе с текстами или картинками. Такие задачи часто встречаются в аналитике, и для них есть готовые решения. Особенно интересными являются индексы, такие как Faiss, HNSW и Annoy.
⠀
Из доклада Артура узнаем о новом виде индексов для ускорения запросов поиска похожих многомерных объектов. Он расскажет об их устройстве, тонкостях использования и о различиях между индексами на основе разных алгоритмов.
⠀
Ждем вас 22 и 23 сентября в Санкт-Петербурге и онлайн по всему миру 🙌
⠀
✅ Подробно о конференции, программа и билеты здесь - https://bx.vc/xxj6rc
👍5
Об эксплуатации голоса в Марусе. С какими проблемами столкнулись разработчики и при чем тут GPU узнаем из доклада Павла Алексеева
⠀
📋 https://bx.vc/v4yei4
⠀
GPU — вещь капризная: видеокарты горят, вылетают из системы, отвечают с ошибками. Что делать с ними, когда ответ "переустанови драйвер" перестает работать? А если они просто исчезают? А если их еще при этом сотни?
За три года эксплуатации Маруси они разрослись до порядка двухсот серверов, внутри которых более тысячи видеокарт. В докладе Алексей расскажет, как они применяют GPU, какие проблемы они получили и как их решали. Рассмотрим типичные ошибки и не очень типичные действия по устранению этих ошибок.
⠀
✅ Программа ML-трека - https://bx.vc/ijgfsk
До скорой встречи на Saint HighLoad++ 22-23 сентября в Санкт-Петербурге 🙌
⠀
📋 https://bx.vc/v4yei4
⠀
GPU — вещь капризная: видеокарты горят, вылетают из системы, отвечают с ошибками. Что делать с ними, когда ответ "переустанови драйвер" перестает работать? А если они просто исчезают? А если их еще при этом сотни?
За три года эксплуатации Маруси они разрослись до порядка двухсот серверов, внутри которых более тысячи видеокарт. В докладе Алексей расскажет, как они применяют GPU, какие проблемы они получили и как их решали. Рассмотрим типичные ошибки и не очень типичные действия по устранению этих ошибок.
⠀
✅ Программа ML-трека - https://bx.vc/ijgfsk
До скорой встречи на Saint HighLoad++ 22-23 сентября в Санкт-Петербурге 🙌
👍1
Про испытание полной нагрузки на цепь в AliExpress Россия расскажет Hu Junyuan
⠀
📋 https://bx.vc/w71c46
⠀
AliExpress Russia - крупнейшая в России и странах СНГ онлайн-площадка для продажи потребительских товаров из России, Китая, Турции, Италии и многих других стран. Каждый день более 8,8 миллионов пользователей посещают их сайт и приложение и выбирают лучшее среди более чем 2 миллиардов товаров. В команде AliExpress Россия 600 разработчиков, а внутри - новейшие инструменты и мощь китайских систем, несколько тысяч серверов, современная микросервисная архитектура и передовые процессы разработки.
⠀
🔺 Друзья, внимание. Доклад будет на английском языке, но с текстовым переводом.
⠀
Встречаемся 22 и 23 сентября на Saint HighLoad++ в Петербурге 🙌
⠀
✅ Программа конференции и билеты на сайте - https://bx.vc/40uyrj
⠀
📋 https://bx.vc/w71c46
⠀
AliExpress Russia - крупнейшая в России и странах СНГ онлайн-площадка для продажи потребительских товаров из России, Китая, Турции, Италии и многих других стран. Каждый день более 8,8 миллионов пользователей посещают их сайт и приложение и выбирают лучшее среди более чем 2 миллиардов товаров. В команде AliExpress Россия 600 разработчиков, а внутри - новейшие инструменты и мощь китайских систем, несколько тысяч серверов, современная микросервисная архитектура и передовые процессы разработки.
⠀
🔺 Друзья, внимание. Доклад будет на английском языке, но с текстовым переводом.
⠀
Встречаемся 22 и 23 сентября на Saint HighLoad++ в Петербурге 🙌
⠀
✅ Программа конференции и билеты на сайте - https://bx.vc/40uyrj
Олег Блохин из Dodo Engineering расскажет, как они базу в облако увозили
⠀
📋 https://bx.vc/0zowsx
⠀
В сентябре 2019 г., на выходных, они культурно отдыхали всем Dodo Engineering на турбазе под Владимиром. В это время облачный провайдер обновил минорную версию MySQL.
⠀
История о последствиях и инженерных решениях, сдобренная анекдотами из жизни в облаке.
⠀
Если вы мечтаете об облаках, но никогда там не жили — приходите послушать как бывает. В рамках одной продолжительной истории переезда базы на managed-решение мы разберём, какие подводные камни, детские болезни и неприятные проблемы случаются. Смотреть будем на примере MySQL, но большая часть ситуаций не связана с конкретной базой данных и с базами данных вообще.
⠀
✋ Ждем вас на Saint HighLoad++ 22 и 23 сентября.
⠀
✅ Программа конференции и билеты по ссылке - https://bx.vc/xwj38j
⠀
📋 https://bx.vc/0zowsx
⠀
В сентябре 2019 г., на выходных, они культурно отдыхали всем Dodo Engineering на турбазе под Владимиром. В это время облачный провайдер обновил минорную версию MySQL.
⠀
История о последствиях и инженерных решениях, сдобренная анекдотами из жизни в облаке.
⠀
Если вы мечтаете об облаках, но никогда там не жили — приходите послушать как бывает. В рамках одной продолжительной истории переезда базы на managed-решение мы разберём, какие подводные камни, детские болезни и неприятные проблемы случаются. Смотреть будем на примере MySQL, но большая часть ситуаций не связана с конкретной базой данных и с базами данных вообще.
⠀
✋ Ждем вас на Saint HighLoad++ 22 и 23 сентября.
⠀
✅ Программа конференции и билеты по ссылке - https://bx.vc/xwj38j
🚩 Под красным флагом: как инженер может понять, что в проекте происходит что-то не то? Узнаем из доклада Даниила Подольского
⠀
📋 https://bx.vc/tsagam
⠀
Иногда в проекте происходит "что-то не то". Иногда это "не то" связано с ошибочными техническими решениями, принятыми руководством или даже коллегиально.
⠀
Иногда такое "не то" способно завести проект в тупик, а если и не весь проект, то карьеру инженера в этом конкретном проекте.
⠀
Как выглядит такое "не то", как его можно распознать, и как эти риски можно митигировать?
⠀
На примере нескольких сугубо типичных эпичных фейлов рассмотрим разные "не то" и, возможно, придумаем, что с этим делать.
⠀
✅ Подробно о конференции, расписание и билеты здесь – https://bx.vc/m2xjh1
⠀
До скорой встречи в Петербурге или онлайн по всему миру 🙌
⠀
📋 https://bx.vc/tsagam
⠀
Иногда в проекте происходит "что-то не то". Иногда это "не то" связано с ошибочными техническими решениями, принятыми руководством или даже коллегиально.
⠀
Иногда такое "не то" способно завести проект в тупик, а если и не весь проект, то карьеру инженера в этом конкретном проекте.
⠀
Как выглядит такое "не то", как его можно распознать, и как эти риски можно митигировать?
⠀
На примере нескольких сугубо типичных эпичных фейлов рассмотрим разные "не то" и, возможно, придумаем, что с этим делать.
⠀
✅ Подробно о конференции, расписание и билеты здесь – https://bx.vc/m2xjh1
⠀
До скорой встречи в Петербурге или онлайн по всему миру 🙌
👍2
AI maturity index — как и зачем оценивают индекс ИИ-зрелости? Обсудим с Андреем Анисимовым. В Газпромбанке Андрей занимается монетизацией не только банковских данных, но и поступающих из экосистемы, в первую очередь из ГазпромбанкМобайла
⠀
📋 https://bx.vc/c2d1dz
⠀
AI maturity index — не еще один индекс в ИТ-отрасли, а международный опыт систематизации внедрения Data Science-подходов в бизнес-процессы.
⠀
В докладе рассмотрим, что это такое, почему вычисляют ИИ-зрелость, какие есть стадии внедрения и направления исследования для его формирования, а также какие возникают риски при его контроле.
⠀
Ждем вас 22 и 23 сентября 🙌
⠀
✅ Подробно о конференции, расписание и билеты здесь - https://bx.vc/6gmucs
⠀
📋 https://bx.vc/c2d1dz
⠀
AI maturity index — не еще один индекс в ИТ-отрасли, а международный опыт систематизации внедрения Data Science-подходов в бизнес-процессы.
⠀
В докладе рассмотрим, что это такое, почему вычисляют ИИ-зрелость, какие есть стадии внедрения и направления исследования для его формирования, а также какие возникают риски при его контроле.
⠀
Ждем вас 22 и 23 сентября 🙌
⠀
✅ Подробно о конференции, расписание и билеты здесь - https://bx.vc/6gmucs
Про Dashboard as a code, или путь от правок в UI до grafonnet узнаем из доклада Антона Быстрова
⠀
📋 https://bx.vc/33avlj
⠀
Антон хочет поделиться, каким образом можно создавать и сопровождать дашборды, чтобы не погрязнуть в рутинных операциях.
⠀
Проведет краткий обзор инструментов, которые в разы могут облегчить процесс чтения кода и его проверки. Расскажет про их путь с командой — почему они выбрали grafonnet, и что из этого получилось.
⠀
✅ Программа конференции и билеты по ссылке – https://bx.vc/7dvs4c
⠀
До скорой встречи в Питере 🙌
⠀
📋 https://bx.vc/33avlj
⠀
Антон хочет поделиться, каким образом можно создавать и сопровождать дашборды, чтобы не погрязнуть в рутинных операциях.
⠀
Проведет краткий обзор инструментов, которые в разы могут облегчить процесс чтения кода и его проверки. Расскажет про их путь с командой — почему они выбрали grafonnet, и что из этого получилось.
⠀
✅ Программа конференции и билеты по ссылке – https://bx.vc/7dvs4c
⠀
До скорой встречи в Питере 🙌
Про нагрузочное тестирование синтеза и распознавания речи в SberDevices расскажет Андрей Чернопятов.
⠀
📋 https://bx.vc/afx74v
⠀
Все уже привыкли что техника вокруг слышит нас и отвечает в ответ. В сети есть много информации о том, как собрать какой-нибудь движок для экспериментов, но что, если вам нужно бесперебойно обрабатывать миллиарды секунд звука с гарантированной скоростью? В этом докладе Андрей расскажет, как устроено нагрузочное тестирование синтеза и распознавания речи в SberDevices.
⠀
Узнаем:
- Проблемы метрик: что такое "быстрый, но качественный ASR/TTS"
- Как подружить скорость и стабильность
- Что может влиять на результат, если шаг вашей шкалы — десятки миллисекунд
- Какие сложности в нагрузочном тестировании встречаются в сервисах работы со звуком
⠀
Встречаемся 22 и 23 сентября на Saint HighLoad++ 🙌
⠀
✅ Программа ML-трека - https://bx.vc/678yjd
⠀
📋 https://bx.vc/afx74v
⠀
Все уже привыкли что техника вокруг слышит нас и отвечает в ответ. В сети есть много информации о том, как собрать какой-нибудь движок для экспериментов, но что, если вам нужно бесперебойно обрабатывать миллиарды секунд звука с гарантированной скоростью? В этом докладе Андрей расскажет, как устроено нагрузочное тестирование синтеза и распознавания речи в SberDevices.
⠀
Узнаем:
- Проблемы метрик: что такое "быстрый, но качественный ASR/TTS"
- Как подружить скорость и стабильность
- Что может влиять на результат, если шаг вашей шкалы — десятки миллисекунд
- Какие сложности в нагрузочном тестировании встречаются в сервисах работы со звуком
⠀
Встречаемся 22 и 23 сентября на Saint HighLoad++ 🙌
⠀
✅ Программа ML-трека - https://bx.vc/678yjd
👍3
Как и для чего делать свой переводчик в эпоху облачных решений? Узнаем из доклада Андрея Соколова.
⠀
📋 https://bx.vc/fmw231
⠀
Если пользователи вашего сервиса говорят на разных языках и при этом у вас много обновляющихся текстов — в каталоге товаров, новостях или, как ВКонтакте, в уникальных постах пользователей соцсети — то вам нужен автоматический перевод.
⠀
В докладе Андрей расскажет, как они ВКонтакте подошли к этой задаче и почему в результате разработали своё решение. С собственной системой перевода им больше не нужно никому за него платить, а производительность модели находится полностью под их контролем. Модель учитывает особенности языка пользователей и на основе оценки асессоров выигрывает в качестве. Андрей поделится лайфхаками и инструментами, которые позволили этого добиться и расскажет, на что в первую очередь обратить внимание, создавая свой машинный перевод или другие ML-решения.
⠀
✅ Программа ML-трека - https://bx.vc/nwiel7
До встречи 22 и 23 сентября в Санкт-Петербурге 🙌
⠀
📋 https://bx.vc/fmw231
⠀
Если пользователи вашего сервиса говорят на разных языках и при этом у вас много обновляющихся текстов — в каталоге товаров, новостях или, как ВКонтакте, в уникальных постах пользователей соцсети — то вам нужен автоматический перевод.
⠀
В докладе Андрей расскажет, как они ВКонтакте подошли к этой задаче и почему в результате разработали своё решение. С собственной системой перевода им больше не нужно никому за него платить, а производительность модели находится полностью под их контролем. Модель учитывает особенности языка пользователей и на основе оценки асессоров выигрывает в качестве. Андрей поделится лайфхаками и инструментами, которые позволили этого добиться и расскажет, на что в первую очередь обратить внимание, создавая свой машинный перевод или другие ML-решения.
⠀
✅ Программа ML-трека - https://bx.vc/nwiel7
До встречи 22 и 23 сентября в Санкт-Петербурге 🙌
Как выкатить в highload production сервис рекомендаций с BERT-like-моделью? Расскажет Марк Паненко, TeamLead в Работа.ру.
⠀
📋 https://bx.vc/8f7kai
⠀
В Работа.ру они занимаются разработкой сервисов на основе машинного обучения для улучшения пользовательского опыта при поиске работы. Недавно они внедрили сервис рекомендаций, один из центральных сервисов их платформы.
⠀
Марк расскажет об опыте обучения и дистилляции мультиязычной, легковесной модели на основе архитектуры Transformer, адаптированной для HR-домена. О вариантах сервисов на базе этой модели и об их опыте развития архитектурных решений в зависимости от нагрузки.
⠀
После доклада у слушателя появится представление:
⠀
▪️о процессе обучения и дистилляции BERT-like-модели,
▪️о нескольких вариантах архитектуры сервисов на её основе,
▪️о производительности, которую можно ожидать от этих вариантов.
⠀
✅ Программа ML-трека – https://bx.vc/ap57ll
⠀
Встречаемся уже 22 и 23 сентября в Питере 🙌
⠀
📋 https://bx.vc/8f7kai
⠀
В Работа.ру они занимаются разработкой сервисов на основе машинного обучения для улучшения пользовательского опыта при поиске работы. Недавно они внедрили сервис рекомендаций, один из центральных сервисов их платформы.
⠀
Марк расскажет об опыте обучения и дистилляции мультиязычной, легковесной модели на основе архитектуры Transformer, адаптированной для HR-домена. О вариантах сервисов на базе этой модели и об их опыте развития архитектурных решений в зависимости от нагрузки.
⠀
После доклада у слушателя появится представление:
⠀
▪️о процессе обучения и дистилляции BERT-like-модели,
▪️о нескольких вариантах архитектуры сервисов на её основе,
▪️о производительности, которую можно ожидать от этих вариантов.
⠀
✅ Программа ML-трека – https://bx.vc/ap57ll
⠀
Встречаемся уже 22 и 23 сентября в Питере 🙌
👍1
Face Pay — сервис полностью бесконтактной оплаты проезда с помощью распознавания лиц в Московском метрополитене. Подробно о сервисе расскажут Михаил Волков и Гусейн Римиханов
⠀
📋 https://bx.vc/wd6y9b
⠀
Технологическим партнером проекта выступила компания VisionLabs, один из лидеров в области компьютерного зрения и машинного обучения.
⠀
Face Pay — первый в России и в мире сервис по оплате проезда с помощью биометрии, запущенный в таком масштабе. Сервис доступен на всех 250 станциях метро, а с 16 марта 2022 года — на станции «Кутузовская» Московского центрального кольца.
⠀
Из доклада узнаем, как происходила разработка уникального сервиса, какие особенности в тестировании подобных решений, в чем заключалась адаптация технологий компьютерного зрения для сложных условий работы, а также о перспективах внедрения Face Pay на других видах транспорта.
⠀
✋ Присоединяйтесь к нам 22 и 23 сентября на Saint HighLoad++
⠀
✅ Подробная программа конференции и билеты на сайте - https://bx.vc/oa9kcy
⠀
📋 https://bx.vc/wd6y9b
⠀
Технологическим партнером проекта выступила компания VisionLabs, один из лидеров в области компьютерного зрения и машинного обучения.
⠀
Face Pay — первый в России и в мире сервис по оплате проезда с помощью биометрии, запущенный в таком масштабе. Сервис доступен на всех 250 станциях метро, а с 16 марта 2022 года — на станции «Кутузовская» Московского центрального кольца.
⠀
Из доклада узнаем, как происходила разработка уникального сервиса, какие особенности в тестировании подобных решений, в чем заключалась адаптация технологий компьютерного зрения для сложных условий работы, а также о перспективах внедрения Face Pay на других видах транспорта.
⠀
✋ Присоединяйтесь к нам 22 и 23 сентября на Saint HighLoad++
⠀
✅ Подробная программа конференции и билеты на сайте - https://bx.vc/oa9kcy
Из доклада Виталия Шутова узнаем про распознавание речи для субтитров в VK Видео.
⠀
📋 https://bx.vc/y1qd1g
⠀
Виталий расскажет, как внутри устроена технология распознавания речи ВКонтакте. Чем распознавание коротких аудиосообщений отличается от распознавания длинных видео. Что такое речевой домен и почему модель может работать сильно хуже, чем должна, без видимых причин.
⠀
Покажет, какие модели пробовали, с какими трудностями столкнулись, как решали и что используют в итоге. Как они борятся с плохими расшифровками и что пришлось применить для матчинга текста с временной шкалой. И в целом — как можно использовать их опыт, чтобы собрать технологию ASR под свои задачи.
⠀
✅ Программа ML-трека – https://bx.vc/sz35q0
Ждем вас в Питере 22 и 23 сентября 🙌
⠀
📋 https://bx.vc/y1qd1g
⠀
Виталий расскажет, как внутри устроена технология распознавания речи ВКонтакте. Чем распознавание коротких аудиосообщений отличается от распознавания длинных видео. Что такое речевой домен и почему модель может работать сильно хуже, чем должна, без видимых причин.
⠀
Покажет, какие модели пробовали, с какими трудностями столкнулись, как решали и что используют в итоге. Как они борятся с плохими расшифровками и что пришлось применить для матчинга текста с временной шкалой. И в целом — как можно использовать их опыт, чтобы собрать технологию ASR под свои задачи.
⠀
✅ Программа ML-трека – https://bx.vc/sz35q0
Ждем вас в Питере 22 и 23 сентября 🙌
👍3🔥1
Какие архитектурные решения помогут сделать любую контентную платформу лучше для пользователей? Разбираемся в новой статье на Хабре: https://bx.vc/5ayu5r
⠀
В ней Александр Тоболь, технический директор ВКонтакте и VK Видео, обстоятельно проводит параллели между архитектурой и пользовательским опытом. Разбирает каждый этап пайплайна — от загрузки на платформу до показа пользователю — и объясняет, на какие метрики ориентироваться.
➡️ Читайте статью, и узнаете, как выбрать между HTTP/1, 2 или 3 для быстрого upload, как балансировать нагрузку на отдачу, как организовать CDN и где прикрутить ML (спойлер: везде).
⠀
В ней Александр Тоболь, технический директор ВКонтакте и VK Видео, обстоятельно проводит параллели между архитектурой и пользовательским опытом. Разбирает каждый этап пайплайна — от загрузки на платформу до показа пользователю — и объясняет, на какие метрики ориентироваться.
➡️ Читайте статью, и узнаете, как выбрать между HTTP/1, 2 или 3 для быстрого upload, как балансировать нагрузку на отдачу, как организовать CDN и где прикрутить ML (спойлер: везде).
Хабр
Архитектура для пользователей
Когда говорят о выборе архитектуры IT-системы, почти всегда упускают один ма-а-аленький нюанс: мы делаем продукты для пользователей, не для себя. А пользователям совершенно неважно, какая у сервиса...
Алексей Кузнецов и Михаил Лепешкин расскажут, как они разместили 200+ дата-саентистов в кластере K8S
⠀
📋 https://bx.vc/m7q6gn
⠀
Они создали удобное рабочее окружение для 200+ дата-сайентистов при помощи jupyterhub и k8s, которое:
⠀
- легко масштабируется
- в меру отказоустойчивое
- имеет централизованное управление
- легко тарифицируется в мультитенант-среде
- имеет единую точку входа
Узнаем:
⠀
- как запускать Spark driver в K8S в режиме m̶a̶s̶t̶e̶r̶ y̶a̶r̶n̶ deploy-mode client
- как организовать персональные окружения для команд аналитиков/разработчиков
- о контроле за использованием ресурсов и возможности их гарантировать
- как это все мониторится
Какие проблемы они решили:
- проблемы сетевой связности при работе Spark Driver в K8S
- доступность Spark UI
- перенос пользовательских данных при переходе между командами
Цель доклада - показать, как при небольших изменениях можно получить результат, максимально удовлетворяющий вашим требованиям.
⠀
✅ Программа ML-трека - https://bx.vc/d9zb6n
До встречи 🙌
⠀
📋 https://bx.vc/m7q6gn
⠀
Они создали удобное рабочее окружение для 200+ дата-сайентистов при помощи jupyterhub и k8s, которое:
⠀
- легко масштабируется
- в меру отказоустойчивое
- имеет централизованное управление
- легко тарифицируется в мультитенант-среде
- имеет единую точку входа
Узнаем:
⠀
- как запускать Spark driver в K8S в режиме m̶a̶s̶t̶e̶r̶ y̶a̶r̶n̶ deploy-mode client
- как организовать персональные окружения для команд аналитиков/разработчиков
- о контроле за использованием ресурсов и возможности их гарантировать
- как это все мониторится
Какие проблемы они решили:
- проблемы сетевой связности при работе Spark Driver в K8S
- доступность Spark UI
- перенос пользовательских данных при переходе между командами
Цель доклада - показать, как при небольших изменениях можно получить результат, максимально удовлетворяющий вашим требованиям.
⠀
✅ Программа ML-трека - https://bx.vc/d9zb6n
До встречи 🙌
🔥3
➡️ Как собрать облачную AutoML-платформу для создания голосовых роботов на базе трансформеров? Узнаем из доклада Артема Бондаря
⠀
📋 https://bx.vc/gf3gnz
⠀
Сегодня коммуникационными роботами на базе NLU уже никого не удивишь: есть и коробочные решения вроде DialogFlow от Google, и OpenSource-фреймворки вроде Rasa, да и каждый уважающий себя ML-инженер хоть раз да и файн-тюнил BERT'а на задачу текстовой классификации. В Voximplant захотелось собрать лучший опыт и дать возможность использовать state-of-the-art-модели и подходы людям, далеким от машинного обучения — и все не покидая браузера в рамках облачной платформы.
Артем расскажет о тонкостях создания облачного AutoML-решения, какими трюками они добивались низкой стоимости, сохранив возможность использовать тяжелые нейросети, кастомизированные под каждого клиента, как они работали с разными языками и как подошли к задаче few-shot-learning, пряча от клиента под ковер всю игру с гиперпараметрами.
⠀
✅ Программа ML-трека - https://bx.vc/40v00k
До встречи 🙌
⠀
📋 https://bx.vc/gf3gnz
⠀
Сегодня коммуникационными роботами на базе NLU уже никого не удивишь: есть и коробочные решения вроде DialogFlow от Google, и OpenSource-фреймворки вроде Rasa, да и каждый уважающий себя ML-инженер хоть раз да и файн-тюнил BERT'а на задачу текстовой классификации. В Voximplant захотелось собрать лучший опыт и дать возможность использовать state-of-the-art-модели и подходы людям, далеким от машинного обучения — и все не покидая браузера в рамках облачной платформы.
Артем расскажет о тонкостях создания облачного AutoML-решения, какими трюками они добивались низкой стоимости, сохранив возможность использовать тяжелые нейросети, кастомизированные под каждого клиента, как они работали с разными языками и как подошли к задаче few-shot-learning, пряча от клиента под ковер всю игру с гиперпараметрами.
⠀
✅ Программа ML-трека - https://bx.vc/40v00k
До встречи 🙌
👍1🔥1
Media is too big
VIEW IN TELEGRAM
🔥 В интервью Олег Бартунов, ведущий разработчик PostgreSQL, отвечает на вопросы:
- Что для Вас значит конференция HighLoad?
- Что сейчас заботит разработчиков? Какие вызовы и перспективы?
- Какую пользу от конференции Вы видите?
Встречаемся 22 и 23 сентября на Saint HighLoad++ ➡️ https://bx.vc/vmkw9j
- Что для Вас значит конференция HighLoad?
- Что сейчас заботит разработчиков? Какие вызовы и перспективы?
- Какую пользу от конференции Вы видите?
Встречаемся 22 и 23 сентября на Saint HighLoad++ ➡️ https://bx.vc/vmkw9j
Филипп Мальковский, программист-разработчик в команде VK Видео расскажет, как они адаптировали существующий пайплайн по распознаванию речи для работы в инфраструктуре VK Видео, внедряли новые компоненты и оптимизировали получившееся решение
⠀
📋 https://bx.vc/9ywdjn
⠀
Узнаем:
- как инкапсуляция и переиспользование компонентов на C++ помогли найти компромисс между максимальным переиспользованием существующего решения и минимизацией трафика между серверами
- как реализация в виде нативного процесса позволила гибко и независимо масштабировать пайплайн в инфраструктуре обработки видео и распространить распознавание речи на все популярные и загружаемые ролики
- как выбирали формат субтитров и способ их отображения на клиентах
- с какими неожиданностями при доставке контента через CDN столкнулись после запуска и как все быстро поправили
А также, какие возможности для развития продукта открывает распознавание речи, встроенное в пайплайн обработки видео.
⠀
✅ Программа ML-трека - https://bx.vc/g1hptr
⠀
До встречи 🙌
⠀
📋 https://bx.vc/9ywdjn
⠀
Узнаем:
- как инкапсуляция и переиспользование компонентов на C++ помогли найти компромисс между максимальным переиспользованием существующего решения и минимизацией трафика между серверами
- как реализация в виде нативного процесса позволила гибко и независимо масштабировать пайплайн в инфраструктуре обработки видео и распространить распознавание речи на все популярные и загружаемые ролики
- как выбирали формат субтитров и способ их отображения на клиентах
- с какими неожиданностями при доставке контента через CDN столкнулись после запуска и как все быстро поправили
А также, какие возможности для развития продукта открывает распознавание речи, встроенное в пайплайн обработки видео.
⠀
✅ Программа ML-трека - https://bx.vc/g1hptr
⠀
До встречи 🙌