Победители первого в мире гранта на разработку Open Source
В конце 2021 года мы выиграли грант в размере 10 млн. руб. на разработку открытой библиотеки для автоматической расшифровки и обработки интервью.
Россия - первая в мире страна, которая предоставляет гранты физ.лицам на разработку Open Source. А мы первые победители.
Конкурс проводил Фонд содействия инновациям https://fasie.ru/press/fund/kod-ai/
Условия конкурса просты – требуется разработать открытую библиотеку для решения в сфере ИИ со State of the Art алгоритмами по одному из направлений: компьютерное зрение, обработка естественного языка, распознавание и синтез речи, интеллектуальные системы поддержки принятия решений, перспективные методы искусственного интеллекта.
Немного о проекте
Разрабатывать будем Систему автоматической расшифровки и обработки интервью.
Все результаты будем размещать в открытом репозитории.
Система будет выполнять следующие функции (каждый модуль может работать независимо от других):
1. Автоматически разделять звукозапись интервью по дикторам, отделяя фрагменты речи интервьюера от фрагментов речи интервьюируемого.
2. Преобразовывать фрагменты речи интервьюера и интервьюируемого в текст с сохранением структуры и последовательности изложения.
3. Сегментировать полученный текст диалога по темам, определяя тематические границы, то есть когда заканчивается одна тема и начинается другая.
4. Генерировать краткий пересказ текста интервью в целом и каждого из тематических сегментов в отдельности.
5. Выделять в тексте диалога ключевые именованные сущности - названия компаний, имена людей, основные события и т.п. - и автоматически оценивать отношение собеседников к ним (негативное, нейтральное, позитивное).
6. Быстро, без перепрограммирования или перенастройки, адаптироваться под специфическую лексику, характерную с основной темой интервью (например, чтобы определить необходимость эффективного распознавания речи и обработки текстов в области нефтехимии, интервьюеру достаточно указать системе название темы "Химия", а не вручную пополнять словарь системы понятиями типа "поливинилхлорид" и не достраивать алгоритмы машинного обучения, используемые для анализа и распознавания).
Результаты ожидаем получить следующие:
1. Новые открытые модели распознавания речи и анализа текстов на русском языке;
2. Открытая система автоматической расшифровки и обработки интервью;
3. Научная публикация, поданная в один из рецензируемых научных журналов первого или второго квартилей.
На текущий момент завершаем сдачу работ по нашей платформе. Пожелайте нам удачи :)
В конце 2021 года мы выиграли грант в размере 10 млн. руб. на разработку открытой библиотеки для автоматической расшифровки и обработки интервью.
Россия - первая в мире страна, которая предоставляет гранты физ.лицам на разработку Open Source. А мы первые победители.
Конкурс проводил Фонд содействия инновациям https://fasie.ru/press/fund/kod-ai/
Условия конкурса просты – требуется разработать открытую библиотеку для решения в сфере ИИ со State of the Art алгоритмами по одному из направлений: компьютерное зрение, обработка естественного языка, распознавание и синтез речи, интеллектуальные системы поддержки принятия решений, перспективные методы искусственного интеллекта.
Немного о проекте
Разрабатывать будем Систему автоматической расшифровки и обработки интервью.
Все результаты будем размещать в открытом репозитории.
Система будет выполнять следующие функции (каждый модуль может работать независимо от других):
1. Автоматически разделять звукозапись интервью по дикторам, отделяя фрагменты речи интервьюера от фрагментов речи интервьюируемого.
2. Преобразовывать фрагменты речи интервьюера и интервьюируемого в текст с сохранением структуры и последовательности изложения.
3. Сегментировать полученный текст диалога по темам, определяя тематические границы, то есть когда заканчивается одна тема и начинается другая.
4. Генерировать краткий пересказ текста интервью в целом и каждого из тематических сегментов в отдельности.
5. Выделять в тексте диалога ключевые именованные сущности - названия компаний, имена людей, основные события и т.п. - и автоматически оценивать отношение собеседников к ним (негативное, нейтральное, позитивное).
6. Быстро, без перепрограммирования или перенастройки, адаптироваться под специфическую лексику, характерную с основной темой интервью (например, чтобы определить необходимость эффективного распознавания речи и обработки текстов в области нефтехимии, интервьюеру достаточно указать системе название темы "Химия", а не вручную пополнять словарь системы понятиями типа "поливинилхлорид" и не достраивать алгоритмы машинного обучения, используемые для анализа и распознавания).
Результаты ожидаем получить следующие:
1. Новые открытые модели распознавания речи и анализа текстов на русском языке;
2. Открытая система автоматической расшифровки и обработки интервью;
3. Научная публикация, поданная в один из рецензируемых научных журналов первого или второго квартилей.
На текущий момент завершаем сдачу работ по нашей платформе. Пожелайте нам удачи :)
Выступили на CodeFest13 с рассказом о нашем Писце
Если хотите узнать, как записать вашу речь в текст бесплатно, без смс и Whisper, посмотрите запись нашего технического директора Ивана, где он рассказывает про своего Писца: https://www.youtube.com/watch?v=nTrsco-ZYJU
Попробовать Писца можно тут:
https://pisets.dialoger.tech/
А если вы знакомы с докером, то можете поставить себе локально и накидать ⭐ репозиторию https://github.com/bond005/pisets
Если хотите узнать, как записать вашу речь в текст бесплатно, без смс и Whisper, посмотрите запись нашего технического директора Ивана, где он рассказывает про своего Писца: https://www.youtube.com/watch?v=nTrsco-ZYJU
Попробовать Писца можно тут:
https://pisets.dialoger.tech/
А если вы знакомы с докером, то можете поставить себе локально и накидать ⭐ репозиторию https://github.com/bond005/pisets
17 октября 2023, 16:00 MCK состоится вебинар, где наш технический директор Иван Бондаренко выступит с темой "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2"
Ссылка на регистрацию присоединяйтесь!
Ссылка на регистрацию присоединяйтесь!
🔥1
Кто был на вебинаре "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2", можете задать свои вопросы под этим постом. Слайды по вебинару разместим в канале завтра :)
👏1
Видеозапись вебинара Ивана Бондаренко "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2" доступна по ссылке
YouTube
Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2
Вебинар Ивана Бондаренко "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2"
🗣Спикер: Иван Бондаренко, Новосибирский Государственный Университет, Новосибирск, Россия
🕰 Вторник 10 октября 2023, 16:00 MCK…
🗣Спикер: Иван Бондаренко, Новосибирский Государственный Университет, Новосибирск, Россия
🕰 Вторник 10 октября 2023, 16:00 MCK…
👍3🔥1
А мы напоминаем, что у нас есть замечательный PISETS https://pisets.dialoger.tech/, который переведет в текст (формат субтитров .str) аудио или видео записи. Демка развернута на CPU и в режиме демонстрации обрабатывает только короткие аудио (до 5ти минут). Для обработки больших объемов аудио и видео и если не хотите отправлять свои данные в облако можете поставить на свой компьютер по ссылке https://github.com/bond005/pisets/ и конечно же поставить ⭐ репозиторию.
Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса
Видеозапись вебинара Ивана Бондаренко "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2" доступна по ссылке
Invariant Wav2Vec2 for NTR Webinar.pdf
4.4 MB
Обещали разместить презентацию по проведенному вебинару. Пожалуйста 😊
🔥2
Новость дня. Проек "Диалогер - речевая аналитика для КЦ" на А:Старте занял 1е место и получил резиденство Академпарка. Наш продукт отметили как лучший среди 30ти проектов в финале. А банк "Тинькофф" подарил пожизненное бесплатное обслуживание счета. Теперь можно безлимитно ходить по стеклянному полу между башнями "Гусей" и арендовать рабочие места в бизнес-инкубаторе Технопарка. Не ожидала такой высокой оценки нашей деятельности. Спасибо команде и нашему техническому директору, которые делают лучшие модели для распознавания речи и анализа текстов, лучшие нейросетевые архитектуры и самые быстрые алгоритмы.
🔥4🍾2👍1👏1😁1