Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Channel created

08:13

Channel photo updated

09:46

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Победители первого в мире гранта на разработку Open Source

В конце 2021 года мы выиграли грант в размере 10 млн. руб. на разработку открытой библиотеки для автоматической расшифровки и обработки интервью.
Россия - первая в мире страна, которая предоставляет гранты физ.лицам на разработку Open Source. А мы первые победители.
Конкурс проводил Фонд содействия инновациям https://fasie.ru/press/fund/kod-ai/
Условия конкурса просты – требуется разработать открытую библиотеку для решения в сфере ИИ со State of the Art алгоритмами по одному из направлений: компьютерное зрение, обработка естественного языка, распознавание и синтез речи, интеллектуальные системы поддержки принятия решений, перспективные методы искусственного интеллекта.

Немного о проекте
Разрабатывать будем Систему автоматической расшифровки и обработки интервью.
Все результаты будем размещать в открытом репозитории.
Система будет выполнять следующие функции (каждый модуль может работать независимо от других):
1. Автоматически разделять звукозапись интервью по дикторам, отделяя фрагменты речи интервьюера от фрагментов речи интервьюируемого.
2. Преобразовывать фрагменты речи интервьюера и интервьюируемого в текст с сохранением структуры и последовательности изложения.
3. Сегментировать полученный текст диалога по темам, определяя тематические границы, то есть когда заканчивается одна тема и начинается другая.
4. Генерировать краткий пересказ текста интервью в целом и каждого из тематических сегментов в отдельности.
5. Выделять в тексте диалога ключевые именованные сущности - названия компаний, имена людей, основные события и т.п. - и автоматически оценивать отношение собеседников к ним (негативное, нейтральное, позитивное).
6. Быстро, без перепрограммирования или перенастройки, адаптироваться под специфическую лексику, характерную с основной темой интервью (например, чтобы определить необходимость эффективного распознавания речи и обработки текстов в области нефтехимии, интервьюеру достаточно указать системе название темы "Химия", а не вручную пополнять словарь системы понятиями типа "поливинилхлорид" и не достраивать алгоритмы машинного обучения, используемые для анализа и распознавания).

Результаты ожидаем получить следующие:
1. Новые открытые модели распознавания речи и анализа текстов на русском языке;
2. Открытая система автоматической расшифровки и обработки интервью;
3. Научная публикация, поданная в один из рецензируемых научных журналов первого или второго квартилей.

На текущий момент завершаем сдачу работ по нашей платформе. Пожелайте нам удачи :)

115 viewsedited 10:09

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Выступили на CodeFest13 с рассказом о нашем Писце

Если хотите узнать, как записать вашу речь в текст бесплатно, без смс и Whisper, посмотрите запись нашего технического директора Ивана, где он рассказывает про своего Писца: https://www.youtube.com/watch?v=nTrsco-ZYJU

Попробовать Писца можно тут:
https://pisets.dialoger.tech/
А если вы знакомы с докером, то можете поставить себе локально и накидать ⭐ репозиторию https://github.com/bond005/pisets

123 viewsedited 10:23

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

17 октября 2023, 16:00 MCK состоится вебинар, где наш технический директор Иван Бондаренко выступит с темой "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2"

Ссылка на регистрацию присоединяйтесь!

🔥1

133 views15:40

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Кто был на вебинаре "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2", можете задать свои вопросы под этим постом. Слайды по вебинару разместим в канале завтра :)

👏1

123 viewsВика Кондрашук, edited 14:56

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Видеозапись вебинара Ивана Бондаренко "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2" доступна по ссылке

YouTube

Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2

Вебинар Ивана Бондаренко "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2"

🗣Спикер: Иван Бондаренко, Новосибирский Государственный Университет, Новосибирск, Россия

🕰 Вторник 10 октября 2023, 16:00 MCK…

👍3🔥1

136 viewsВика Кондрашук, 08:47

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

А мы напоминаем, что у нас есть замечательный PISETS https://pisets.dialoger.tech/, который переведет в текст (формат субтитров .str) аудио или видео записи. Демка развернута на CPU и в режиме демонстрации обрабатывает только короткие аудио (до 5ти минут). Для обработки больших объемов аудио и видео и если не хотите отправлять свои данные в облако можете поставить на свой компьютер по ссылке https://github.com/bond005/pisets/ и конечно же поставить ⭐ репозиторию.

152 viewsВика Кондрашук, edited 05:34

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Видеозапись вебинара Ивана Бондаренко "Проблема устойчивости нейросетевых алгоритмов распознавания речи и её решение на примере Wav2Vec2" доступна по ссылке

Invariant Wav2Vec2 for NTR Webinar.pdf

4.4 MB

Обещали разместить презентацию по проведенному вебинару. Пожалуйста 😊

🔥2

151 viewsВика Кондрашук, 07:17

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Новость дня. Проек "Диалогер - речевая аналитика для КЦ" на А:Старте занял 1е место и получил резиденство Академпарка. Наш продукт отметили как лучший среди 30ти проектов в финале. А банк "Тинькофф" подарил пожизненное бесплатное обслуживание счета. Теперь можно безлимитно ходить по стеклянному полу между башнями "Гусей" и арендовать рабочие места в бизнес-инкубаторе Технопарка. Не ожидала такой высокой оценки нашей деятельности. Спасибо команде и нашему техническому директору, которые делают лучшие модели для распознавания речи и анализа текстов, лучшие нейросетевые архитектуры и самые быстрые алгоритмы.

🔥4🍾2👍1👏1😁1

145 viewsВика Кондрашук, edited 07:40

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Поездка нашего технического директора в Нижний Тагил в сентябре 2023 с рассказом про большие языковые модели для металлургов и с экскурсией на металлургический комбинат 😊

🔥5👍1👏1

169 viewsВика Кондрашук, edited 11:35

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Новость дня: в Комсомолке про наш проект написали😊
https://www.nsk.kp.ru/daily/27574/4845006/

nsk.kp.ru -

«Сигнализация от дронов и нейросеть-секретарь»: новосибирские айтишники показали разработки будущего

Новосибирцы показали сигнализацию от налетов дронов, испытанную в Донбассе

🔥6

171 viewsВика Кондрашук, 16:57

About

Blog

Apps

Platform