Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса
213 subscribers
98 photos
15 videos
2 files
91 links
https://sibnn.ai
https://lk.sibnn.ai Писец
ИТ-компания «Сибирские Нейросети» рассказывает об исследованиях.
Мы можем:
- Анализировать разговоры real time;
- Обучать и уменьшать большие языковые модели;
- Автоматизировать коммуникации
Download Telegram
⚡️Немного предстоящих анонсов.

🔥24-25 июня в Санкт-Петербурге состоится конференция HighLoad #Highload, где наш технический директор Иван Бондаренко выступит с докладом: "Сильный искусственный интеллект у вас в подвале: как собрать мультимодальную LLM из опенсорса и настроить её под вашу задачу".

💫Тезисы:
Диалоговый агент на базе ChatGPT — это сейчас одно из наиболее эффективных средств автоматизации общения в практически любых бизнес-процессах, где это общение возникает, будь то деловая переписка, модерация контента в интернет-магазине или анализ диалогов в контакт-центре. А если общение — это не только текст, а ещё и, например, картинки (в духе «глянь, подходящий ли стиль у этой картинки для новогодней рекламы» или «эй, посмотри, на этой фотке точно нет запрещёнки»), то здесь поможет ChatGPT Vision.

Но в текущих реалиях далеко не всегда есть доступ к серверам OpenAI, на которых работает ChatGPT Vision. Также не всегда оправдана отправка данных на сторонние сервера по соображениям безопасности или экономики. Таких вот «не всегда» очень много. И что же делать в этом случае? Делать свою мультимодальную LLM!

В своём выступлении Иван расскажет, как можно собрать такую мультимодальную LLM из опенсорсных компонентов на вашем железе, как правильно подготовить датасет для кастомизации этой мультимодальной LLM под вашу бизнес-специфику и, наконец, как оценить качество того, что получилось.

Ссылка на мероприятие: https://highload.ru/spb/2024/abstracts/11747

А для тех, кто хочет пообщаться с нашим мультимодальным ИИ, телеграмм-бот:
@small_nsu_ai_bot
👍6
💥Наши тех.дир Иван и llm-разработчик Роман сегодня на #Highload Saint Highload++
Иван выступает, а Роман поддерживает нашего мультимодального бота Менона, чтобы он справлялся с нагрузкой, которая возникла после доклада Ивана.
6🔥3👏2
❤️Один из зрителей сделал конспект доклада Ивана:
👍2
Forwarded from mtsepkov (Maxim Tsepkov)
#Highload Иван Бондаренко (НГУ) Сильный искусственный интеллект у вас в подвале: как собрать мультимодальную LLM из опенсорса и настроить ее под вашу задачу. Началось все с участия в соревновании Strong Intelligence на AIJ-2023, где надо было сделать ИИ, способный понимать картинки и звуки. Базовую LLM давали организаторы, решение надо было представить в контейнере, дальше организаторы оценивали на своих тестах. Они пошли понятным путем, собрав энкодеры из open source решений. Энкодер - два такта, перекодировка изображения или звуков в вектор параметров, а потом перекодировав вектор параметров в вектор токенов для LLM. В презентации есть подробности - что использовано.

Заняли 14 место из 30, их результат не удовлетворил. И они подумали - а что можно сделать? Анализ показал проблему: энкодеры работают независимо от контекста разговора. И появилась другая идея: сделать общую модель мира во внешней базе данных и искать в нем, создавая контекст разговора, они назвали это припоминанием знаний. Для этого использована китайская ONE-PLANE, которая связывает разные модальности и превращенная в ANNOY-вектор для поиска английская википедия. Дополнительно потребовался генератор коротких подписей к рисункам - его результат фокусирует поиск, распознаватель звуков и преобразователи для речи и других видов звуков. И уже полученный в результате текст подается на вход LLM. В докладе было разобрана механика работы на конкретном примере.

Дальше надо сравнивать результаты с другими. Они сравнивали свои с разными решениями, при этом в качестве арбитра выступал ChatGPT - он оценивал качества ответов разных систем, сравнивал их ответы между собой. Получается относительно объективная метрика. И есть сравнения с разными системами, а также в конфигурациях с разными LLM. B тут оказалось, что основной фокус переносится на этап создания контекста, а мощность LLM уже не столь важна - что существенно для производительности, так как создание контекста - относительно дешевые решения.

Таким образом, компонентная архитектура - гибкий и не требовательный к железу способ управлять знаниями системы. И архитектура распознавания через припоминание имеет большее значение, чем LLM. Университет поддержал грантом, делают систему для ориентации студентов, способную отвечать на философские вопросы, типа чему стоит учиться, и на конкретные - куда нести документы.
👍2
Дмитрий пригласил меня на запись подкаста, где мы увлеченно обсуждали стартапы, основанные на технологиях искусственного интеллекта.
В ходе нашей беседы я с радостью поделилась своим опытом и практическими навыками в этой области, рассказав о своем стартапе "Сибирские нейросети".
Всего за полгода с момента основания наша компания значительно расширилась:
- наш коллектив увеличился с 4-х до 15-ти человек и мы продолжаем увеличивать штат;
- количество предлагаемых продуктов возросло с 1-го до 4-х;
- количество наших партнеров, которые уже заказали внедрение нашего ИИ и НИР увеличилось с нуля до пяти;
Более того, у нас уже образовалась очередь – около 7-ми предстоящих внедрений и НИР для новых партнеров.
Если вам интересно, приглашаю вас насладиться прослушиванием!
🔥4
2. Как заработать 70 млн рублей на переводе речи в текст
mymeet.аi, ViSaver, Сибирские нейросети

⚡️Доступ к конспектам всех интервью и базе знаний по всему сезону – startupsecrets.ru/ai

Сегодня мы вместе раскроем секреты рынка искусственного интеллекта, который применяется для расшифровки аудио и видео-файлов в текст.

Разобраться в теме со всех сторон я позвал трех основателей, которые уже успели на троих получить 12 млн рублей грантами от государства и привлечь 4,5 млн рублей инвестициями от ангелов:

Федор Жилкин – со-основатель, технический и генеральный директор проекта mymeet.ai, ИИ-ассистента для онлайн-встреч, который позволяет транскрибировать звонки, делать их краткую выжимку и быстро назначать задачи присутствующим. Команда недавно привлекла свой первый раунд в 3 млн рублей.

Ася Семенова – основательница проекта ViSaver, который позволяет мгновенно искать информацию внутри видео файлов по текстовому запросу. Команда на старте получила 1,5 млн рублей от частного инвестора и еще 2 млн рублей в виде грантов от ФСИ.

Виктория Кондрашук – основательница стартапа «Сибирские нейросети», компании-разработчика open source системы для анализа интервью. Стартап получил 10 млн рублей от ФСИ на свою разработку.

🙌Спец-сезон создается при поддержке Yandex Cloud.

Где послушать, подписаться и лайкнуть:
🎵 Яндекс • 🎵 Apple • 📺 YouTube • 🎵 Spotify🌐 На сайте подкаста

Приятного прослушивания!

#ИИстартапы #стартапы #СтартапСекретыПодкаст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Резиденты встретились с генеральным директором АО «Спутниковые системы «Гонец» Павлом Черенковым для обсуждения возможностей сотрудничества

🛰️ АО «СС «Гонец» — оператор отечественных систем связи и ретрансляции, созданных по заказу «Роскосмоса». Компания управляет группой спутников по съемке и обработке информации с датчиков и мониторит объекты нефтегазовой и энергетической отраслей в любой точке страны.

На встрече присутствовали:

➡️ «Элрон» — производит микроконтроллеры для одноплатных компьютеров;
➡️ «Дата Ист» — предоставляет услуги по созданию и внедрению геоинформационных систем;
➡️ «Сибирские нейросети» — разрабатывают большие языковые модели;
➡️ «СИА» — создает двигатели для малых спутников;
➡️ SoftLab-NSK — разрабатывает системы на принципах виртуальной реальности.

В ходе встречи были найдены точки соприкосновения и обозначены конкретные шаги для потенциального взаимодействия АО с резидентами Технопарка.

Подробнее читайте на сайте и в приложении Академпарка.
👍41
❤️ Вчера 24.07 встретились с генеральным директором АО «СС «Гонец» Павлом Черенковым для обсуждения возможностей сотрудничества.
АО «Спутниковая система «Гонец» является оператором отечественных систем связи и ретрансляции, созданных по заказу Государственной корпорации «Роскосмос». Компания управляет группой спутников, решающих задачи мониторинга объектов нефтегазовой и энергетической отраслей нашей страны.

Мы продемонстрировали наши сервисы на базе ИИ - речевую аналитику и большие языковые модели. Коллег заинтересовали разработки в области больших языковых моделей. Павел Черенков указал нашей команде на возможность использовать наши разработки для предварительной обработки данных на борту спутников.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2👏1
Добрый день 😊
Мы сегодня выступаем и демонстрируем наши разработки на международном форуме “Технопром”и Сибирской венчурной ярмарке.

На демонстрационном стенде покажем свои разработки для решения задач в области речевых технологий, обработки текстов на естественном языке, а также нейросетевые, шумоустойчивые и адаптируемые к доменной лексике модели распознавания речи, большие мультизадачные и мультимодальные языковые модели.
Кто сегодня здесь, приходите в 10й зал на наш стенд (1й этаж) 😀
👍6🔥21