Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Уже 2й день на выставке.
Вчера пообщались с несколькими крупными фондами, получили позитивную обратную связь 😊
Сегодня выступление в Зале 1 с 12:00
Василиса: GPT как ребенок 😊

❤7🔥5👍4👨‍💻1

279 views07:52

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Forwarded from НГУ|NSU

В НГУ пройдёт тринадцатая конференция «Artificial Intelligence and Natural Language» (AINL)

18-19 апреля 2025 года состоится тринадцатая конференция «Artificial Intelligence and Natural Language» (AINL) — крупнейшая восточноевропейская конференция по искусственному интеллекту и обработке текстов.

Мероприятия пройдут в старом корпусе НГУ, в аудитории 311 им. Академика А.И. Мальцева. На конференции выступят приглашенные спикеры: доктор наук, профессор Наталья Валентиновна Лукашевич из МГУ, а также управляющий директор SberDevices Сергей Марков.

Конференция AINL проводится с 2012 года, её материалы индексируются в SCOPUS. Цель конференции — объединить экспертов в области искусственного интеллекта и обработки естественного языка; создать платформу для обмена опытом, расширения контактов и поиска возможного сотрудничества. Конференция сочетает в себе черты промышленной выставки и научной конференции. В 2019 году она прошла в Тарту, Эстония, в 2023 году в Ереване, Армения, а в 2024 году — в Алматы, Казахстан.

Темы конференции:

- Обработка естественного языка
- Искусственный интеллект, глубокое обучение, машинное обучение для обработки естественного языка
- Информационный поиск
- Анализ социальных медиа и социальных сетей
- Генерация и распознавание речи, обработка устного языка
- Интерфейсы человек-компьютер, диалоговые системы
- Контекстный анализ, извлечение информации из текста
- Обнаружение плагиата, профилирование автора и определение авторства
- Машинный перевод, межъязыковые и многоязычные приложения
- Большие данные и анализ данных

— Конференция AINL'2025 будет включать работы в трех основных направлениях: доклады по технологиям и прикладным исследованиям, обзоры готовых приложений и продуктов, связанных с ИИ и NLP, демонстрации работающих прототипов или приложений. В этом году в рамках AINL проходило соревнование по детектированию сгенерированных текстов, узнать его результаты и выводы, которые сделали организаторы соревнования по его итогам можно будет в рамках специальной сессии, — отметила директор конференции Ольга Пивень.

Сотрудники Исследовательского центра в сфере искусственного интеллекта НГУ примут участие в предстоящей конференции. Центр существует с 2023 года. Главная цель работы Центра — разработать и подготовить к внедрению набор технологий «умного города» с использованием искусственного интеллекта, которые повысили бы качество жизни граждан и эффективность работы городского хозяйства.

Мероприятие проходит при поддержке компаний Сибирские Нейросети и MTS AI.

@nsuniversity

❤5🔥5👍1

268 views05:37

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Друзья, приходите 🙂

❤3🔥1

292 views05:38

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

🚀 Уже на этой неделе — 16 апреля в столице! 🌆
На крупнейшей московской конференции по искусственному интеллекту и анализу данных Data Fusion наш технический директор Иван Бондаренко представит захватывающую лекцию:
«GPT без дата-центра: как создавать и зачем использовать малые языковые модели?».
Узнайте секреты эффективного внедрения небольших языковых моделей и убедитесь сами, почему большие GPT-решения далеко не всегда оптимальны!

🎯✨Ссылка на программу мероприятия: https://data-fusion.ru/programma2025.html

🔥4❤1

384 viewsedited 06:34

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Какою мерою мерите~~, такою и вам отмерено будет~~
Прошлое, настоящее и будущее методов измерения сильного искусственного интеллекта

Друзья, если интересно, то приходите в четверг 24 апреля в 10:00 в кабинет 254 ИСИ СО РАН или подключайтесь к трансляции по ссылке https://meet.google.com/bux-bdjz-zdk 😉

Google

Real-time meetings by Google. Using your browser, share your video, desktop, and presentations with teammates and customers.

👍5❤2

312 views03:17

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

https://rutube.ru/video/36e47fbd003b4e039c0b264f0b26efd1/?playlist=475810

RUTUBE

24.04.2025 Бондаренко И.Ю. Семинар ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ и СИСТЕМНОЕ ПРОГРАММИРОВАНИЕ

Семинар ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ и СИСТЕМНОЕ ПРОГРАММИРОВАНИЕ.
Дата: 24.04.2025
Докладчик: Бондаренко И.Ю. (НГУ)
Тема: Какою мерою мерите? Прошлое, настоящее и будущее методов измерения сильного искусственного интеллекта

👍4❤1

459 views14:11

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

"Писец" уже официально, пусть и в онлайне, добрался до Нью-Мехико, теперь про него можно прочитать подробно в NAACL 2025 Proceedings😎
https://aclanthology.org/2025.naacl-industry.74/

Распознавать можно тут: https://lk.sibnn.ai/ 😀

ACL Anthology

Pisets: A Robust Speech Recognition System for Lectures and Interviews

Ivan Bondarenko, Daniil Grebenkin, Oleg Sedukhin, Mikhail Klementev, Derunets Roman, Lyudmila Budneva. Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies…

🔥6❤3👍1

348 viewsedited 10:44

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Forwarded from Roman

совместное фото на конференции

❤4🔥3👍1

236 views15:50

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Международная конференция NAACL 2025. Место проведения - Альбукерке, США. Нашим авторам не дали визы. Отправляли от Сибирских нейросетей 3х коллег на Бали за визами - всем отказ. Поэтому представляем постер онлайн в виртуальной среде.
https://app.gather.town/app/vD0ahbesX3x82ay4/NAACL%202025%20Virtual%20Day?spawnToken=AgpdOEv_S-WbssbSno7v - ссылка на комнату 😊

278 viewsedited 15:53

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Channel photo updated

11:42

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Друзья, сегодня знаменательная дата - исполнилось 80 лет со Дня Победы в Великой Отечественной войне. Этот праздник неразрывно связывает поколения, объединяя всех нас общей памятью и гордостью за подвиг наших предков.

Наш многонациональный народ заплатил огромную цену за свободу и независимость Родины. Советская армия проявила несгибаемую волю и героизм, разгромив жестокого врага и защитив мир от угрозы фашизма.
Каждый год участников и очевидцев тех трагических событий становится всё меньше, поэтому особенно важно сохранить историческую правду о цене победы.

Величие советских людей заключается не только в военной победе, но и в последующем возрождении страны, восстановлении городов и создании условий для жизни будущих поколений (нашей с вами).

За четыре года войны страна понесла колоссальные человеческие и материальные потери.
По оценкам экспертов, общая сумма ущерба Советского Союза составила около половины всех мировых экономических потерь - 128 млрд долл (49% общемировых потерь). Для сравнения на Францию приходится - 21,5 млрд долл. (8,2%), на Польшу - 20 млрд долл. (7,6%), Великобританию - 6,5 млрд долл (2,5%), США - практически без потерь.

К концу 1947 Советский Союз достиг довоенного уровня промышленного производства и смог восстановить экономику всего за 5-6 лет без внешней поддержки, продемонстрировав высокие темпы экономического роста, успехи в науке и промышленности, а также невероятную силу духа и трудолюбие советских людей.

Друзья, всех с Праздником!

❤10🔥3❤‍🔥2

298 views16:29

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Audio

На радио "Серебряный дождь" Обсудили новости в мире искусственного интеллекта (ИИ), его влияние на общество, образование, экономику и медиа.
https://vk.com/silverrainradionsk
В качестве приглашённого гостя наш директор по ИИ Иван Бондаренко.

Основные тезисы:

1. Обеспокоенность религиозного лидера проблемами искусственного интеллекта
Римский Папа Лев IV назвал искусственный интеллект серьезной проблемой, угрожающей защите человеческого достоинства, справедливости и трудовым отношениям.

2. Отрицательное отношение родителей к использованию ИИ школьниками
Около половины российских родителей выступают против использования искусственного интеллекта учениками, опасаясь негативного влияния на образование и критическое мышление детей.

3. Провал Шведского стартапа Klarna
Шведский стартап Klarna вернулся к найму живых сотрудников после неудавшейся попытки заменить колл-центр системой искусственного интеллекта, показав ограниченности машинного интеллекта в обслуживании клиентов.

4. Опыт выпуска первого номера газеты, созданного нейросетью
Издательство «Краснодарские известия» впервые использовало искусственный интеллект для автоматического написания статей и оформления номера, открывая новые горизонты в работе масс-медиа.

5. Этическая оценка высказываний Илона Маска о возможностях ИИ
Эмоциональные заявления Маска о превосходстве ИИ над человеком вызвали обсуждение методов измерения уровня интеллекта и особенностей технологических решений.

6. Необходимость повышения доверия к ИИ среди общественности
Участники программы согласились, что общество должно воспринимать ИИ как помощника, повышающего эффективность многих сфер жизни, а не угрозу существованию рабочих мест.

7. Примеры успешного внедрения ИИ в образовании
Проект Ивана Бондаренко "Менон" показывает, как ИИ облегчает взаимодействие студентов с вузовскими структурами, обеспечивая быстрый доступ к нужной информации и консультации.

8. Особые творческие способности человека в сравнении с возможностями ИИ
Хотя искусственный интеллект способен решать многие стандартные задачи, включая подготовку простых публикаций, глубокие журналистские материалы и творческие проекты остаются областью, где человеческий талант играет ключевую роль.

Ключевые слова:
Искусственный интеллект
Родители
Образование
Нейросети
Школа
Безопасность
Технология
Творчество
Трудовые отношения
Общественность

p.s. Помогали готовить пост системы ИИ Писец и Менон

🔥3❤2

231 viewsedited 17:45

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

❤️‍🔥Выступление Ивана Бондаренко на DataFusion 2025:
https://broadcast.comdi.com/watch/rc34lydi
Приятного просмотра ❤️

✍️Наш ИИ сделал расшифровку и саммари доклада:

Основные темы доклада:

1. Прогресс и проблемы больших языковых моделей:
- Потрясающий прогресс в развитии больших языковых моделей.
- Высокая стоимость обучения и инференса больших моделей.
- Проблемы задержек и комплайенса при использовании ведущих поставщиков языковых моделей.
- Ограничения пропускной способности больших языковых моделей.

2. Развитие малых языковых моделей:
- Малые языковые модели (менее 7 миллиардов параметров) становятся все более популярными.
- Преимущества малых моделей: дешевизна инференса, высокая пропускная способность, меньшее количество галлюцинаций.
- Возможность обучения и инференса малых моделей на собственном оборудовании.

3. История нейросетей и их развитие:
- Краткая история развития нейросетей с середины XX века.
- Эволюция нейросетевых систем и их сравнение с нервными системами животных.
- Переход от классического машинного обучения к глубоким нейросетевым системам.

4. Архитектура генеративных языковых моделей:
- Описание архитектуры генеративных языковых моделей, таких как GPT.
- Сравнение различных архитектур: Sequence-to-Sequence, BERT, T5, GPT.
- Особенности авторегрессивной генерации текста.

5. Знания и понимание текста в языковых моделях:
- Различие между знанием о мире и пониманием текста.
- Зависимость качества знаний о мире от размера модели.
- Независимость способности понимать текст от размера модели.

6. Экономическая эффективность малых моделей:
- Экономическая эффективность малых моделей для решения бизнес-задач.
- Примеры использования малых моделей: исправление ошибок распознавания речи, разрешение местоименной анафры.
- Пайплайн Retrieval-Augmented Generation (RAG) для улучшения экономики эксплуатации.

7. Обучение и дообучение малых моделей:
- Методы обучения малых моделей, такие как Curriculum Learning.
- Примеры успешного обучения малых моделей, таких как семейство Fi от Microsoft.

8. Потенциальные применения малых моделей:
- Фильтрация и подготовка запросов для больших моделей.
- Внедрение малых моделей в отраслях, где требуется управление базами знаний и ответы на вопросы.
- Специализированные задачи, где малые модели могут быть более эффективны, такие как распознавание именованных сущностей и антитилинкинг.

9. Заключение:
- Малые языковые модели могут быть эффективны для решения бизнес-задач.
- Важность экономической эффективности при выборе модели.
- Возможности использования малых моделей в сочетании с большими моделями для улучшения производительности и снижения затрат.

Этот отчет охватывает основные темы и идеи, представленные в докладе, и может служить руководством для дальнейшего изучения и внедрения малых языковых моделей в различных отраслях.

Please open Telegram to view this post

VIEW IN TELEGRAM

Comdi

Кейс-сессия. Малые генеративные модели

Поговорим о возможностях, перспективах и сценариях применения малых генеративных моделей. Какими техническими, организационными и экономическими преимуществами они обладают? Обсудим все этапы — от постановки задачи и обучения до внедрения и поддержки

🔥3

271 viewsedited 14:44

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

❤️‍🔥Выступление Ивана Бондаренко на DataFusion 2025:
https://broadcast.comdi.com/watch/rc34lydi
👆Супер краткое содержание:

Докладчик подчеркнул, что, хотя большие языковые модели (LLM) демонстрируют значительный прогресс, их использование связано с высокими затратами на обучение и инференс, что ограничивает их применение. Вместе с тем, развитие больших моделей также способствовало прогрессу малых языковых моделей, которые содержат до 7 миллиардов параметров. Эти модели более доступны для использования и обучения на стандартном оборудовании, и они могут быть эффективными в специализированных задачах.

Докладчик, Иван Бондаренко, представил исследования и внедрение малых генеративных моделей в различных отраслях, включая образование и промышленность. Он отметил, что малые модели могут быть использованы для решения задач, связанных с пониманием и манипулированием текстом, и они могут быть эффективно интегрированы в пайплайны с использованием внешних баз знаний.

Иван также обсудил подходы к обучению малых моделей, такие как Curriculum Learning, и отметил, что малые модели могут быть дообучены на специализированных задачах, что делает их ценными для решения конкретных бизнес-задач. Он подчеркнул, что малые модели могут улучшить экономическую эффективность и ускорить инференс, а также быть полезными для фильтрации и подготовки запросов для больших моделей.

В заключении, Иван отметил, что малые языковые модели могут быть особенно полезны в отраслях, где требуется управление базами знаний, вопросно-ответные системы, особенно с чувствительными документами, и задачи, связанные с извлечением знаний.

10 ключевых слов из доклада:

1. Малые языковые модели
2. Инференс
3. Пропускная способность
4. Генеративные модели
5. Дообучение
6. Экономическая эффективность
7. Знание о мире
8. Понимание текста
9. Retrieval-Augmented Generation (RAG)
10. Curriculum Learning

10 выводов на основе данного доклада:

1. Сложность и стоимость больших языковых моделей: Большие языковые модели требуют значительных вычислительных мощностей и затрат на обучение и инференс. Их использование может быть проблематично для многих организаций.

2. Проблемы с задержками и комплаенсом: Использование услуг ведущих поставщиков языковых моделей часто сопряжено с проблемами задержек и соблюдения регуляторных требований.

3. Развитие малых языковых моделей: Развитие больших языковых моделей стимулировало прогресс в малых языковых моделях, которые имеют до 7 миллиардов параметров и могут быть эффективно использованы большинством организаций на собственных мощностях.

4. Эффективность малых моделей: Малые языковые модели могут быть не менее эффективны, а иногда даже лучше больших моделей в специализированных областях применения. Они генерируют меньше галлюцинаций и имеют лучшую пропускную способность и дешёвые инференсы.

5. Использование малых моделей в различных отраслях: Компания «Сибирские нейросети» активно внедряет малые генеративные модели в образовательной деятельности, промышленности и других отраслях бизнеса.

6. Эволюция нейросетей: Нейросети имеют длительную историю, начиная с середины XX века, и их сложность постоянно увеличивается. Современные большие языковые модели достигают уровня сложности человеческого мозга.

7. Перенос обучения: Малые языковые модели способны к переносу обучения, что позволяет использовать знания, полученные при решении одной задачи, для решения другой задачи с меньшим набором данных.

8. Экономическая эффективность малых моделей: Малые языковые модели экономически эффективны, так как они не требуют мощного дата-центра и обеспечивают быстрый отклик.

9. Роль базы знаний: Использование внешней базы знаний позволяет снизить требования к размеру модели и улучшить управляемость знаний, что делает малые модели более подходящими для специализированных задач.

10. Внедрение малых моделей в различных отраслях: Малые языковые модели могут быть эффективно внедрены в управление базами знаний, вопросно-ответные системы, особенно для чувствительных документов, и для специализированных задач, где требуется дообучение модели на конкретных данных.

Comdi

Кейс-сессия. Малые генеративные модели

🔥7❤1

3.3K viewsedited 14:45

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Forwarded from НГУ|NSU

🌐14 июля стартует бесплатный очный двухнедельный интенсив по NLP от Яндекс Образования и НГУ

Для участия необходимо зарегистрироваться на сайте, пройти отборочный контест и собеседование.

Что ждёт участников?
- Командные проекты и общение со специалистами из индустрии.
- Работа с моделями Яндекса вроде YandexGPT и актуальными opensource-решениями, такими как Qwen.
- Лекции и семинары от разработчиков NLP-систем и академических исследователей.
- Этическая составляющая как анализ галлюцинаций, защита от jailbreak-атак и т.п.
- Разбор трансформеров от базовой архитектуры до робастного обучения IRM и комбинации с внешними источниками знаний RAG.
- Акцент на многоязычность и устойчивость NLP-моделей.

Подать заявку на участие в студкемпе можно здесь .
Важно отметить, что студенты НГУ не могут быть участниками проекта, но могут быть приглашены в роли вольных слушателей в случае успешного прохождения отбора.
Доступ к первому этапу отбора (соревнованию в контесте) уже открыт. Его можно пройти до 23:59 мск 18 мая. Советуем не откладывать решение задач.

❗️ Если вы планируете поступать в магистратуру ММФ НГУ, то сертификат участия в любом студкемпе добавит вам 10 баллов в конкурсе индивидуальных достижений.

❗️Кроме того, участникам и вольным слушателям студкемпа в НГУ предоставится возможность пройти собеседование на программу «Прикладное машинное обучение и большие данные», которая реализуется при поддержке Школы анализа данных. Студенты 3 и 4 курсов, успешно прошедшие собеседование, смогут поступить на программу без экзаменов.

@nsuniversity

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥2

328 views06:36

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Forwarded from AINL Conference

Roman Derunets - Knowledge as Recollection: Advancing Multimodal Retrieval-Augmented Generation

VK Video

YouTube

🔥8👍3👏1

323 views11:56

Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса

Погода в Нижнем Новгороде прекрасная.
На этой неделе мы среди участников ЦИПР, как и большинство представителей нашего сообщества.
Если кто-то хочет встретиться лично — напишите в ТГ, что хотите обсудить, и я передам ваш контакт нашему коммерческому директору Дмитрию для личной встречи ✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍4🔥2

346 views17:27

About

Blog

Apps

Platform