Сибирские Нейросети: Речевая аналитика и малые безопасные языковые модели для бизнеса
212 subscribers
98 photos
15 videos
2 files
91 links
https://sibnn.ai
https://lk.sibnn.ai Писец
ИТ-компания «Сибирские Нейросети» рассказывает об исследованиях.
Мы можем:
- Анализировать разговоры real time;
- Обучать и уменьшать большие языковые модели;
- Автоматизировать коммуникации
Download Telegram
Уже 2й день на выставке.
Вчера пообщались с несколькими крупными фондами, получили позитивную обратную связь 😊
Сегодня выступление в Зале 1 с 12:00
Василиса: GPT как ребенок 😊
7🔥5👍4👨‍💻1
Forwarded from НГУ|NSU
В НГУ пройдёт тринадцатая конференция «Artificial Intelligence and Natural Language» (AINL)

18-19 апреля 2025 года состоится тринадцатая конференция «Artificial Intelligence and Natural Language» (AINL) — крупнейшая восточноевропейская конференция по искусственному интеллекту и обработке текстов. 

Мероприятия пройдут в старом корпусе НГУ, в аудитории 311 им. Академика А.И. Мальцева. На конференции выступят приглашенные спикеры: доктор наук, профессор Наталья Валентиновна Лукашевич из МГУ, а также управляющий директор SberDevices Сергей Марков.

Конференция AINL проводится с 2012 года, её материалы индексируются в SCOPUS. Цель конференции — объединить экспертов в области искусственного интеллекта и обработки естественного языка; создать платформу для обмена опытом, расширения контактов и поиска возможного сотрудничества. Конференция сочетает в себе черты промышленной выставки и научной конференции. В 2019 году она прошла в Тарту, Эстония, в 2023 году в Ереване, Армения, а в 2024 году — в Алматы, Казахстан. 

Темы конференции:

- Обработка естественного языка
- Искусственный интеллект, глубокое обучение, машинное обучение для обработки естественного языка
- Информационный поиск
- Анализ социальных медиа и социальных сетей
- Генерация и распознавание речи, обработка устного языка
- Интерфейсы человек-компьютер, диалоговые системы
- Контекстный анализ, извлечение информации из текста
- Обнаружение плагиата, профилирование автора и определение авторства
- Машинный перевод, межъязыковые и многоязычные приложения
- Большие данные и анализ данных

— Конференция AINL'2025 будет включать работы в трех основных направлениях: доклады по технологиям и прикладным исследованиям, обзоры готовых приложений и продуктов, связанных с ИИ и NLP, демонстрации работающих прототипов или приложений. В этом году в рамках AINL проходило соревнование по детектированию сгенерированных текстов, узнать его результаты и выводы, которые сделали организаторы соревнования по его итогам можно будет в рамках специальной сессии, — отметила директор конференции Ольга Пивень.

Сотрудники Исследовательского центра в сфере искусственного интеллекта НГУ примут участие в предстоящей конференции. Центр существует с 2023 года. Главная цель работы Центра — разработать и подготовить к внедрению набор технологий «умного города» с использованием искусственного интеллекта, которые повысили бы качество жизни граждан и эффективность работы городского хозяйства. 

Мероприятие проходит при поддержке компаний Сибирские Нейросети и MTS AI.

@nsuniversity
5🔥5👍1
🚀 Уже на этой неделе — 16 апреля в столице! 🌆
На крупнейшей московской конференции по искусственному интеллекту и анализу данных Data Fusion наш технический директор Иван Бондаренко представит захватывающую лекцию:
«GPT без дата-центра: как создавать и зачем использовать малые языковые модели?».
Узнайте секреты эффективного внедрения небольших языковых моделей и убедитесь сами, почему большие GPT-решения далеко не всегда оптимальны!

🎯Ссылка на программу мероприятия: https://data-fusion.ru/programma2025.html
🔥41
Какою мерою мерите, такою и вам отмерено будет
Прошлое, настоящее и будущее методов измерения сильного искусственного интеллекта


Друзья, если интересно, то приходите в четверг 24 апреля в 10:00 в кабинет 254 ИСИ СО РАН или подключайтесь к трансляции по ссылке https://meet.google.com/bux-bdjz-zdk 😉
👍52
Международная конференция NAACL 2025. Место проведения - Альбукерке, США. Нашим авторам не дали визы. Отправляли от Сибирских нейросетей 3х коллег на Бали за визами - всем отказ. Поэтому представляем постер онлайн в виртуальной среде.
https://app.gather.town/app/vD0ahbesX3x82ay4/NAACL%202025%20Virtual%20Day?spawnToken=AgpdOEv_S-WbssbSno7v - ссылка на комнату 😊
Друзья, сегодня знаменательная дата - исполнилось 80 лет со Дня Победы в Великой Отечественной войне. Этот праздник неразрывно связывает поколения, объединяя всех нас общей памятью и гордостью за подвиг наших предков.

Наш многонациональный народ заплатил огромную цену за свободу и независимость Родины. Советская армия проявила несгибаемую волю и героизм, разгромив жестокого врага и защитив мир от угрозы фашизма.
Каждый год участников и очевидцев тех трагических событий становится всё меньше, поэтому особенно важно сохранить историческую правду о цене победы.

Величие советских людей заключается не только в военной победе, но и в последующем возрождении страны, восстановлении городов и создании условий для жизни будущих поколений (нашей с вами).

За четыре года войны страна понесла колоссальные человеческие и материальные потери.
По оценкам экспертов, общая сумма ущерба Советского Союза составила около половины всех мировых экономических потерь - 128 млрд долл (49% общемировых потерь). Для сравнения на Францию приходится - 21,5 млрд долл. (8,2%), на Польшу - 20 млрд долл. (7,6%), Великобританию - 6,5 млрд долл (2,5%), США - практически без потерь.

К концу 1947 Советский Союз достиг довоенного уровня промышленного производства и смог восстановить экономику всего за 5-6 лет без внешней поддержки, продемонстрировав высокие темпы экономического роста, успехи в науке и промышленности, а также невероятную силу духа и трудолюбие советских людей.

Друзья, всех с Праздником!
10🔥3❤‍🔥2
Audio
На радио "Серебряный дождь" Обсудили новости в мире искусственного интеллекта (ИИ), его влияние на общество, образование, экономику и медиа.
https://vk.com/silverrainradionsk
В качестве приглашённого гостя наш директор по ИИ Иван Бондаренко.

Основные тезисы:

1. Обеспокоенность религиозного лидера проблемами искусственного интеллекта
Римский Папа Лев IV назвал искусственный интеллект серьезной проблемой, угрожающей защите человеческого достоинства, справедливости и трудовым отношениям.

2. Отрицательное отношение родителей к использованию ИИ школьниками
Около половины российских родителей выступают против использования искусственного интеллекта учениками, опасаясь негативного влияния на образование и критическое мышление детей.

3. Провал Шведского стартапа Klarna
Шведский стартап Klarna вернулся к найму живых сотрудников после неудавшейся попытки заменить колл-центр системой искусственного интеллекта, показав ограниченности машинного интеллекта в обслуживании клиентов.

4. Опыт выпуска первого номера газеты, созданного нейросетью
Издательство «Краснодарские известия» впервые использовало искусственный интеллект для автоматического написания статей и оформления номера, открывая новые горизонты в работе масс-медиа.

5. Этическая оценка высказываний Илона Маска о возможностях ИИ
Эмоциональные заявления Маска о превосходстве ИИ над человеком вызвали обсуждение методов измерения уровня интеллекта и особенностей технологических решений.

6. Необходимость повышения доверия к ИИ среди общественности
Участники программы согласились, что общество должно воспринимать ИИ как помощника, повышающего эффективность многих сфер жизни, а не угрозу существованию рабочих мест.

7. Примеры успешного внедрения ИИ в образовании
Проект Ивана Бондаренко "Менон" показывает, как ИИ облегчает взаимодействие студентов с вузовскими структурами, обеспечивая быстрый доступ к нужной информации и консультации.

8. Особые творческие способности человека в сравнении с возможностями ИИ
Хотя искусственный интеллект способен решать многие стандартные задачи, включая подготовку простых публикаций, глубокие журналистские материалы и творческие проекты остаются областью, где человеческий талант играет ключевую роль.

Ключевые слова:
Искусственный интеллект
Родители
Образование
Нейросети
Школа
Безопасность
Технология
Творчество
Трудовые отношения
Общественность

p.s. Помогали готовить пост системы ИИ Писец и Менон
🔥32
❤️‍🔥Выступление Ивана Бондаренко на DataFusion 2025:
https://broadcast.comdi.com/watch/rc34lydi
Приятного просмотра ❤️

✍️Наш ИИ сделал расшифровку и саммари доклада:

Основные темы доклада:

1. Прогресс и проблемы больших языковых моделей:
- Потрясающий прогресс в развитии больших языковых моделей.
- Высокая стоимость обучения и инференса больших моделей.
- Проблемы задержек и комплайенса при использовании ведущих поставщиков языковых моделей.
- Ограничения пропускной способности больших языковых моделей.

2. Развитие малых языковых моделей:
- Малые языковые модели (менее 7 миллиардов параметров) становятся все более популярными.
- Преимущества малых моделей: дешевизна инференса, высокая пропускная способность, меньшее количество галлюцинаций.
- Возможность обучения и инференса малых моделей на собственном оборудовании.

3. История нейросетей и их развитие:
- Краткая история развития нейросетей с середины XX века.
- Эволюция нейросетевых систем и их сравнение с нервными системами животных.
- Переход от классического машинного обучения к глубоким нейросетевым системам.

4. Архитектура генеративных языковых моделей:
- Описание архитектуры генеративных языковых моделей, таких как GPT.
- Сравнение различных архитектур: Sequence-to-Sequence, BERT, T5, GPT.
- Особенности авторегрессивной генерации текста.

5. Знания и понимание текста в языковых моделях:
- Различие между знанием о мире и пониманием текста.
- Зависимость качества знаний о мире от размера модели.
- Независимость способности понимать текст от размера модели.

6. Экономическая эффективность малых моделей:
- Экономическая эффективность малых моделей для решения бизнес-задач.
- Примеры использования малых моделей: исправление ошибок распознавания речи, разрешение местоименной анафры.
- Пайплайн Retrieval-Augmented Generation (RAG) для улучшения экономики эксплуатации.

7. Обучение и дообучение малых моделей:
- Методы обучения малых моделей, такие как Curriculum Learning.
- Примеры успешного обучения малых моделей, таких как семейство Fi от Microsoft.

8. Потенциальные применения малых моделей:
- Фильтрация и подготовка запросов для больших моделей.
- Внедрение малых моделей в отраслях, где требуется управление базами знаний и ответы на вопросы.
- Специализированные задачи, где малые модели могут быть более эффективны, такие как распознавание именованных сущностей и антитилинкинг.

9. Заключение:
- Малые языковые модели могут быть эффективны для решения бизнес-задач.
- Важность экономической эффективности при выборе модели.
- Возможности использования малых моделей в сочетании с большими моделями для улучшения производительности и снижения затрат.

Этот отчет охватывает основные темы и идеи, представленные в докладе, и может служить руководством для дальнейшего изучения и внедрения малых языковых моделей в различных отраслях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
❤️‍🔥Выступление Ивана Бондаренко на DataFusion 2025:
https://broadcast.comdi.com/watch/rc34lydi
👆Супер краткое содержание:

Докладчик подчеркнул, что, хотя большие языковые модели (LLM) демонстрируют значительный прогресс, их использование связано с высокими затратами на обучение и инференс, что ограничивает их применение. Вместе с тем, развитие больших моделей также способствовало прогрессу малых языковых моделей, которые содержат до 7 миллиардов параметров. Эти модели более доступны для использования и обучения на стандартном оборудовании, и они могут быть эффективными в специализированных задачах.

Докладчик, Иван Бондаренко, представил исследования и внедрение малых генеративных моделей в различных отраслях, включая образование и промышленность. Он отметил, что малые модели могут быть использованы для решения задач, связанных с пониманием и манипулированием текстом, и они могут быть эффективно интегрированы в пайплайны с использованием внешних баз знаний.

Иван также обсудил подходы к обучению малых моделей, такие как Curriculum Learning, и отметил, что малые модели могут быть дообучены на специализированных задачах, что делает их ценными для решения конкретных бизнес-задач. Он подчеркнул, что малые модели могут улучшить экономическую эффективность и ускорить инференс, а также быть полезными для фильтрации и подготовки запросов для больших моделей.

В заключении, Иван отметил, что малые языковые модели могут быть особенно полезны в отраслях, где требуется управление базами знаний, вопросно-ответные системы, особенно с чувствительными документами, и задачи, связанные с извлечением знаний.

10 ключевых слов из доклада
:

1. Малые языковые модели
2. Инференс
3. Пропускная способность
4. Генеративные модели
5. Дообучение
6. Экономическая эффективность
7. Знание о мире
8. Понимание текста
9. Retrieval-Augmented Generation (RAG)
10. Curriculum Learning

10 выводов на основе данного доклада:

1. Сложность и стоимость больших языковых моделей: Большие языковые модели требуют значительных вычислительных мощностей и затрат на обучение и инференс. Их использование может быть проблематично для многих организаций.

2. Проблемы с задержками и комплаенсом: Использование услуг ведущих поставщиков языковых моделей часто сопряжено с проблемами задержек и соблюдения регуляторных требований.

3. Развитие малых языковых моделей: Развитие больших языковых моделей стимулировало прогресс в малых языковых моделях, которые имеют до 7 миллиардов параметров и могут быть эффективно использованы большинством организаций на собственных мощностях.

4. Эффективность малых моделей: Малые языковые модели могут быть не менее эффективны, а иногда даже лучше больших моделей в специализированных областях применения. Они генерируют меньше галлюцинаций и имеют лучшую пропускную способность и дешёвые инференсы.

5. Использование малых моделей в различных отраслях: Компания «Сибирские нейросети» активно внедряет малые генеративные модели в образовательной деятельности, промышленности и других отраслях бизнеса.

6. Эволюция нейросетей: Нейросети имеют длительную историю, начиная с середины XX века, и их сложность постоянно увеличивается. Современные большие языковые модели достигают уровня сложности человеческого мозга.

7. Перенос обучения: Малые языковые модели способны к переносу обучения, что позволяет использовать знания, полученные при решении одной задачи, для решения другой задачи с меньшим набором данных.

8. Экономическая эффективность малых моделей: Малые языковые модели экономически эффективны, так как они не требуют мощного дата-центра и обеспечивают быстрый отклик.

9. Роль базы знаний: Использование внешней базы знаний позволяет снизить требования к размеру модели и улучшить управляемость знаний, что делает малые модели более подходящими для специализированных задач.

10. Внедрение малых моделей в различных отраслях: Малые языковые модели могут быть эффективно внедрены в управление базами знаний, вопросно-ответные системы, особенно для чувствительных документов, и для специализированных задач, где требуется дообучение модели на конкретных данных.
🔥71
Forwarded from НГУ|NSU
🌐14 июля стартует бесплатный очный двухнедельный интенсив по NLP от Яндекс Образования и НГУ

Для участия необходимо зарегистрироваться на сайте, пройти отборочный контест и собеседование.

Что ждёт участников?
- Командные проекты и общение со специалистами из индустрии.
- Работа с моделями Яндекса вроде YandexGPT и актуальными opensource-решениями, такими как Qwen.
- Лекции и семинары от разработчиков NLP-систем и академических исследователей.
- Этическая составляющая как анализ галлюцинаций, защита от jailbreak-атак и т.п.
- Разбор трансформеров от базовой архитектуры до робастного обучения IRM и комбинации с внешними источниками знаний RAG.
- Акцент на многоязычность и устойчивость NLP-моделей.

Подать заявку на участие в студкемпе можно здесь.
Важно отметить, что студенты НГУ не могут быть участниками проекта, но могут быть приглашены в роли вольных слушателей в случае успешного прохождения отбора.
Доступ к первому этапу отбора (соревнованию в контесте) уже открыт. Его можно пройти до 23:59 мск 18 мая. Советуем не откладывать решение задач.

❗️ Если вы планируете поступать в магистратуру ММФ НГУ, то сертификат участия в любом студкемпе добавит вам 10 баллов в конкурсе индивидуальных достижений.

❗️Кроме того, участникам и вольным слушателям студкемпа в НГУ предоставится возможность пройти собеседование на программу «Прикладное машинное обучение и большие данные», которая реализуется при поддержке Школы анализа данных. Студенты 3 и 4 курсов, успешно прошедшие собеседование, смогут поступить на программу без экзаменов.

@nsuniversity
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2
Forwarded from AINL Conference
Roman Derunets - Knowledge as Recollection: Advancing Multimodal Retrieval-Augmented Generation

VK Video

YouTube
🔥8👍3👏1
Погода в Нижнем Новгороде прекрасная.
На этой неделе мы среди участников ЦИПР, как и большинство представителей нашего сообщества.
Если кто-то хочет встретиться лично — напишите в ТГ, что хотите обсудить, и я передам ваш контакт нашему коммерческому директору Дмитрию для личной встречи ✍️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥2