Forwarded from Skolkovo LIVE
Media is too big
VIEW IN TELEGRAM
Стартап получил резидентство этим летом по программе Fast Track — она позволяет пройти сколковскую экспертизу по ускоренной процедуре и воспользоваться поддержкой менторов, чтобы развиваться быстрее и эффективнее.
Какие еще разработки презентует компания на форуме? Узнайте из нашего репортажа!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥1👏1😁1
Forwarded from Skolkovo LIVE
🎉 Участник «Сколково» признан одним из лучших на Сибирской венчурной ярмарке!
Компания «Сибирские нейросети» заняла второе место по итогам питч-сессии. Победителей поздравил Вадим Васильев, министр образования науки и инновационной политики Новосибирской области.
Этим летом стартап получил статус резидента «Сколково» по Fast Track — программе, позволяющей быстрее пройти сколковскую экспертизу, проконсультироваться с менторами для более эффективного развития технологий.
❗️На ярмарке наши эксперты отобрали перспективные проекты, которым предложили бесплатно поучаствовать в Fast Track — это «Бридж-ИТ», «Агроспектр» и «БИТ». Сертификаты вручил Александр Фертман, управляющий директор центра индустриальных технологий «Сколково».
👋 Skolkovo LIVE — инновации тут
Компания «Сибирские нейросети» заняла второе место по итогам питч-сессии. Победителей поздравил Вадим Васильев, министр образования науки и инновационной политики Новосибирской области.
Этим летом стартап получил статус резидента «Сколково» по Fast Track — программе, позволяющей быстрее пройти сколковскую экспертизу, проконсультироваться с менторами для более эффективного развития технологий.
❗️На ярмарке наши эксперты отобрали перспективные проекты, которым предложили бесплатно поучаствовать в Fast Track — это «Бридж-ИТ», «Агроспектр» и «БИТ». Сертификаты вручил Александр Фертман, управляющий директор центра индустриальных технологий «Сколково».
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Развернули бота на базе нашей маленькой модели.
@sibnn_bot
Пока он ребенок и многого не умеет, но мы его активно обучаем 😜
@sibnn_bot
Пока он ребенок и многого не умеет, но мы его активно обучаем 😜
👍1
Многие компании уже сделали сабмит своих моделей на бенчмарке MERA. А мы решили проверить, какие результаты покажет открытая модель без какого-либо дообучения (наши сабмиты подписаны НГУ, потому что совместно проводим исследования).
В качестве такой модели взяли Qwen2-72B-Instruct-GPTQ-Int4, которая сразу же попала на 3-е место в лидерборде!
Эта квантизованная версия модели состоит из 72B параметров, сжатых в 4-битное представление с фиксированной запятой. Модель была обучена нашими коллегами из "Алибабы" преимущественно на английском и китайском языках, а также дополнительно на 27 языках, включая русский. Длина контекста для предварительного обучения 128 тыс токенов.
Модель незначительно уступает в качестве моделям GigaChat-Pro (29B параметров) и MTS AI Chat Medium. При этом модель Qwen2 обогнала такие модели как GigaChat Lite, T-lite-0.1, MTS AI Chat 7B, Mixtral 8x7B Instruct и многие другие.
Модель показала самые высокие результаты среди других русскоязычных LLM на задачах MathLogicQA (Accuracy 0.681) и PARus (Accuracy 0.958) - задаче выбора наиболее логичного продолжения для заданной ситуации.
Заметно хуже модель пока справляется с задачами на понимание кода - это видно по задачам BPS и LCS, на которых модель показала значения точности 0.038 и 0.15 соответственно.
Более подробная аналитика нашего сабмита.
При этом стоит отметить, что из моделей семейства Qwen именно эта версия заметно превзошла по качеству все остальные. Следующая лучшая версия модели Qwen - Qwen 7B Instruct - показала общий результат на MERA только 0.443 (Qwen2-72B-Instruct-GPTQ-Int4 - 0.542).
В качестве такой модели взяли Qwen2-72B-Instruct-GPTQ-Int4, которая сразу же попала на 3-е место в лидерборде!
Эта квантизованная версия модели состоит из 72B параметров, сжатых в 4-битное представление с фиксированной запятой. Модель была обучена нашими коллегами из "Алибабы" преимущественно на английском и китайском языках, а также дополнительно на 27 языках, включая русский. Длина контекста для предварительного обучения 128 тыс токенов.
Модель незначительно уступает в качестве моделям GigaChat-Pro (29B параметров) и MTS AI Chat Medium. При этом модель Qwen2 обогнала такие модели как GigaChat Lite, T-lite-0.1, MTS AI Chat 7B, Mixtral 8x7B Instruct и многие другие.
Модель показала самые высокие результаты среди других русскоязычных LLM на задачах MathLogicQA (Accuracy 0.681) и PARus (Accuracy 0.958) - задаче выбора наиболее логичного продолжения для заданной ситуации.
Заметно хуже модель пока справляется с задачами на понимание кода - это видно по задачам BPS и LCS, на которых модель показала значения точности 0.038 и 0.15 соответственно.
Более подробная аналитика нашего сабмита.
При этом стоит отметить, что из моделей семейства Qwen именно эта версия заметно превзошла по качеству все остальные. Следующая лучшая версия модели Qwen - Qwen 7B Instruct - показала общий результат на MERA только 0.443 (Qwen2-72B-Instruct-GPTQ-Int4 - 0.542).
🔥3
Мы развиваемся каждый день!😊 "Сибирские Нейросети" официально стали аккредитованной IT-компанией!
🔥14
Сегодня мы обновили Писца!😄
Теперь в процессе расшифровки стерео-записей можно распознавать звук с двух каналов по отдельности и получать диалог по ролям. Переходите по ссылке и тестируйте обновление -https://lk.sibnn.ai/
Теперь в процессе расшифровки стерео-записей можно распознавать звук с двух каналов по отдельности и получать диалог по ролям. Переходите по ссылке и тестируйте обновление -
🔥8
27 сентября выступаем на AI Conf в Москве 🙂
Наш технический директор Иван Бондаренко будет выступать с докладом "Как «Писец» на «Тотальный диктант» ходил, или пара слов о робастном распознавании речи" https://aiconf.ru/2024/abstracts/12975
Будем рады всех видеть :)
Наш технический директор Иван Бондаренко будет выступать с докладом "Как «Писец» на «Тотальный диктант» ходил, или пара слов о робастном распознавании речи" https://aiconf.ru/2024/abstracts/12975
Будем рады всех видеть :)
aiconf.ru
Иван Бондаренко на AiConf 2024
В 2024 году состоялся юбилейный, вот уже десятый по счёту «Тотальный диктант». Но «Писец» на него пришёл в первый раз. Вы не подумайте, ничего плохого не произошло! Просто «Писец» — это открытая система автоматической расшифровки различных звукозаписей, …
💫Выступление нашего ведущего разработчика-исследователя Романа Дерунца на Сибирском ДатаФесте.
Роман рассказывает о наших исследованиях и разработке мультимодального ИИ, который работает с изображениями, текстами и аудио.
Приятного просмотра 😊
https://www.youtube.com/watch?v=DreUS7Z02ug
Зачем мы это делаем?
Мультимодальный искусственный интеллект способен решать широкий спектр задач, связанных с обработкой различных типов данных одновременно.
Вот примеры таких задач:
1. Мультимодальные генеративные модели: могут генерировать изображения, видео и текстовые описания, основываясь на предоставленном контексте. Есть возможность создать сцену с описанием на естественном языке и получить соответствующее изображение или видео;
2. Понимание и анализ мультимодальных данных: анализировать взаимодействие между текстом, аудио, видео, изображениями и другими форматами данных для улучшения понимания контекста и смысла информации. Это может включать анализ эмоций, выраженных через различные каналы;
3. Автоматическое аннотирование и индексирование мультимедийного контента: автоматизация процесса аннотации и индексации мультимедиа контента позволяет быстро находить нужные данные и упрощает их поиск;
4. Создание интерактивных приложений и интерфейсов: мультимодальность позволяет создавать интерактивные приложения и интерфейсы, которые взаимодействуют с пользователем через несколько сенсорных входных данных. Например, приложение может распознавать речь и жесты одновременно для управления системой;
5. Обработка и интерпретация сигналов: обрабатывать и интерпретировать сигналы от различных датчиков и устройств, чтобы понять окружающую среду и поведение объектов в ней;
6. Диалоговые системы: разработка диалоговых систем, которые могут общаться с пользователями через разные каналы связи, такие как голос, текст, изображения и видео;
7. Визуализация данных: в виде мультимодальной графики, которая включает в себя изображения, текст и другие формы представления информации;
8. Распознавание и классификация объектов: в видео и изображениях, учитывая информации из других источников, таких как текст и звук;
9. Анализ социальных сетей: проанализировать социальные сети, включая изображения, тексты и видео, для изучения общественного мнения и поведения пользователей;
10. Медицинская диагностика и лечение: Использование мультимодальности для анализа медицинских данных, таких как рентгеновские снимки, анализы крови, результаты МРТ и других тестов, вместе с информацией о симптомах пациента для диагностики заболеваний и разработки индивидуальных планов лечения.
Мультимодальный ИИ имеет широкий спектр применений и может значительно улучшить процессы обработки и анализа данных в различных областях.
"Сибирские нейросети" активно занимаются исследованиями в области мультимодального ИИ и внедряем свои инновационные решения в технологические системы ведущих российских компаний.
Роман рассказывает о наших исследованиях и разработке мультимодального ИИ, который работает с изображениями, текстами и аудио.
Приятного просмотра 😊
https://www.youtube.com/watch?v=DreUS7Z02ug
Зачем мы это делаем?
Мультимодальный искусственный интеллект способен решать широкий спектр задач, связанных с обработкой различных типов данных одновременно.
Вот примеры таких задач:
1. Мультимодальные генеративные модели: могут генерировать изображения, видео и текстовые описания, основываясь на предоставленном контексте. Есть возможность создать сцену с описанием на естественном языке и получить соответствующее изображение или видео;
2. Понимание и анализ мультимодальных данных: анализировать взаимодействие между текстом, аудио, видео, изображениями и другими форматами данных для улучшения понимания контекста и смысла информации. Это может включать анализ эмоций, выраженных через различные каналы;
3. Автоматическое аннотирование и индексирование мультимедийного контента: автоматизация процесса аннотации и индексации мультимедиа контента позволяет быстро находить нужные данные и упрощает их поиск;
4. Создание интерактивных приложений и интерфейсов: мультимодальность позволяет создавать интерактивные приложения и интерфейсы, которые взаимодействуют с пользователем через несколько сенсорных входных данных. Например, приложение может распознавать речь и жесты одновременно для управления системой;
5. Обработка и интерпретация сигналов: обрабатывать и интерпретировать сигналы от различных датчиков и устройств, чтобы понять окружающую среду и поведение объектов в ней;
6. Диалоговые системы: разработка диалоговых систем, которые могут общаться с пользователями через разные каналы связи, такие как голос, текст, изображения и видео;
7. Визуализация данных: в виде мультимодальной графики, которая включает в себя изображения, текст и другие формы представления информации;
8. Распознавание и классификация объектов: в видео и изображениях, учитывая информации из других источников, таких как текст и звук;
9. Анализ социальных сетей: проанализировать социальные сети, включая изображения, тексты и видео, для изучения общественного мнения и поведения пользователей;
10. Медицинская диагностика и лечение: Использование мультимодальности для анализа медицинских данных, таких как рентгеновские снимки, анализы крови, результаты МРТ и других тестов, вместе с информацией о симптомах пациента для диагностики заболеваний и разработки индивидуальных планов лечения.
Мультимодальный ИИ имеет широкий спектр применений и может значительно улучшить процессы обработки и анализа данных в различных областях.
"Сибирские нейросети" активно занимаются исследованиями в области мультимодального ИИ и внедряем свои инновационные решения в технологические системы ведущих российских компаний.
YouTube
Роман Дерунец | От платоновских "Диалогов" к "сильному ИИ"
Спикер: Роман Дерунец, Сибирские нейросети, Data Scientist
Тема доклада: От платоновских "Диалогов" к "сильному ИИ", или пара слов о мультимодальном RAG для LLM
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в…
Тема доклада: От платоновских "Диалогов" к "сильному ИИ", или пара слов о мультимодальном RAG для LLM
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в…
👏7🔥2👍1
Приняли участие в AI Conf 2024 https://aiconf.ru/2024/.
Иван Бондаренко рассказал о успехе нашего робота "Писца" на "Тотальном диктанте", а также поделился нашим open source проектом.
Кроме того, он помог сформировать программу конференции и отобрать лучших спикеров и доклады в качестве члена программного комитета.
Иван Бондаренко рассказал о успехе нашего робота "Писца" на "Тотальном диктанте", а также поделился нашим open source проектом.
Кроме того, он помог сформировать программу конференции и отобрать лучших спикеров и доклады в качестве члена программного комитета.
🔥8❤3🥰1
Ждем выход выпуска программы "Персона" 6 октября, где наш технический директор Иван Бондаренко расскажет всю правду об искусственном интеллекте .
Тизер можете посмотреть по ссылке😊
https://vk.com/video-218317427_456239380
Тизер можете посмотреть по ссылке
https://vk.com/video-218317427_456239380
Please open Telegram to view this post
VIEW IN TELEGRAM
VK Видео
Тизер программы "Персона" |ВСЯ ПРАВДА ОБ ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ| Ученый Иван Бондоренко. Премьера 06.10.24г.
Что такое искусственный интеллект и кто его придумал? Для чего он нужен, какая от него польза и в чем вред? Как с помощью искусственного интеллекта сделать нашу повседневную жизнь лучше и как не попасться на уловки мошенников? Эти и многие другие вопросы…
🔥7👍2
Интервью нашего любимого Технического директора Ивана Бондаренко для программы Руслана Махова "Персона"
Приятного просмотра
😊
https://vk.com/video-218317427_456239383
Приятного просмотра
😊
https://vk.com/video-218317427_456239383
VK Видео
Программа "Персона" |ВСЯ ПРАВДА ОБ ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ| Ученый Иван Бондоренко.
Вся правда об искусственном интеллекте: кто его придумал и для чего? В чем чем польза и вред искусственного интеллекта? Сможет ли искусственный интеллект заменить людей в будущем, как выявить фейки и как устроена система распознавания лиц? Об этом и многом…
🔥6👏2❤1👍1
Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?
Приятного просмотра:
https://www.youtube.com/watch?v=blE2Dm9SORE
Приятного просмотра:
https://www.youtube.com/watch?v=blE2Dm9SORE
YouTube
Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?
Спикер: Иван Бондаренко, старший преподаватель, научный сотрудник НГУ
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции NLP: https://ods.ai/tracks/df24-nlp
______
Наши соц.сети:
Telegram: https://t.iss.one/datafest…
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции NLP: https://ods.ai/tracks/df24-nlp
______
Наши соц.сети:
Telegram: https://t.iss.one/datafest…
❤3👍3👏2