🏆С 31.05.24 наша компания «Сибирские нейросети» участник «Сколково» https://navigator.sk.ru/orn/1126275
🎉8
Сегодня Иван выступает на ДатаКонф в Барнауле.
Программа:
https://innovaltai.timepad.ru/event/2904121/
Трансляция:
https://www.youtube.com/watch?v=0NHJV_9qFHQ
Программа:
https://innovaltai.timepad.ru/event/2904121/
Трансляция:
https://www.youtube.com/watch?v=0NHJV_9qFHQ
innovaltai.timepad.ru
DataConf Barnaul - 2024 / События на TimePad.ru
Основная цель конференции — познакомить ее участников с достижениями и разработками, в которых активно применяется машинное обучение. Мы расскажем, какие сложные задачи решает наука о данных и как выводит качество продуктов на новый уровень. Спикеры расскажут…
🔥2
Barnaul Data Conf в этом году прекрасен! Впрочем, как всегда 😊
https://www.youtube.com/watch?v=8ZC2DLz8j00
https://www.youtube.com/watch?v=8ZC2DLz8j00
YouTube
DataConf 2024
❤1👍1🔥1
⚡️Немного предстоящих анонсов.
🔥24-25 июня в Санкт-Петербурге состоится конференция HighLoad #Highload, где наш технический директор Иван Бондаренко выступит с докладом: "Сильный искусственный интеллект у вас в подвале: как собрать мультимодальную LLM из опенсорса и настроить её под вашу задачу".
💫Тезисы:
Диалоговый агент на базе ChatGPT — это сейчас одно из наиболее эффективных средств автоматизации общения в практически любых бизнес-процессах, где это общение возникает, будь то деловая переписка, модерация контента в интернет-магазине или анализ диалогов в контакт-центре. А если общение — это не только текст, а ещё и, например, картинки (в духе «глянь, подходящий ли стиль у этой картинки для новогодней рекламы» или «эй, посмотри, на этой фотке точно нет запрещёнки»), то здесь поможет ChatGPT Vision.
Но в текущих реалиях далеко не всегда есть доступ к серверам OpenAI, на которых работает ChatGPT Vision. Также не всегда оправдана отправка данных на сторонние сервера по соображениям безопасности или экономики. Таких вот «не всегда» очень много. И что же делать в этом случае? Делать свою мультимодальную LLM!
В своём выступлении Иван расскажет, как можно собрать такую мультимодальную LLM из опенсорсных компонентов на вашем железе, как правильно подготовить датасет для кастомизации этой мультимодальной LLM под вашу бизнес-специфику и, наконец, как оценить качество того, что получилось.
Ссылка на мероприятие: https://highload.ru/spb/2024/abstracts/11747
А для тех, кто хочет пообщаться с нашим мультимодальным ИИ, телеграмм-бот:
@small_nsu_ai_bot
🔥24-25 июня в Санкт-Петербурге состоится конференция HighLoad #Highload, где наш технический директор Иван Бондаренко выступит с докладом: "Сильный искусственный интеллект у вас в подвале: как собрать мультимодальную LLM из опенсорса и настроить её под вашу задачу".
💫Тезисы:
Диалоговый агент на базе ChatGPT — это сейчас одно из наиболее эффективных средств автоматизации общения в практически любых бизнес-процессах, где это общение возникает, будь то деловая переписка, модерация контента в интернет-магазине или анализ диалогов в контакт-центре. А если общение — это не только текст, а ещё и, например, картинки (в духе «глянь, подходящий ли стиль у этой картинки для новогодней рекламы» или «эй, посмотри, на этой фотке точно нет запрещёнки»), то здесь поможет ChatGPT Vision.
Но в текущих реалиях далеко не всегда есть доступ к серверам OpenAI, на которых работает ChatGPT Vision. Также не всегда оправдана отправка данных на сторонние сервера по соображениям безопасности или экономики. Таких вот «не всегда» очень много. И что же делать в этом случае? Делать свою мультимодальную LLM!
В своём выступлении Иван расскажет, как можно собрать такую мультимодальную LLM из опенсорсных компонентов на вашем железе, как правильно подготовить датасет для кастомизации этой мультимодальной LLM под вашу бизнес-специфику и, наконец, как оценить качество того, что получилось.
Ссылка на мероприятие: https://highload.ru/spb/2024/abstracts/11747
А для тех, кто хочет пообщаться с нашим мультимодальным ИИ, телеграмм-бот:
@small_nsu_ai_bot
highload.ru
Иван Бондаренко на Saint HighLoad++ 2024
Диалоговый агент на базе ChatGPT — это сейчас одно из наиболее эффективных средств автоматизации общения в практически любых бизнес-процессах, где это общение возникает, будь то деловая переписка, модерация контента в интернет-магазине или анализ диалогов…
👍6
💥Наши тех.дир Иван и llm-разработчик Роман сегодня на #Highload Saint Highload++
Иван выступает, а Роман поддерживает нашего мультимодального бота Менона, чтобы он справлялся с нагрузкой, которая возникла после доклада Ивана.
Иван выступает, а Роман поддерживает нашего мультимодального бота Менона, чтобы он справлялся с нагрузкой, которая возникла после доклада Ивана.
❤6🔥3👏2
❤️Один из зрителей сделал конспект доклада Ивана:
👍2
Forwarded from mtsepkov (Maxim Tsepkov)
#Highload Иван Бондаренко (НГУ) Сильный искусственный интеллект у вас в подвале: как собрать мультимодальную LLM из опенсорса и настроить ее под вашу задачу. Началось все с участия в соревновании Strong Intelligence на AIJ-2023, где надо было сделать ИИ, способный понимать картинки и звуки. Базовую LLM давали организаторы, решение надо было представить в контейнере, дальше организаторы оценивали на своих тестах. Они пошли понятным путем, собрав энкодеры из open source решений. Энкодер - два такта, перекодировка изображения или звуков в вектор параметров, а потом перекодировав вектор параметров в вектор токенов для LLM. В презентации есть подробности - что использовано.
Заняли 14 место из 30, их результат не удовлетворил. И они подумали - а что можно сделать? Анализ показал проблему: энкодеры работают независимо от контекста разговора. И появилась другая идея: сделать общую модель мира во внешней базе данных и искать в нем, создавая контекст разговора, они назвали это припоминанием знаний. Для этого использована китайская ONE-PLANE, которая связывает разные модальности и превращенная в ANNOY-вектор для поиска английская википедия. Дополнительно потребовался генератор коротких подписей к рисункам - его результат фокусирует поиск, распознаватель звуков и преобразователи для речи и других видов звуков. И уже полученный в результате текст подается на вход LLM. В докладе было разобрана механика работы на конкретном примере.
Дальше надо сравнивать результаты с другими. Они сравнивали свои с разными решениями, при этом в качестве арбитра выступал ChatGPT - он оценивал качества ответов разных систем, сравнивал их ответы между собой. Получается относительно объективная метрика. И есть сравнения с разными системами, а также в конфигурациях с разными LLM. B тут оказалось, что основной фокус переносится на этап создания контекста, а мощность LLM уже не столь важна - что существенно для производительности, так как создание контекста - относительно дешевые решения.
Таким образом, компонентная архитектура - гибкий и не требовательный к железу способ управлять знаниями системы. И архитектура распознавания через припоминание имеет большее значение, чем LLM. Университет поддержал грантом, делают систему для ориентации студентов, способную отвечать на философские вопросы, типа чему стоит учиться, и на конкретные - куда нести документы.
Заняли 14 место из 30, их результат не удовлетворил. И они подумали - а что можно сделать? Анализ показал проблему: энкодеры работают независимо от контекста разговора. И появилась другая идея: сделать общую модель мира во внешней базе данных и искать в нем, создавая контекст разговора, они назвали это припоминанием знаний. Для этого использована китайская ONE-PLANE, которая связывает разные модальности и превращенная в ANNOY-вектор для поиска английская википедия. Дополнительно потребовался генератор коротких подписей к рисункам - его результат фокусирует поиск, распознаватель звуков и преобразователи для речи и других видов звуков. И уже полученный в результате текст подается на вход LLM. В докладе было разобрана механика работы на конкретном примере.
Дальше надо сравнивать результаты с другими. Они сравнивали свои с разными решениями, при этом в качестве арбитра выступал ChatGPT - он оценивал качества ответов разных систем, сравнивал их ответы между собой. Получается относительно объективная метрика. И есть сравнения с разными системами, а также в конфигурациях с разными LLM. B тут оказалось, что основной фокус переносится на этап создания контекста, а мощность LLM уже не столь важна - что существенно для производительности, так как создание контекста - относительно дешевые решения.
Таким образом, компонентная архитектура - гибкий и не требовательный к железу способ управлять знаниями системы. И архитектура распознавания через припоминание имеет большее значение, чем LLM. Университет поддержал грантом, делают систему для ориентации студентов, способную отвечать на философские вопросы, типа чему стоит учиться, и на конкретные - куда нести документы.
👍2
Дмитрий пригласил меня на запись подкаста, где мы увлеченно обсуждали стартапы, основанные на технологиях искусственного интеллекта.
В ходе нашей беседы я с радостью поделилась своим опытом и практическими навыками в этой области, рассказав о своем стартапе "Сибирские нейросети".
Всего за полгода с момента основания наша компания значительно расширилась:
- наш коллектив увеличился с 4-х до 15-ти человек и мы продолжаем увеличивать штат;
- количество предлагаемых продуктов возросло с 1-го до 4-х;
- количество наших партнеров, которые уже заказали внедрение нашего ИИ и НИР увеличилось с нуля до пяти;
Более того, у нас уже образовалась очередь – около 7-ми предстоящих внедрений и НИР для новых партнеров.
Если вам интересно, приглашаю вас насладиться прослушиванием!
В ходе нашей беседы я с радостью поделилась своим опытом и практическими навыками в этой области, рассказав о своем стартапе "Сибирские нейросети".
Всего за полгода с момента основания наша компания значительно расширилась:
- наш коллектив увеличился с 4-х до 15-ти человек и мы продолжаем увеличивать штат;
- количество предлагаемых продуктов возросло с 1-го до 4-х;
- количество наших партнеров, которые уже заказали внедрение нашего ИИ и НИР увеличилось с нуля до пяти;
Более того, у нас уже образовалась очередь – около 7-ми предстоящих внедрений и НИР для новых партнеров.
Если вам интересно, приглашаю вас насладиться прослушиванием!
🔥4
2. Как заработать 70 млн рублей на переводе речи в текст
mymeet.аi, ViSaver, Сибирские нейросети
⚡️Доступ к конспектам всех интервью и базе знаний по всему сезону – startupsecrets.ru/ai
Сегодня мы вместе раскроем секреты рынка искусственного интеллекта, который применяется для расшифровки аудио и видео-файлов в текст.
Разобраться в теме со всех сторон я позвал трех основателей, которые уже успели на троих получить 12 млн рублей грантами от государства и привлечь 4,5 млн рублей инвестициями от ангелов:
Федор Жилкин – со-основатель, технический и генеральный директор проекта mymeet.ai, ИИ-ассистента для онлайн-встреч, который позволяет транскрибировать звонки, делать их краткую выжимку и быстро назначать задачи присутствующим. Команда недавно привлекла свой первый раунд в 3 млн рублей.
Ася Семенова – основательница проекта ViSaver, который позволяет мгновенно искать информацию внутри видео файлов по текстовому запросу. Команда на старте получила 1,5 млн рублей от частного инвестора и еще 2 млн рублей в виде грантов от ФСИ.
Виктория Кондрашук – основательница стартапа «Сибирские нейросети», компании-разработчика open source системы для анализа интервью. Стартап получил 10 млн рублей от ФСИ на свою разработку.
🙌Спец-сезон создается при поддержке Yandex Cloud.
Где послушать, подписаться и лайкнуть:
🎵 Яндекс • 🎵 Apple • 📺 YouTube • 🎵 Spotify • 🌐 На сайте подкаста
Приятного прослушивания!
#ИИстартапы #стартапы #СтартапСекретыПодкаст
mymeet.аi, ViSaver, Сибирские нейросети
⚡️Доступ к конспектам всех интервью и базе знаний по всему сезону – startupsecrets.ru/ai
Сегодня мы вместе раскроем секреты рынка искусственного интеллекта, который применяется для расшифровки аудио и видео-файлов в текст.
Разобраться в теме со всех сторон я позвал трех основателей, которые уже успели на троих получить 12 млн рублей грантами от государства и привлечь 4,5 млн рублей инвестициями от ангелов:
Федор Жилкин – со-основатель, технический и генеральный директор проекта mymeet.ai, ИИ-ассистента для онлайн-встреч, который позволяет транскрибировать звонки, делать их краткую выжимку и быстро назначать задачи присутствующим. Команда недавно привлекла свой первый раунд в 3 млн рублей.
Ася Семенова – основательница проекта ViSaver, который позволяет мгновенно искать информацию внутри видео файлов по текстовому запросу. Команда на старте получила 1,5 млн рублей от частного инвестора и еще 2 млн рублей в виде грантов от ФСИ.
Виктория Кондрашук – основательница стартапа «Сибирские нейросети», компании-разработчика open source системы для анализа интервью. Стартап получил 10 млн рублей от ФСИ на свою разработку.
🙌Спец-сезон создается при поддержке Yandex Cloud.
Где послушать, подписаться и лайкнуть:
Приятного прослушивания!
#ИИстартапы #стартапы #СтартапСекретыПодкаст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Выступление Ивана с последнего ДатаФеста. Приятного просмотра 😊
https://youtu.be/blE2Dm9SORE?si=-4gLeoiDfQnRPIcT
https://youtu.be/blE2Dm9SORE?si=-4gLeoiDfQnRPIcT
YouTube
Иван Бондаренко | Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?
Спикер: Иван Бондаренко, старший преподаватель, научный сотрудник НГУ
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции NLP: https://ods.ai/tracks/df24-nlp
______
Наши соц.сети:
Telegram: https://t.iss.one/datafest…
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции NLP: https://ods.ai/tracks/df24-nlp
______
Наши соц.сети:
Telegram: https://t.iss.one/datafest…
👍4🔥1