Векторные базы данных и основные игроки на рынке
💡 Развитие искусственного интеллекта усиливает внимание корпораций к векторным базам данных, которые дополняют множество функций генеративного ИИ. Ожидается быстрый рост сферы, и некоторые компании станут бенефициарами.
Подробнее о технологии
Векторные базы данных - это особый тип баз данных, предназначенный для организации информации на основе сходства или смысла. Для этого они преобразуют исходные данные с помощью LLM в математические представления, известные как многомерные векторы.
Поиск по векторным базам данных имеет широкий ряд преимуществ по сравнению с традиционными текстовыми. Векторный поиск позволяет запрашивать данные по смысловому значению с контекстом вместо точного текстового запроса, что упрощает его создание.
Помимо этого, снижается вероятность ошибки выводимых данных (hallucinations), увеличивается скорость генерации ответа и обеспечивается высокая степень конфиденциальности и актуальности данных. Векторный поиск также показывает более высокую эффективность работы с информацией на разных языках.
В то же время, технология обладает некоторыми недостатками. В частности расходы на создание ИИ для работы с векторными базами данных по оценкам клиентов могут в 20-30 раз превышать ежегодные издержки на аналогичные стандартные модели.
Вдобавок традиционный текстовый поиск отличается точностью, в то время как векторный поиск фокусируется на смысле текста и может быть не идеальным, если пользователю нужна конкретика.
Учитывая все плюсы и минусы ожидается, что компании в будущем будут использовать векторные базы данных только для некоторых задач, оперируя гибридными моделями.
Размер рынка
Рынок векторных баз данных находится на первых стадиях развития. По данным Gartner, на конец 2023 года векторные базы данных в том или ином формате используют менее 2% предприятий. Тем не менее прогнозируется стремительное принятие технологии, и уже к 2026 году доля превысит 30%.
Основные публичные представители сектора
✅ Elastic #ESTC
Компания является крупнейшим публичным разработчиком решений для работы с векторными базами данных. Главным является поисковое ПО ElasticSearch. Менеджмент отметил, что коммерческое внедрение становится все более успешным. Каждый квартал у Elastic появляются сотни клиентов, включая такие компании, как Cisco, Docusign, Stack Overflow, OCBC bank и др.
✅ Informatica #INFA
✅ Confluent #CFLT
Как ожидается, рост интереса к векторным базам данных увеличит использование сервисов ведущих компаний в сфере ПО для интеграции. Informatica и Confluent выиграют от перемещения данных из операционных и устаревших хранилищ в векторные базы данных.
✅ Pure Storage #PSTG
✅ Nutanix #NTNX
Сверхкрупные ЦОД станут первыми бенефициарами роста нагрузок векторного поиска. Тем не менее, другие поставщики инфраструктуры, такие как Digital Ocean, Pure Storage и Nutanix, также получат определенную выгоду, но на более длинном горизонте.
✅ GitLab #GTLB
✅ Atlassian #TEAM
✅ Dynatrace #DT
✅ DataDog #DDOG
Распространение векторного поиска может принести ощутимую пользу DevOps компаниям: GitLab и Atlassian. Среди прочих, косвенными бенефициарами также становятся поставщики ПО для наблюдения Dynatrace и DataDog.
#аналитика #акции #США #технологический_сектор
@aabeta
💡 Развитие искусственного интеллекта усиливает внимание корпораций к векторным базам данных, которые дополняют множество функций генеративного ИИ. Ожидается быстрый рост сферы, и некоторые компании станут бенефициарами.
Подробнее о технологии
Векторные базы данных - это особый тип баз данных, предназначенный для организации информации на основе сходства или смысла. Для этого они преобразуют исходные данные с помощью LLM в математические представления, известные как многомерные векторы.
Поиск по векторным базам данных имеет широкий ряд преимуществ по сравнению с традиционными текстовыми. Векторный поиск позволяет запрашивать данные по смысловому значению с контекстом вместо точного текстового запроса, что упрощает его создание.
Помимо этого, снижается вероятность ошибки выводимых данных (hallucinations), увеличивается скорость генерации ответа и обеспечивается высокая степень конфиденциальности и актуальности данных. Векторный поиск также показывает более высокую эффективность работы с информацией на разных языках.
В то же время, технология обладает некоторыми недостатками. В частности расходы на создание ИИ для работы с векторными базами данных по оценкам клиентов могут в 20-30 раз превышать ежегодные издержки на аналогичные стандартные модели.
Вдобавок традиционный текстовый поиск отличается точностью, в то время как векторный поиск фокусируется на смысле текста и может быть не идеальным, если пользователю нужна конкретика.
Учитывая все плюсы и минусы ожидается, что компании в будущем будут использовать векторные базы данных только для некоторых задач, оперируя гибридными моделями.
Размер рынка
Рынок векторных баз данных находится на первых стадиях развития. По данным Gartner, на конец 2023 года векторные базы данных в том или ином формате используют менее 2% предприятий. Тем не менее прогнозируется стремительное принятие технологии, и уже к 2026 году доля превысит 30%.
Основные публичные представители сектора
✅ Elastic #ESTC
Компания является крупнейшим публичным разработчиком решений для работы с векторными базами данных. Главным является поисковое ПО ElasticSearch. Менеджмент отметил, что коммерческое внедрение становится все более успешным. Каждый квартал у Elastic появляются сотни клиентов, включая такие компании, как Cisco, Docusign, Stack Overflow, OCBC bank и др.
✅ Informatica #INFA
✅ Confluent #CFLT
Как ожидается, рост интереса к векторным базам данных увеличит использование сервисов ведущих компаний в сфере ПО для интеграции. Informatica и Confluent выиграют от перемещения данных из операционных и устаревших хранилищ в векторные базы данных.
✅ Pure Storage #PSTG
✅ Nutanix #NTNX
Сверхкрупные ЦОД станут первыми бенефициарами роста нагрузок векторного поиска. Тем не менее, другие поставщики инфраструктуры, такие как Digital Ocean, Pure Storage и Nutanix, также получат определенную выгоду, но на более длинном горизонте.
✅ GitLab #GTLB
✅ Atlassian #TEAM
✅ Dynatrace #DT
✅ DataDog #DDOG
Распространение векторного поиска может принести ощутимую пользу DevOps компаниям: GitLab и Atlassian. Среди прочих, косвенными бенефициарами также становятся поставщики ПО для наблюдения Dynatrace и DataDog.
#аналитика #акции #США #технологический_сектор
@aabeta