Яндекс запустил векторный поиск в YDB
Теперь YDB умеет искать по миллиардам векторов за десятки миллисекунд. Доступны три режима: точный поиск, приближённый без индекса и с векторным индексом.
Алгоритм работает как дерево кластеров - сначала находит подходящий кластер через K-means, потом перебирает векторы внутри него. Для 1000 векторов поиск занимает 5 мс, для 100 000 - уже 300 мс.
Технология уже работает в Алисе для персонализированного общения - помощник находит релевантные факты из истории диалогов и формирует контекстные ответы. Когда разговор заходит в тупик, Алиса вспоминает интересные пользователю темы.
#YDB #vectors #Яндекс
------
@tsingular
Теперь YDB умеет искать по миллиардам векторов за десятки миллисекунд. Доступны три режима: точный поиск, приближённый без индекса и с векторным индексом.
Алгоритм работает как дерево кластеров - сначала находит подходящий кластер через K-means, потом перебирает векторы внутри него. Для 1000 векторов поиск занимает 5 мс, для 100 000 - уже 300 мс.
Технология уже работает в Алисе для персонализированного общения - помощник находит релевантные факты из истории диалогов и формирует контекстные ответы. Когда разговор заходит в тупик, Алиса вспоминает интересные пользователю темы.
#YDB #vectors #Яндекс
------
@tsingular
❤🔥4👍3⚡2
Amazon запустил S3 Vectors — векторную базу данных в облаке
AWS представил S3 Vectors — специализированные бакеты для хранения и поиска векторных эмбеддингов. Теперь можно создавать семантический поиск прямо в S3 без дополнительных решений.
Основные возможности:
- Векторные индексы до 4096 измерений
- Интеграция с Amazon Bedrock для генерации эмбеддингов
- Поддержка Cosine и Euclidean метрик расстояния
- Прямая интеграция с Knowledge Bases для RAG-пайплайнов
Правда после создания индекса нельзя изменить его параметры — размерность, метрику расстояния и ключи метаданных.
Так что планировать нужно загодя.
Сервис уже доступен в preview-версии и может серьезно упростить архитектуру RAG-систем.
Мануал на 3000 страниц в комментарии.
#AWS #Vectors #RAG
———
@tsingular
AWS представил S3 Vectors — специализированные бакеты для хранения и поиска векторных эмбеддингов. Теперь можно создавать семантический поиск прямо в S3 без дополнительных решений.
Основные возможности:
- Векторные индексы до 4096 измерений
- Интеграция с Amazon Bedrock для генерации эмбеддингов
- Поддержка Cosine и Euclidean метрик расстояния
- Прямая интеграция с Knowledge Bases для RAG-пайплайнов
Правда после создания индекса нельзя изменить его параметры — размерность, метрику расстояния и ключи метаданных.
Так что планировать нужно загодя.
Сервис уже доступен в preview-версии и может серьезно упростить архитектуру RAG-систем.
Мануал на 3000 страниц в комментарии.
#AWS #Vectors #RAG
———
@tsingular
🔥3⚡2❤1