This media is not supported in your browser
VIEW IN TELEGRAM
PaliGemma 2 — это модель для анализа визуальных данных (Visual Language Model или VLM). Она распознаёт и описывает «действия, эмоции и общий сюжет сцены» на загруженных фотографиях, сообщила Google.
По словам компании, модель можно использовать для чтения текстов и диаграмм, создания субтитров, поиска объектов, например, на спутниковых снимках, а также для помощи слепым людям при использовании цифровых сервисов.
Скачать модель и код можно на Hugging Face и Kaggle и «интегрировать в свои проекты».
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3⚡1👏1