Forwarded from Machinelearning
AIMV2 – семейство моделей визуальных энкодеров, предварительно обученных с помощью мультимодальной авторегрессионной цели, которая восстанавливает фрагменты изображений и текстовые токены, что, в итоге, позволяет AIMV2 справляться с задачами распознавания изображений, локализации объектов и мультимодального понимания.
Архитектура AIMV2 основана на ViT и использует каузальный мультимодальный декодер, который сначала регрессирует фрагменты изображения, а затем декодирует текстовые токены авторегрессионно. Визуальный энкодер использует префиксное внимание, что позволяет использовать двунаправленное внимание во время вывода без дополнительной настройки.
Семейство AIMV2 обучалось на комбинации общедоступных (DFN-2B, COYO) и собственных (HQITP) датасетов, содержащих пары "изображение-текст" и синтетические аннотации, сгенерированные предварительно обученным инструментом.
Эксперименты после обучения показали, что AIMV2-3B достигает точности 89,5% на ImageNet с замороженным транком, что лучше, чем у генеративных методов MAE и AIM. AIMV2 превосходит CLIP и SigLIP в большинстве тестов на мультимодальное понимание.
Модель совместима с LiT для zero-shot распознавания и может быть настроена для обработки изображений с различными разрешениями и соотношениями сторон.
В отрытый доступ на HF опубликованы модели:
⚠️ ! Примеры инференса с JAX и MLX доступны в репозитории AIMv2
# Clone the repository
pip install 'git+https://github.com/apple/ml-aim.git#subdirectory=aim-v2'
# Example Using PyTorch
from PIL import Image
from aim.v2.utils import load_pretrained
from aim.v1.torch.data import val_transforms
img = Image.open(...)
model = load_pretrained("aimv2-large-patch14-336", backend="torch")
transform = val_transforms(img_size=336)
inp = transform(img).unsqueeze(0)
features = model(inp)
@ai_machinelearning_big_data
#AI #ML #Vision #Apple #AIMv2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥1
#курс #reactnative
@mobdevelop
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3🔥2
Forwarded from Machinelearning
ShowUI-2B - VLM на базе Qwen2-VL-2B, которая оптимизирована для взаимодействия с GUI. Она обладает глубоким пониманием пользовательских интерфейсов и навигации по ним на веб- и мобильных платформах.
Модель обрабатывает комбинацию визуальных и текстовых данных для создания соответствующих действий GUI. Она интерпретирует скриншоты и текстовые инструкции для определения точек и последовательности взаимодействия.
В качестве входных данных ShowUI-2B может принимать: скриншоты интерфейсов,
текстовые инструкции (или запросы), системные промпты, определяющие области действия и
последовательности действий.
Результат инференса модели: координаты расположения элементов пользовательского интерфейса [x,y], действия (щелчок, ввод, выбор и т.д.), значения для ввода текста и
целевые позиции для взаимодействия.
Для мобильных интерфейсов ShowUI-2B обрабатывает касания, свайпы и ввод текста.
Прикладные сферы применения :
ShowUI-2B продемонстрировала высокую эффективность в задачах zero-shot grounding (75.1% точности) и навигации по GUI на различных платформах (Web, Mobile, Online).
⚠️ Модель поддерживает интеграцию с Computer Use OOTB, проектом Desktop GUI Agent, который позволяет управлять действиями на PC с помощью LLM, запущенной локально или через API.
# Clone the Repository
git clone https://github.com/showlab/ShowUI.git
cd ShowUI
# Install Dependencies
pip install -r requirements.txt
# Start the GradioUI
python app.py
# Go to local URL: https://127.0.0.1:7860
@ai_machinelearning_big_data
#AI #ML #VLM #ShowUI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
⚡️ Организация кода в проекте — в какой пакет положить Kotlin класс
Содержание:
00:00 Введение
01:16 Куда можно класть Kotlin файлы
03:39 Как разделить код по Gradle модулям
06:23 Несколько папок с исходным кодом
07:42 Пакеты с кодом
14:03 Выделение кода в AAR/JAR библиотеки
#видео
@mobdevelop
Содержание:
00:00 Введение
01:16 Куда можно класть Kotlin файлы
03:39 Как разделить код по Gradle модулям
06:23 Несколько папок с исходным кодом
07:42 Пакеты с кодом
14:03 Выделение кода в AAR/JAR библиотеки
#видео
@mobdevelop
YouTube
Организация кода в проекте | В какой пакет положить Kotlin класс
В какой пакет, файл и модуль положить Kotlin классы и функции
🔗 Подкаст "Свободный слот" https://cutt.ly/NeQUvKVM?/erid=2VfnxvSoskU
🔗 Подкаст на YoutTube https://cutt.ly/GeQjhZLG?/erid=2VfnxvSoskU
🔗 Платная подписка на Boosty https://abdev.by/oroS и в Telegram…
🔗 Подкаст "Свободный слот" https://cutt.ly/NeQUvKVM?/erid=2VfnxvSoskU
🔗 Подкаст на YoutTube https://cutt.ly/GeQjhZLG?/erid=2VfnxvSoskU
🔗 Платная подписка на Boosty https://abdev.by/oroS и в Telegram…
❤3👍2🔥2
🌐 Обзор 2024 года от Cloudflare Radar
Этот отчет содержит анализ ключевых трендов и изменений в интернете за прошедший год. Вот основные моменты:
🔹 Рост глобального интернет-трафика составил 17.2%.
🔹 Google сохраняет позицию лидера среди интернет-сервисов, WhatsApp — в сфере мессенджеров
🔹 Трафик Starlink увеличился в 3.3 раза благодаря выходу на новые рынки.
🔹 Googlebot стал основным источником запросов на платформе Cloudflare, тогда как активность других ботов, включая Bytespider от ByteDance, снизилась.
🔹 TLS 1.3: 13% трафика использует пост-квантовую криптографию для защиты данных от будущих квантовых атак.
🔹 Мобильный трафик занимает 41.3% от всего интернет-трафика, причем устройства на базе Android доминируют в большинстве регионов.
🔹 В области генеративного ИИ лидером является OpenAI, а в криптовалюте — Binance.
🔹 Хотя Google Chrome остаётся самым популярным браузером, Safari обгоняет его на устройствах под управлением iOS.
🔹 Инструменты React, PHP и jQuery продолжают оставаться востребованными в разработке сайтов.
🔹 Язык программирования Go обогнал NodeJS в создании автоматизированных API-запросов.
📖 Ознакомьтесь с полным отчётом, где представлены интерактивные графики и детальная информация о каждом пункте.
https://blog.cloudflare.com/radar-2024-year-in-review/
Этот отчет содержит анализ ключевых трендов и изменений в интернете за прошедший год. Вот основные моменты:
🔹 Рост глобального интернет-трафика составил 17.2%.
🔹 Google сохраняет позицию лидера среди интернет-сервисов, WhatsApp — в сфере мессенджеров
🔹 Трафик Starlink увеличился в 3.3 раза благодаря выходу на новые рынки.
🔹 Googlebot стал основным источником запросов на платформе Cloudflare, тогда как активность других ботов, включая Bytespider от ByteDance, снизилась.
🔹 TLS 1.3: 13% трафика использует пост-квантовую криптографию для защиты данных от будущих квантовых атак.
🔹 Мобильный трафик занимает 41.3% от всего интернет-трафика, причем устройства на базе Android доминируют в большинстве регионов.
🔹 В области генеративного ИИ лидером является OpenAI, а в криптовалюте — Binance.
🔹 Хотя Google Chrome остаётся самым популярным браузером, Safari обгоняет его на устройствах под управлением iOS.
🔹 Инструменты React, PHP и jQuery продолжают оставаться востребованными в разработке сайтов.
🔹 Язык программирования Go обогнал NodeJS в создании автоматизированных API-запросов.
📖 Ознакомьтесь с полным отчётом, где представлены интерактивные графики и детальная информация о каждом пункте.
https://blog.cloudflare.com/radar-2024-year-in-review/
The Cloudflare Blog
Cloudflare 2024 Year in Review
The 2024 Cloudflare Radar Year in Review is our fifth annual review of Internet trends and patterns at both a global and country/region level. For 2024, we added several new metrics, as well as the ability to do year-over-year and geographic comparisons for…
👍3❤2
@android_its
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
Forwarded from Android разработка
Команда опытных разработчиков собрала пошаговые туториалы, которые помогут довести ваши навыки до совершенства:
- Подробный разбор каждого проекта.
- Создание различных типов меню: списки, скроллы, слайдеры, свайпы и многое другое.
- Руководство по работе с экшен-барами.
- Верстка мобильных галерей.
- Различные настраиваемые элементы интерфейса.
- Интеграция и работа с картами.
📌 Github
@android_its
#android #opensource #projects
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
⭐️ Этот курс по Rust — ДЕТАЛЬНЫЙ материал для специалистов Android-разработки в Google.
Изучив курс вы получите крепкую базу знаний:
- Основы синтаксиса.
- Тестирование и обработка ошибок.
- Применение Rust в разработке под Android, а также его взаимодействие с C, C++, Java.
- Работа с браузерами на основе Chromium.
- Разработка без операционной системы (bare-metal) и параллелизм (Concurrency).
- Все ключевые языковые конструкции.
- АБСОЛЮТНО БЕСПЛАТНО!
Стань гуру Rust прямо сейчас! Запусти курс на своем сервере уже сегодня.
🖥 Курс
Изучив курс вы получите крепкую базу знаний:
- Основы синтаксиса.
- Тестирование и обработка ошибок.
- Применение Rust в разработке под Android, а также его взаимодействие с C, C++, Java.
- Работа с браузерами на основе Chromium.
- Разработка без операционной системы (bare-metal) и параллелизм (Concurrency).
- Все ключевые языковые конструкции.
- АБСОЛЮТНО БЕСПЛАТНО!
Стань гуру Rust прямо сейчас! Запусти курс на своем сервере уже сегодня.
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰1
👾 Кратко о Nothing
Примеры:
• функция, которая выбрасывает
• функция
• в тестах есть функция с именем
#kotlin
Nothing
является типом, который полезен при объявлении функции, которая ничего не возвращает и не завершается.Примеры:
• функция, которая выбрасывает
exception
или в которой запущен бесконечный цикл;• функция
TODO() — public inline fun TODO(): Nothing = throw NotImplementedError();
• в тестах есть функция с именем
fail
, которая выдает исключение с определенным сообщением:fun fail(message: String): Nothing {
throw IllegalStateException(message)
}
#kotlin
👍3👏1😁1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥3👍2
Компания Apple объявила об открытии исходного кода сборочной системы Swift Build, применявшейся в проприетарных интегрированных средах разработки Xcode и Swift Playground.
Система оптимизирована для сборки проектов на языках Swift, C и Objective-C, но может применяться и с другими языками. Для пакетного менеджера Swift Package Manager подготовлен экспериментальный модуль ("--build-system swiftbuild"), позволяющий использовать Swift Build в качестве альтернативного движка для сборки пакетов. Код Swift Build написан на языке Swift и открыт под лицензией Apache 2.0. Поддерживается сборка проектов для Linux, macOS, iOS, Android, QNX и Windows.
https://opennet.ru/62661/
Please open Telegram to view this post
VIEW IN TELEGRAM
www.opennet.ru
Компания Apple открыла код сборочной системы Swift Build
Компания Apple объявила об открытии исходного кода сборочной системы Swift Build, применявшейся в проприетарных интегрированных средах разработки Xcode и Swift Playground. Система оптимизирована для сборки проектов на языках Swift, C и Objective-C, но может…
👍3❤2
@mobdevelop
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥1