Big Data AI – Telegram

Big Data AI

17.1K subscribers

951 photos

121 videos

19 files

956 links

@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe

Download Telegram

About

Blog

Apps

Platform

17.1K subscribers

🔥

SWE-agent — проект, предназначенный для автоматизации процесса разработки программного обеспечения с использованием технологий машинного обучения и искусственного интеллекта!

🌟 SWE-agent (Software Engineering Agent) — это агент, который помогает разработчикам в автоматизации рутинных задач, таких как написание кода, тестирование, документация и другие аспекты разработки.

🔐 Лицензия: MIT

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥4❤1

2.21K views12:00

This media is not supported in your browser

VIEW IN TELEGRAM

🔥

gitingest — это инструмент для извлечения и анализа данных из репозиториев Git!

🌟 Он позволяет автоматизировать сбор информации, такой как изменения в коммитах, ветках, авторах, и преобразовывать эти данные в форматы, удобные для работы с LLM.

🔐 Лицензия: MIT

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3🔥3❤2

2.36K views13:01

Media is too big

VIEW IN TELEGRAM

⚡️ Математика машинного обучения.Базовые понятия тензорного исчисления. Урок 3

📌 Видео
📌 Урок 1 / Урок2
📌 Colab

@bigdatai

👍3❤2

2.53K viewsedited 16:40

В Х набирает популярность пост задача, на которую у одного участника (о1 pro) якобы ушло 4 часа 😂.

Автор сам уточнил, что это неправда, несмотря на то, что многим поверился скриншот. На самом деле правильное решение другой участник (o1 pro) нашел всего за одну минуту.

👍8💩3🤡2❤1🔥1

2.36K viewsedited 10:50

🔥

Onyx — платформa для интеграции AI-чатов с документами, приложениями и членами вашей команды!

🌟 Это позволяет создавать чат-ассистентов, которые могут взаимодействовать с данными, хранящимися в различных инструментах (Slack, Google Drive, Jira и т. д.). Он поддерживает локальную установку или облачное развертывание и позволяет безопасно управлять доступом и конфиденциальностью данных.

🔐 Лицензия: MIT

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2😍2👌1

2.33K views12:50

Forwarded from Machinelearning

🌟 MiniVLA: компактная Vision-Language-Action модель для робототехники.

AI-лаборатория Стенфордского университета представила модель MiniVLA — усовершенствованную версию Vision-Language-Action (VLA), компактную альтернативу OpenVLA.

Отличительная особенность MiniVLA - сокращенное в 7 раз количество параметров (1 млрд. против 7 миллиардов у OpenVLA), что дает значительное ускорение процессов обучения и инференса.

В архитектуре MiniVLA используется тот же ViT для обработки изображений, что и в OpenVLA, однако в качестве языковой модели используется Qwen 2.5 0.5B вместо Llama 2 7B.

Обучение языковой модели основано на датасете Llava-1.5-Instruct VQA, аналогично базовой модели Prismatic VLM в OpenVLA. Несмотря на уменьшение размера, MiniVLA демонстрирует сопоставимую с OpenVLA производительность в рамках бенчмарка Libero-90 (61.4% против 62%).

Одно главных усовершенствований MiniVLA - применение векторного квантования (VQ) для кластеризации действий (action chunking). Вместо дискретного представления действий, модель прогнозирует их последовательности, которые кодируются в виде M кодовых индексов с помощью VQ-BeT5. Это существенно повышает производительность на Libero-90.

Так, MiniVLA с VQ h8 (action chunks) достигает 77% успеха, в то время как базовая модель MiniVLA и OpenVLA демонстрируют 61.4% и 62% соответственно.

MiniVLA поддерживает подачу на вход нескольких изображений, что позволяет использовать "историю изображений" и серию снимков с носимых целевым роботом камер. Мульти-кадровая возможность способствует повышению производительности на Libero-90: модель MiniVLA с VQ h8 и историей изображений (history=2) достигает 82% успешности, а с кадрами с новимой камеры — 82.1%.

По сделанным замерам производительности, MiniVLA показывает в 2.5 раза более высокую скорость инференса, чем OpenVLA (12.5Hz против 5Hz) на одном GPU NVIDIA L40s.

▶️В репозитории на HF опубликованы несколько вариантов MiniVLA:

🟢

Prism with Qwen 2.5 0.5B backbone

🟢

MiniVLA 1B Wrist VQ

🟢

🟢

MiniVLA Image History (T=2) VQ 1B

🟢

🟢

MiniVLA 1B VQ Trained on Bridge V2

📌Лицензирование: MIT License.

🟡

🟡

Набор моделей

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #VLA #MiniVLA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤3🖕1

1.96K views15:21

🔥

Julep — платформа для создания AI-агентов, которые могут выполнять сложные многошаговые задачи!

🌟 Она поддерживает долгосрочную память, принятие решений и интеграцию с внешними API. Julep позволяет создавать рабочие процессы, состоящие из нескольких шагов, с возможностью принятия решений на основе выводов моделей, параллельной обработки и использования инструментов в рамках задач. Платформа идеально подходит для разработки более сложных AI-приложений, которые требуют выполнения многозадачности и взаимодействия с внешними системами. Ключевые особенности включают сохранение состояния агентов, управление задачами и восстановление процессов.

🔐 Лицензия: Apache-2.0

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

2.16K views09:00

Forwarded from Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 DepthLab: инпейнт карт глубины на основе диффузионных моделей.

DepthLab - диффузионный механизм инпейнта карт глубины с двумя параллельными ветвями для задач заполнения 3D-сцен, генерации сцен на основе текстовых промптов, реконструкции с использованием DUST3R и заполнение глубины LiDAR.

Первая ветвь, Reference U-Net извлекает признаки из RGB-изображений, которые служат условием для второй ветви.

Вторая ветвь, Estimation U-Net, обрабатывает имеющиеся данные о глубине и маску, определяющую области, требующие восстановления. Признаки RGB, полученные из Reference U-Net, последовательно интегрируются в Estimation U-Net, что позволяет управлять процессом восстановления.

Взаимодействие между ветвями Reference U-Net и Estimation U-Net реализуется механизмом cross-attention, который использует CLIP encoder.

Архитектура DepthLab опирается на наработки Marigold и Stable Diffusion V2. Кодирование RGB-изображений и карт глубины в латентное пространство осуществляется VAE. Маска также кодируется с помощью VAE, что позволяет сохранить детальную информацию о форме и границах.

Обучение DepthLab проводилось на двух синтетических датасетах: Hypersim (54 тысячи обучающих образцов) и Virtual KITTI (20 тысяч обучающих образцов). Для расширения обучающей выборки использовались случайные искажения изображений и несколько стратегий маскирования: штрихи, окружности, квадраты и их комбинации.

Оценка качества восстановления проводилась на 5 наборах: NYUv2, KITTI, ETH3D, ScanNet, DIODE. В качестве метрик использовались абсолютная относительная ошибка (AbsRel) и точность в пределах δ1 = 1.25.

Результаты тестов демонстрируют, что DepthLab превосходит как дискриминативные (DiverseDepth, MiDaS, LeReS, Omnidata, HDN, DPT, DepthAnything, DepthAnythingV2), так и генеративные (Marigold, DepthFM, GeoWizard) методы в постоении карт глубины.

Для локального инференса потребуются модели:

🟢

Marigold checkpoint;

🟢

Энкодер CLIP-ViT-H-14-laion-2B;

🟢

Набор чекпоинтов DepthLab.

▶️Локальная установка и инференс:

# Clone repo
git clone https://github.com/Johanan528/DepthLab.git
cd DepthLab

# Create conda env
conda env create -f environment.yaml
conda activate DepthLab

# Run inference
cd scripts
bash infer.sh

🟡

Страница проекта

🟡

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #DepthLab

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥2❤1

2.61K views16:15

🔥 Топ-11 трендов ИИ следующего года!

💡 Среди озвученных тенденций в развитии искусственного интеллекта — мультимодальность, большее распространение открытого кода, создание высоко персонализированных сервисов, автономные системы и создание SLM под конкретные задачи.

🌟 В ближайшем будущем в тренде будет мультимодальный искусственный интеллект, который обрабатывает информацию разного типа. А Open Source модели будут способствовать коллаборации в сообществе, улучшая качество и доступность ИИ-технологий.

🔗 Ссылка: *клик*

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤3🔥2😁1

2.31K views11:27

📖

Эта статья рассматривает расширенную концепцию обучения в контексте, где модели языка могут адаптироваться и учиться на основе примеров, представленных в контексте!

🌟 Она предлагает более широкую перспективу, в которой рассматриваются не только задачи обучения с несколькими примерами, но и более сложные процессы мета-обучения, такие как адаптация к задачам, извлечение зависимостей и обобщение знаний.

🔗 Ссылка: *клик*

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

2.6K views13:00

Media is too big

VIEW IN TELEGRAM

📹 Новый ИИ от NVIDIA: революция в 3D-моделировании!

📌 Источник

@bigdatai

❤3🔥1

2.39K viewsedited 10:04

🔥

TEN-Agent — фреймворк для создания разговорных ИИ-агентов!

🌟 Он интегрирует такие инструменты, как Gemini 2.0 Multimodal Live API, OpenAI Realtime API, RTC и другие. TEN-Agent поддерживает функции реального времени, включая возможность "видеть", "слышать" и "говорить", а также предоставляет такие инструменты, как проверка погоды, веб-поиск и Retrieval-Augmented Generation (RAG). Этот проект позволяет создавать ИИ-агентов, способных выполнять различные действия в реальном времени и предоставляет удобное локальное окружение для работы через Docker.

🔐 Лицензия: Apache-2.0

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤3🔥3

3.01K views16:42

⚡️ Введение в тензорные сети

📌 Видео
📌 Урок 1 / Урок2 / Урок3 / Урок4 / Урок5
📌 Colab

Тензоры в компьютерном зрении. Курс Математика машинного обучения

🔥 https://t.iss.one/+mweO6x5UIXJjMTJi - мой авторский телеграм канал, где собрана вся база по ИИ и машинному обучению, разбор кода и лучшие уроки для вас, подписывайтесь!
🔥 https://t.iss.one/addlist/2Ls-snqEeytkMDgy - для всех кто любит машинное обучение я собрал…

👍5❤2🤡2

3.1K views15:26

📖

Эта статья исследует уязвимость моделей типа Mixture-of-Experts (MoE)!

🌟 Исследователи показывают, как злоумышленники могут извлечь промпты пользователей путём манипуляции запросами в тех же пакетах, что и запросы жертвы. Это первый известный случай использования архитектурных уязвимостей для извлечения промптов, что открывает новый класс уязвимостей для LLM.

🔗 Ссылка: *клик*

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1👏1👌1

2.94K views12:05

🔥

Эта статья описывает, как визуализировать и анализировать использование GPU-памяти в PyTorch!

🌟 В ней объясняется, как использовать инструмент для записи и анализа истории использования памяти, чтобы выявить проблемы с памятью при обучении моделей. Рассматриваются методы оценки требований к памяти, оптимизации ее использования и понимания различных этапов, таких как создание модели, передача данных, расчеты градиентов и шаги оптимизации.

🔗 Ссылка: *клик*

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3👌2❤1🔥1👏1

3K views13:04

👩‍💻

datasketch — Python-библиотека, содержащая реализации вероятностных структур данных, которые используются для оптимизации работы с большими объемами данных!

🌟 Среди основных возможностей — оценка схожести Jaccard с помощью MinHash и его взвешенной версии, а также оценка кардинальности множества с помощью HyperLogLog и HyperLogLog++. Эти структуры данных позволяют выполнять операции, такие как поиск схожих элементов или подсчет уникальных объектов, быстро и с минимальными затратами памяти.

🔐 Лицензия: MIT

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2❤1👍1👏1👀1

3.03K views10:03

🔥

PromptWizard — это фреймворк для оптимизации запросов в задачах, использующих LLM!

🌟 Он автоматизирует процесс создания, анализа и улучшения запросов, используя итеративный подход, где модель сама генерирует и дорабатывает инструкции и обучающие примеры. Этот инструмент помогает адаптировать запросы к конкретным задачам, обеспечивая лучшее качество ответов и более глубокое понимание инструкций языковой моделью.

🔐 Лицензия: MIT

🖥

Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2🔥2👍1👏1👌1

2.99K views09:35