Анализ данных (Data analysis)

📎 Открытые датасеты 📎

🔵

Labelled Faces in the Wild. 13 тысяч размеченных изображений лиц.

🔵

IMF Data. Датасеты о финансах и ценах на товары.

🔵

Google Trends. Данные о поисковой статистике и трендовых запросах.

🔵

xView. Большой набор воздушных снимков Земли с аннотациями.

🔵

World Bank Open Data. Наборы данных о демографии и экономических показателях.

🔵

Labelme. Большой датасет с уже размеченными изображениями.

🔵

HotspotQA Dataset . Датасет с вопросами-ответами для генерации ответов на часто задаваемые простые вопросы.

🔵

Berkeley DeepDrive BDD100k. Тысячи часов вождения для обучения автопилотов.

🔵

MIMIC-III. Обезличенные медицинские данные пациентов.

🔵

CREMA-D — датасет для распознавания эмоций по записи голоса.

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍22🔥3❤2

5.4K views15:21

Анализ данных (Data analysis)

🌟

TrustLLM для оценивания ответов LLM

TrustLLM — инструмент на Python для комплексного исследования ответов от LLM.
TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие.

В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.

pip install trustllm

▪GitHub
▪Arxiv
▪Docs
▪Project

#llm

🌟

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤8🔥3

6.43K views14:33

Анализ данных (Data analysis)

⭐️

Reasoning-v1-20m

Синтетический набор данных, содержащий более 22 млн цепочек рассуждений для прометав общего назначения в различных областях.

Большой датасет, содержащих следы рассуждений для различных тем: связанных с кодом/математикой, социальных сферах и естественных наук и тд.

https://huggingface.co/datasets/glaiveai/reasoning-v1-20m

#dataset #Reasoning

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥4❤3

5.44K views09:02

Анализ данных (Data analysis)

Forwarded from Machinelearning

📌

72B слишком много для VLM? А 7B параметров недостаточно!

QWEN только что выпустили новую модель на 32B параметров, Qwen2.5-VL-32B-Instruct.

Эта модель представляет собой значительный прогресс для своего размера. И что самое лучшее, она лицензирована Apache 2.

Модель выдает более подробные и структурированный ответы.

💡 Детальное понимание: превосходные возможности анализа изображений и визуальной логической дедукции.

📊 Превосходит сопоставимые модели, такие как Mistral-Small-3.1-24B и Gemma-3-27B-IT.

🚀 В нескольких тестах даже превосходит более крупный Qwen2-VL-72B-Instruct.

Еще один крутой релиз понедельника!

🟢

Блог: https://qwenlm.github.io/blog/qwen2.5-vl-32b/

🟢

Попробовать: https://chat.qwen.ai
ВЧ: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct

🟢

Модель: https://modelscope.cn/models/Qwen/Qwen2.5-VL-32B-Instruct

@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥6❤4

4.73K views18:13

About

Blog

Apps

Platform