This media is not supported in your browser
VIEW IN TELEGRAM
Функции потерь Python являются важной частью ML-моделей. Эти функции показывают, насколько сильно предсказанный моделью результат отличается от фактического.
Существует несколько способов вычислить эту разницу.
В этом материале мы рассмотрим некоторые из наиболее распространенных функций потерь, а именно:
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍4🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Модель Metals Segment Anything (SAM) теперь может работать в вашем браузере с WebGPU (+ fp16), что означает скорость обработки изображений выросла в 8 раз (10 секунд = 1,25 секунды)! 🤯 ⚡️
Сегментация видео работает с прежней скоростью!
Все работает на 100% локально благодаря 🤗 Transformers.js и onnxruntime-web!
🔗 Demo: https://hf.co/spaces/Xenova/segment-anything-webgpu
Сегментация видео работает с прежней скоростью!
Все работает на 100% локально благодаря 🤗 Transformers.js и onnxruntime-web!
🔗 Demo: https://hf.co/spaces/Xenova/segment-anything-webgpu
👍12🔥5❤2
🦾 Dataset of 15 trillion tokens
Только что был опубликован датасет из 15 триллионов токенов (столько же, сколько было использовано для обучения Llama 3)!!!
Скачайте его, пока он не был удален из-за авторских прав.
https://huggingface.co/datasets/HuggingFaceFW/fineweb
@data_analysis_ml
Только что был опубликован датасет из 15 триллионов токенов (столько же, сколько было использовано для обучения Llama 3)!!!
Скачайте его, пока он не был удален из-за авторских прав.
https://huggingface.co/datasets/HuggingFaceFW/fineweb
@data_analysis_ml
🔥15👍5❤4
Невероятно полезный и практический notebook на тему генерации и отбора признаков.
Здесь обсуждается очень много полезных вещей, освежить которые перед собеседованием не будет лишним
Вот некоторые из обсуждаемых тем:
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥6❤5
⚡️ Phi-3 7B только что был выпущен и уверенно превосходит Llama-3 7B.
С MLU 75,3 модель приближается к 70-B моделям SOTA!! 🤯
Я не удивлюсь, если к концу года у нас появится модель 7B, которая превзойдет GPT-4.
https://arxiv.org/pdf/2404.14219.pdf
@data_analysis_ml
С MLU 75,3 модель приближается к 70-B моделям SOTA!! 🤯
Я не удивлюсь, если к концу года у нас появится модель 7B, которая превзойдет GPT-4.
https://arxiv.org/pdf/2404.14219.pdf
@data_analysis_ml
❤11🔥8👍4🤣2
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤5🔥3
Регуляризация - подход, который позволяет снизить сложность модели за счет "штрафования" вектора параметров θ.
Это один из эфективных методов борьбы с "переобучением", наряду с кросс-валидацией и уменьшением количества фичей, о которых мы поговорим позже. Регуляризация дает возможность выделить фичи,которые вносят наибольший вклад в принятия решения, и снизить влияние фич создающих "шум".
Существует два вида регуляризации - L1 и L2, выбор вида регуляризации отвечает на вопрос "как штрафовать". Рассмотрим различия между ними.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤3🔥2
⭐ IDM-VON - модель, которая превосходит другие подходы, основанные на диффузии и GAN, для переноса любых деталей одежды на фотографии.
Только посмотрите на примеры выше)
• Github: https://github.com/yisol/IDM-VTON
• Demo: https://huggingface.co/spaces/yisol/IDM-VTON
• Paper: https://arxiv.org/abs/2403.05139
• Project: https://idm-vton.github.io/
@data_analysis_ml
Только посмотрите на примеры выше)
• Github: https://github.com/yisol/IDM-VTON
• Demo: https://huggingface.co/spaces/yisol/IDM-VTON
• Paper: https://arxiv.org/abs/2403.05139
• Project: https://idm-vton.github.io/
@data_analysis_ml
🤣15👍13❤4🔥4🌭2
Forwarded from Machinelearning
Сегодня Apple выпустили Openly.
- Новое семейство LM с открытым исходным кодом для обучения моделей и логического вывода
- Работает наравне с OLMo, но требует в 2 раза меньше токенов для обучения
- Модели для различных задач, включая базовые модели (например, CLIP и LLM), классификацию объектов, обнаружение объектов и семантическую сегментацию.
Cписок моделей и подробная информации о каждой из них:
- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct
• gitHub: https://github.com/apple/corenet
• hf: https://huggingface.co/apple/OpenELM
• abs: https://arxiv.org/abs/2404.14619
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥4❤2