Отличный ресурс для погружения в ML
Здесь очень много интерактивных элементов, которые помогают не просто запомнить, а понять важные концепции машинного обучения
Среди разбираемых тем такие как:
— нейронные сети
— регрессия: линейная/логистическая
— ROC & AUC
— кросс-валидация
— и многие другие темы, часть из них видна на изображениях
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍4❤2
🐦⬛ BIRD - это новый метод восстановления изображений, который может качественно восстанавливать изображения.
https://github.com/hamadichihaoui/BIRD
@bigdatai
https://github.com/hamadichihaoui/BIRD
@bigdatai
👍8❤2🔥2
📃Google представили NATURAL PLAN: бенчмарк для LLM для задач планирования на естественном языке
Представляет реалистичный бенчмарк для планированияс поездок, встреч и календарного планирования.
Это на удивление сложная задача для современных моделей.
https://arxiv.org/abs/2406.04520
@bigdatai
Представляет реалистичный бенчмарк для планированияс поездок, встреч и календарного планирования.
Это на удивление сложная задача для современных моделей.
https://arxiv.org/abs/2406.04520
@bigdatai
👍6❤2🔥1
💡 Действительно интересный репозиторий
Датасет, который состоит из 15 140 запросов ChatGPT с Reddit, Discord, курупыных веб-сайтов и наборов данных с открытым исходным кодом (включая 1 405 запросов для взлом ответов gpt).
https://github.com/verazuo/jailbreak_llms
#датасет
@bigdatai
Датасет, который состоит из 15 140 запросов ChatGPT с Reddit, Discord, курупыных веб-сайтов и наборов данных с открытым исходным кодом (включая 1 405 запросов для взлом ответов gpt).
https://github.com/verazuo/jailbreak_llms
#датасет
@bigdatai
❤3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
git clone https://github.com/xenova/whisper-web.git
cd whisper-web
npm install
npm run dev
# https://localhost:5173/
Whisper WebGPU — очень быстрое распознавание речи локально прямо в браузере, поддерживает 100 языков
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1🔥1
Разработчики DuckDuckGo представили собственный бесплатный ИИ-чат. Сейчас пользователям доступны четыре модели машинного обучения, но в будущем список планируют расширить.
Доступ к чат-боту от DuckDuckGo можно получить несколькими способами:
— на портале DuckAI duck.ai;
— на специальной странице чата — duckduckgo.com/chat;
— в поисковой выдаче;
— с помощью bangs
!ai
и !chat
в адресной строке.На выбор пользователям доступно четыре языковые модели: GPT 3.5 Turbo, Claude 3 Haiku, Llama 3 и Mixtral 8x7B. Запросы к ним можно отправлять бесплатно, но с ограничением по количеству запросов в сутки. Пока нет возможности получить безлимитный доступ, но представители компании отметили, что уже думают над платным тарифом и расширенным списком языковых моделей.
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4❤1
⭐️ Яндекс выложил в опенсорс свою библиотеку YaFSDP
Это библиотека для обучения больших языковых моделей с открытым исходным кодом, которая позволяет ускорить их обучение до 25%, а также тратить до 20% меньше ресурсов графических процессоров.
Использование библиотеки даёт существенный выигрыш в производительности и потреблении памяти: YaFSDP позволяет использовать ровно столько памяти процессоров, сколько необходимо, а коммуникацию между GPU в сети при этом ничего не тормозит.
https://habr.com/ru/companies/yandex/articles/817509/
@bigdatai
Это библиотека для обучения больших языковых моделей с открытым исходным кодом, которая позволяет ускорить их обучение до 25%, а также тратить до 20% меньше ресурсов графических процессоров.
Использование библиотеки даёт существенный выигрыш в производительности и потреблении памяти: YaFSDP позволяет использовать ровно столько памяти процессоров, сколько необходимо, а коммуникацию между GPU в сети при этом ничего не тормозит.
https://habr.com/ru/companies/yandex/articles/817509/
@bigdatai
👍4🔥3🥰1
Он содержит данные о 15 939 персонажах из самых разных источников, от аниме до исторических личностей, ученых и популярных персонажей, как вымышленных, так и не вымышленных!
Скачать на HuggingFace: https://huggingface.co/datasets/NousResearch/CharacterCodex
Потенциальные варианты использования - это использование для генерации синтетических данных, анализа данных о ролевых играх и многого другого.
https://huggingface.co/datasets/NousResearch/CharacterCodex
#датасет
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤2👍2
Вышел Stable Diffusion 3 - самый мощный бесплатный генератор картинок!
https://youtu.be/k3QNJBpDe7o
@bigdatai
https://youtu.be/k3QNJBpDe7o
@bigdatai
YouTube
Вышел Stable Diffusion 3 - самый мощный бесплатный генератор картинок!
⚡️ Встречайте Stable Diffusion 3!
⚡️https://t.iss.one/ai_machinelearning_big_data - наш канал, для всех, кто любит машинное обучение и data science
⚡️https://t.iss.one/+ANhw-uaOaYs1Mjky - это база с 1900 вопросами с собеседований по анализу данных, машинному обучению…
⚡️https://t.iss.one/ai_machinelearning_big_data - наш канал, для всех, кто любит машинное обучение и data science
⚡️https://t.iss.one/+ANhw-uaOaYs1Mjky - это база с 1900 вопросами с собеседований по анализу данных, машинному обучению…
👍2🔥1😁1
⚡️ Recap-DataComp-1B - это крупномасштабный набор графических и текстовых данных, который был восстановлен с использованием усовершенствованной модели LLaVA-1.5-LLaMA3-8B для повышения согласованности и детализации текстовых описаний.
▪data: https://huggingface.co/datasets/UCSC-VLAA/Recap-DataComp-1B
▪proj: https://haqtu.me/Recap-Datacomp-1B/
▪abs: https://arxiv.org/abs/2406.08478
@bigdatai
▪data: https://huggingface.co/datasets/UCSC-VLAA/Recap-DataComp-1B
▪proj: https://haqtu.me/Recap-Datacomp-1B/
▪abs: https://arxiv.org/abs/2406.08478
@bigdatai
❤2🔥2👍1