Big Data AI
16.8K subscribers
835 photos
98 videos
19 files
836 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
📌Классный интерактивный учебник по Machine Learning

Отличный ресурс для погружения в ML
Здесь очень много интерактивных элементов, которые помогают не просто запомнить, а понять важные концепции машинного обучения

Среди разбираемых тем такие как:
— нейронные сети
— регрессия: линейная/логистическая
— ROC & AUC
— кросс-валидация
— и многие другие темы, часть из них видна на изображениях

📎 Учебник по ML

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍42
🐦‍⬛ BIRD - это новый метод восстановления изображений, который может качественно восстанавливать изображения.

https://github.com/hamadichihaoui/BIRD

@bigdatai
👍82🔥2
📃Google представили NATURAL PLAN: бенчмарк для LLM для задач планирования на естественном языке

Представляет реалистичный бенчмарк для планированияс поездок, встреч и календарного планирования.

Это на удивление сложная задача для современных моделей.

https://arxiv.org/abs/2406.04520

@bigdatai
👍62🔥1
💡 Действительно интересный репозиторий

Датасет, который состоит из 15 140 запросов ChatGPT с Reddit, Discord, курупыных веб-сайтов и наборов данных с открытым исходным кодом (включая 1 405 запросов для взлом ответов gpt).

https://github.com/verazuo/jailbreak_llms

#датасет

@bigdatai
3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 Whisper WebGPU — распознавание речи локально, при помощи Whisper

git clone https://github.com/xenova/whisper-web.git
cd whisper-web
npm install

npm run dev

# https://localhost:5173/


Whisper WebGPU — очень быстрое распознавание речи локально прямо в браузере, поддерживает 100 языков

🖥 GitHub
🟡 Затестить Whisper WebGPU

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
🌟 DuckDuckGo представила собственный ИИ-чат

Разработчики DuckDuckGo представили собственный бесплатный ИИ-чат. Сейчас пользователям доступны четыре модели машинного обучения, но в будущем список планируют расширить.

Доступ к чат-боту от DuckDuckGo можно получить несколькими способами:

— на портале DuckAI duck.ai;

— на специальной странице чата — duckduckgo.com/chat;

— в поисковой выдаче;

— с помощью bangs !ai и !chat в адресной строке.

На выбор пользователям доступно четыре языковые модели: GPT 3.5 Turbo, Claude 3 Haiku, Llama 3 и Mixtral 8x7B. Запросы к ним можно отправлять бесплатно, но с ограничением по количеству запросов в сутки. Пока нет возможности получить безлимитный доступ, но представители компании отметили, что уже думают над платным тарифом и расширенным списком языковых моделей.

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥41
top CVPR 2024 papers

Конференция по компьютерному зрению и распознаванию образов CVPR 2024 - это масштабная конференция.

Только в 2024 году было представлено 11 532 доклада, из которых 2 719 были приняты.

Вот репозиторий, чтобы помочь вам найти лучшие публикации CVPR.

Github

@bigdatai
🔥2👍1
⭐️ Яндекс выложил в опенсорс свою библиотеку YaFSDP

Это библиотека для обучения больших языковых моделей с открытым исходным кодом, которая позволяет ускорить их обучение до 25%, а также тратить до 20% меньше ресурсов графических процессоров.

Использование библиотеки даёт существенный выигрыш в производительности и потреблении памяти: YaFSDP позволяет использовать ровно столько памяти процессоров, сколько необходимо, а коммуникацию между GPU в сети при этом ничего не тормозит.

https://habr.com/ru/companies/yandex/articles/817509/

@bigdatai
👍4🔥3🥰1
🏴‍☠️ Представляем новый открытый набор данных "Character Codex"!

Он содержит данные о 15 939 персонажах из самых разных источников, от аниме до исторических личностей, ученых и популярных персонажей, как вымышленных, так и не вымышленных!

Скачать на HuggingFace: https://huggingface.co/datasets/NousResearch/CharacterCodex

Потенциальные варианты использования - это использование для генерации синтетических данных, анализа данных о ролевых играх и многого другого.

https://huggingface.co/datasets/NousResearch/CharacterCodex

#датасет

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍2
⚡️ Вышла версия Ollama v0.1.43!

Эта версия улучшает работу с Llama.

Исправлно множество ошибок!

* Github

@bigdatai
1👍1🔥1😁1
⚡️ Recap-DataComp-1B - это крупномасштабный набор графических и текстовых данных, который был восстановлен с использованием усовершенствованной модели LLaVA-1.5-LLaMA3-8B для повышения согласованности и детализации текстовых описаний.

data: https://huggingface.co/datasets/UCSC-VLAA/Recap-DataComp-1B
proj: https://haqtu.me/Recap-Datacomp-1B/
abs: https://arxiv.org/abs/2406.08478

@bigdatai
2🔥2👍1