Выбросы — значения или наблюдения, отклоняющиеся от других данных. Всегда нужно сравнивать наблюдение с другими значениями, полученными тем же способом, прежде чем называть их выбросами.
Имеет смысл формально выделять два класса выбросов: экстремальные значения и ошибки. Экстремальные значения интереснее, потому что они возможны, но маловероятны.
В этой статье — несколько подходов к обнаружению выбросов в Python; от простых методов, таких как описательная статистика (включая минимальные, максимальные значения, гистограмму, прямоугольную диаграмму и процентили), до более формальных методов, таких как фильтр Хэмпеля, тесты Граббса, Диксона и Рознера.
#junior
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥6❤4
⚡️ Quix Streams - это облачная нативная библиотека для обработки данных в Kafka с использованием Python.
Инструмент разработан, чтобы предоставить возможности распределенной системы в виде легкой библиотеки, сочетая низкоуровневую масштабируемость и отказоустойчивость функций Kafka с простым в использовании интерфейсом Python.
Отлично подходит для новичков, которые хотят познакомиться с потоковой обработкой.
• Github
• Docs
@data_analysis_ml
Инструмент разработан, чтобы предоставить возможности распределенной системы в виде легкой библиотеки, сочетая низкоуровневую масштабируемость и отказоустойчивость функций Kafka с простым в использовании интерфейсом Python.
Отлично подходит для новичков, которые хотят познакомиться с потоковой обработкой.
python -m pip install quixstreams
• Github
• Docs
@data_analysis_ml
👍7❤4🔥3
⚡️ Snowflake только что запустила самую крупную модель с открытым исходным кодом на сегодняшний день.
482 млрд параметр MoE.
17 млрд. активных параметров и 128 экспертов, обученных на 3,5 Т токенов.
Даже описание данных с открытым исходным кодом!
pip install git+https://github.com/Snowflake-Labs/transformers.git@arctic
https://huggingface.co/Snowflake/snowflake-arctic-instruct
@data_analysis_ml
482 млрд параметр MoE.
17 млрд. активных параметров и 128 экспертов, обученных на 3,5 Т токенов.
Даже описание данных с открытым исходным кодом!
pip install git+https://github.com/Snowflake-Labs/transformers.git@arctic
https://huggingface.co/Snowflake/snowflake-arctic-instruct
@data_analysis_ml
👍21🔥8❤4🍌1
Эффективный способ быстрого освоения ChatGPT.
Создание правильных промптов и обучение нейронной сети - это долгий процесс, требующий значительных временных затрат.
Здесь разработан краткий курс из 5 уроков по ChatGPT. После его прохождения вы сможете создать 9 нейронных сетей, которые помогут вам:
▪️ найти ошибки и оптимизировать код
▪️ генерировать посты в Телеграме
▪️ создавать заголовки для рекламы
* отдать всю рутину на выполнение нейронке
Вы также сможете разработать своих нейро-помощников для продаж, маркетинга и других целей.
Бесплатный доступ доступен сразу после регистрации.
Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8KYXR3
Создание правильных промптов и обучение нейронной сети - это долгий процесс, требующий значительных временных затрат.
Здесь разработан краткий курс из 5 уроков по ChatGPT. После его прохождения вы сможете создать 9 нейронных сетей, которые помогут вам:
▪️ найти ошибки и оптимизировать код
▪️ генерировать посты в Телеграме
▪️ создавать заголовки для рекламы
* отдать всю рутину на выполнение нейронке
Вы также сможете разработать своих нейро-помощников для продаж, маркетинга и других целей.
Бесплатный доступ доступен сразу после регистрации.
Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8KYXR3
👍4
Держите, полезная подборка ответов на распространенные вопросы из собеседований по Data Science и немного по ML
🔗 Вопросы/ответы
🔗 14 типичных вопросов с собеседования по ML
🔗 Большая подборка вопросов для собеседования по DS
🔗 Подготовка к собеседованию по ML: ответы на основные вопросы
🔗 Вопросы для собеседования на позицию ML-инженера
🔗 Вопросы с собеседований статистика
🔗 Вопросы по теории вероятности
🔗Материалы для подготовки к интервью по направлению
🔗Задачи с собеседований SQL
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24❤7🔥4
Пока неизвестно, будет ли VideoGigaGAN доступен простым пользователям в Creative Cloud или Adobe планирует иначе использовать новую модель.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍9🔥4🥰1
В этой статье мы поговорим о том, как делать кластерный анализ и строить тепловые карты экспрессии в R.
Рассмотрим такие понятия как:
• Многомерные данные
• Облако точек в многомерном пространстве
• Коэффициенты сходства-различия
• Евклидово расстояние
• Коэффициент Жаккара
• Иерархическая кластеризация
• Алгоритмы иерархической кластеризации на основании расстояний
• Метод ближайшего соседа
• Метод отдаленного соседа
• Метод невзвешенного попарного среднего
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤4🥰2
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤5🔥2
Позволяет:
• интегрировать и синхронизировать данные из сторонних источников
• создавать конвейеры обработки данных в реальном времени и в пакетном режиме, используя Python, SQL и R
• производить запуск, мониторинг и оркестровку тысяч конвейеров
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤4🔥4❤🔥1🤔1
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
😱16👍12😁6🤔5❤3🔥2
Помогает обнаруживать проблемы в моделях.
Сканирует LLM, позволяет определить производительность, фиксирует проблемы безопасности.
Установка:
pip install "giskard[llm]" -U
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤4🔥4❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👨🎓 100 лекций по математике от Оксфорда
Оксфорд публикует лекции по математике, чтобы дать представление об опыте студентов и о том, как они преподают математику в Оксфорде.
В этом плейлисте собраны лекции из различных курсов за все студенческие годы (включая целые курсы).
За всеми лекциями следуют учебные занятия, на которых студенты встречаются со своим преподавателем и решают задачи.
Примерно 80 часов отборной математики.
• Плейлист
@data_analysis_ml
Оксфорд публикует лекции по математике, чтобы дать представление об опыте студентов и о том, как они преподают математику в Оксфорде.
В этом плейлисте собраны лекции из различных курсов за все студенческие годы (включая целые курсы).
За всеми лекциями следуют учебные занятия, на которых студенты встречаются со своим преподавателем и решают задачи.
Примерно 80 часов отборной математики.
• Плейлист
@data_analysis_ml
👍26❤6🔥5
Forwarded from Machine learning Interview
▪Смотреть
▪Данные
▪Ноутбук
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥4❤3❤🔥2