❤2
  Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Дисперсия — ключевой статистический показатель, который помогает оценить изменчивость данных. Для дата-сайентистов она критична при:
В этой статье разберём, как правильно использовать дисперсию в Data Science и как она влияет на работу алгоритмов, например, в модели Random Forest.
👉 Читайте, чтобы понять, как измерять и учитывать дисперсию: https://proglib.io/sh/GDKYJQdAI2
Библиотека дата-сайентиста
Please open Telegram to view this post
    VIEW IN TELEGRAM
  ❤3
  Значение p= 0.04 означает:
🔥 — 4% вероятность того, что нулевая гипотеза (H₀) верна
❤️ — 96% вероятность того, что альтернативная гипотеза (H₁) верна
⚡️ — Результат маловероятен при нулевой гипотезе (H₀)
👍 — Результат практически значим
Библиотека задач по Data Science
🔥 — 4% вероятность того, что нулевая гипотеза (H₀) верна
❤️ — 96% вероятность того, что альтернативная гипотеза (H₁) верна
⚡️ — Результат маловероятен при нулевой гипотезе (H₀)
👍 — Результат практически значим
Библиотека задач по Data Science
⚡28🔥6👍5❤1
  👍2❤1
  👍1🥱1
  ❤1
  Что выведет код?
  Anonymous Quiz
    6%
    [1, 2, 3, 4] [9, 2, 3, 4]
      
    77%
    [9, 2, 3, 4] [9, 2, 3, 4]
      
    15%
    Error
      
    3%
    [1, 2, 3, 4] [1, 2, 3, 4]
      
    🔥2🥰1
  ❤1🔥1
  ❤4🔥1
  Какой алгоритм наиболее эффективен для обнаружения фальшивых отзывов?
🔥 — BERT
❤️ — DBSCAN
⚡️ — Support Vector Regression
👍 — Principal Component Analysis
Библиотека задач по Data Science
🔥 — BERT
❤️ — DBSCAN
⚡️ — Support Vector Regression
👍 — Principal Component Analysis
Библиотека задач по Data Science
🔥21❤3
  ❤1