Big Data AI
16.8K subscribers
812 photos
97 videos
19 files
818 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
✔️ Большая шпаргалка по Python, Django, Pygame, Matplotlib для новичков

#cheatsheet #python

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🔥1😱1
🐳 Руководство по Docker для аналитика даннных.

Представьте, как вы устанавливаете программное обеспечение, требующее установку всех его зависимостей. Придется столкнуться со множеством ошибок, вручную выяснить и устранить все их причины. Каждый раз  —  попытки запустить всю систему заново, чтобы наконец-то правильно завершить установку… Именно в этот момент на помощь приходит Docker, пытаясь серьезно облегчить жизнь.

Содержание статьи:

1. Образы и контейнеры.
2. Запуск первой программы в Docker.
3. Основные команды контейнеров Docker.
4. Командная строка Docker-контейнера.
5. Пользовательские образы Docker.
6. Запуск веб-приложения в Docker.
7. Docker и сопоставление портов.
8. Выводы.


➡️ Читать дальше

@bigdatai
👍62🔥2
Лингвистические датасеты

Открытая семантика русского языка

Тональный словарь русского языка КартаСловСент — слова и выражения русского языка, снабжённые тональной меткой («положительное», «отрицательное», «нейтральное») и скалярным значением силы эмоционально-оценочного заряда из непрерывного диапазона [-1, 1].

Автоматическая обработка текстов на естественном языке и анализ данных

Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.

Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).

Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.

Датасет состоящий из русских предложений.

Event2Mind для русского языка
Данные: github.com/Alenush/russian_event2mind

Отслеживание семантических сдвигов для русского языка
Прилагательные
вручную аннотированные для временных семантических сдвигов в промежутке времени от 2000 до 2014 года.

RULEC-GEC - это набор предложений, написанных изучающими русский язык и помеченных на ошибки.

Определение композиционности существительных с использованием распределительной семантики для русского языка

Математический набор данных переведен на русский язык

The Knowledge Base Question Answering

Рукописные символы русских берестяных грамот

Национальный корпус русского языка

@bigdatai
👍93🔥1
✔️ Репозитории и датасеты практически для всех типов проектов в области Data Science. Более 100 датасетов.

Полный список хранилищ данных для каждого типа проблем

Блог содержит несколько полезных наборов данных и репозиториев, классифицированных по различным классам проблем и отраслей промышленности.

➡️ Читать дальше

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍31
machine-learning-cheat-sheet.pdf
1.9 MB
📎 130-страничная шпаргалка с изложением ключевых концепций #MachineLearning

https://github.com/soulmachine/machine-learning-cheat-sheet

Ставь ❤️ и сохраняй себе, чтобы не потерять.

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍8🔥4
🏓 Отличный бесплатныйинтерактивный курс по теории вероятностей и статистике:

Большое количество наглядных интерактивных визуализаций. Рекомендуем ознакомиться.

✔️ Seeing-theory
📗 Книга

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍32
✔️ Подборка датасетов для машинного обучения

Перед вами статья-путеводитель по открытым наборам данных для машинного обучения.

➡️ Читать дальше

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83🔥2
Awesome Dataviz

Тщательно подобранный список фреймворков, библиотек и программного обеспечения для визуализации данных с открытым исходным кодом.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2🔥1
✔️ Огромный список шпаргалок Data science на все случаи жизни.

Тщательно подобранный список потрясающих шпаргалок по науке о данных, машинному обучению и статистике чтобы решать любые задачи.

➡️ Шпаргалки

ставьте ❤️ и отправляйте друзьям

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍3🔥1
🐼 Pandas Exercises

Для всех, работающих с Pandas великолепный сборник упражнений. В репоззитории содержится 10 тем, среди которых группировка данных, визуализация, работа с временными рядами.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥43
🎓 Бесплатный Курс по статистике

направлен на повышение вашей способности разрабатывать гипотезы и использовать общие тесты, такие как t-тесты, тесты ANOVA и регрессию, для проверки ваших гипотез.

https://www.udacity.com/course/intro-to-inferential-statistics--ud201

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍121🔥1
🔥 Официальные бесплатные курсы по кликхаусу

Станьте экспертом по ClickHouse с бесплатным официальным обучением.

https://clickhouse.com/learn/

@bigdatai
👍10👎2🔥21
🍪 Курс "Машинное обучение" на ФКН ВШЭ

Конспекты лекций, материалы семинаров и домашние задания (теоретические, практические, соревнования) по курсу "Машинное обучение", проводимому на бакалаврской программе "Прикладная математика и информатика" Факультета компьютерных наук Высшей школы экономики.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥4❤‍🔥21
🎓 Удобная для работы коллекция датасетов для различных тестов.

pip install ml-datasets


🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥2
📖 How to Design a Dashboard book!

Бесплатная веб-книга про дизайн дашбордов для аналитиков данных.

Дашбордов панели помогают организациям принимать решения на основе данных. Узнайте, как применить дизайн-мышление для создания полезных информационных панелей.

📚 Книга

@bigdatai
👍121🔥1