Big Data AI
16.8K subscribers
813 photos
97 videos
19 files
820 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🖥 Крутой блог для начинающих датасаентистов

Читать

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥2
🖥 Полезный Гайд про docker и docker-compose

https://jtprog.ru/docker-base/

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥2
✔️ Шпаргалка по pandas, библиотеке на языке Python для обработки и анализа данных

#cheatsheet #pandas

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥1
✔️ Большая шпаргалка по Python, Django, Pygame, Matplotlib для новичков

#cheatsheet #python

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🔥1😱1
🐳 Руководство по Docker для аналитика даннных.

Представьте, как вы устанавливаете программное обеспечение, требующее установку всех его зависимостей. Придется столкнуться со множеством ошибок, вручную выяснить и устранить все их причины. Каждый раз  —  попытки запустить всю систему заново, чтобы наконец-то правильно завершить установку… Именно в этот момент на помощь приходит Docker, пытаясь серьезно облегчить жизнь.

Содержание статьи:

1. Образы и контейнеры.
2. Запуск первой программы в Docker.
3. Основные команды контейнеров Docker.
4. Командная строка Docker-контейнера.
5. Пользовательские образы Docker.
6. Запуск веб-приложения в Docker.
7. Docker и сопоставление портов.
8. Выводы.


➡️ Читать дальше

@bigdatai
👍62🔥2
Лингвистические датасеты

Открытая семантика русского языка

Тональный словарь русского языка КартаСловСент — слова и выражения русского языка, снабжённые тональной меткой («положительное», «отрицательное», «нейтральное») и скалярным значением силы эмоционально-оценочного заряда из непрерывного диапазона [-1, 1].

Автоматическая обработка текстов на естественном языке и анализ данных

Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.

Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).

Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.

Датасет состоящий из русских предложений.

Event2Mind для русского языка
Данные: github.com/Alenush/russian_event2mind

Отслеживание семантических сдвигов для русского языка
Прилагательные
вручную аннотированные для временных семантических сдвигов в промежутке времени от 2000 до 2014 года.

RULEC-GEC - это набор предложений, написанных изучающими русский язык и помеченных на ошибки.

Определение композиционности существительных с использованием распределительной семантики для русского языка

Математический набор данных переведен на русский язык

The Knowledge Base Question Answering

Рукописные символы русских берестяных грамот

Национальный корпус русского языка

@bigdatai
👍93🔥1
✔️ Репозитории и датасеты практически для всех типов проектов в области Data Science. Более 100 датасетов.

Полный список хранилищ данных для каждого типа проблем

Блог содержит несколько полезных наборов данных и репозиториев, классифицированных по различным классам проблем и отраслей промышленности.

➡️ Читать дальше

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍31
machine-learning-cheat-sheet.pdf
1.9 MB
📎 130-страничная шпаргалка с изложением ключевых концепций #MachineLearning

https://github.com/soulmachine/machine-learning-cheat-sheet

Ставь ❤️ и сохраняй себе, чтобы не потерять.

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍8🔥4
🏓 Отличный бесплатныйинтерактивный курс по теории вероятностей и статистике:

Большое количество наглядных интерактивных визуализаций. Рекомендуем ознакомиться.

✔️ Seeing-theory
📗 Книга

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍32