Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤4🔥2
Russian Open Text To Speech (TTS) Dataset
Набор данных русской речи
Набор данных по русской речи - Zpoken Dataset [RU]
Большой открытый корпус устной русской речи
Golos dataset
Разметка аудиокниги Николая Старикова "Шерше ля нефть" в озвучке Эндшпиля
Наборы данных для русского языка жестов
Два новых набора данных для разговорного ИИ
Огромный открытый датасет русской речи
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤2🔥1
#cheatsheet #pandas
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥1
#cheatsheet #python
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤5🔥1😱1
🐳 Руководство по Docker для аналитика даннных.
Представьте, как вы устанавливаете программное обеспечение, требующее установку всех его зависимостей. Придется столкнуться со множеством ошибок, вручную выяснить и устранить все их причины. Каждый раз — попытки запустить всю систему заново, чтобы наконец-то правильно завершить установку… Именно в этот момент на помощь приходит Docker, пытаясь серьезно облегчить жизнь.
Содержание статьи:
1. Образы и контейнеры.
2. Запуск первой программы в Docker.
3. Основные команды контейнеров Docker.
4. Командная строка Docker-контейнера.
5. Пользовательские образы Docker.
6. Запуск веб-приложения в Docker.
7. Docker и сопоставление портов.
8. Выводы.
➡️ Читать дальше
@bigdatai
Представьте, как вы устанавливаете программное обеспечение, требующее установку всех его зависимостей. Придется столкнуться со множеством ошибок, вручную выяснить и устранить все их причины. Каждый раз — попытки запустить всю систему заново, чтобы наконец-то правильно завершить установку… Именно в этот момент на помощь приходит Docker, пытаясь серьезно облегчить жизнь.
Содержание статьи:
1. Образы и контейнеры.
2. Запуск первой программы в Docker.
3. Основные команды контейнеров Docker.
4. Командная строка Docker-контейнера.
5. Пользовательские образы Docker.
6. Запуск веб-приложения в Docker.
7. Docker и сопоставление портов.
8. Выводы.
➡️ Читать дальше
@bigdatai
👍6❤2🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - eugeneyan/applied-ml: 📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production.
📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production. - eugeneyan/applied-ml
👍9🔥2❤1
Лингвистические датасеты
Открытая семантика русского языка
Тональный словарь русского языка КартаСловСент — слова и выражения русского языка, снабжённые тональной меткой («положительное», «отрицательное», «нейтральное») и скалярным значением силы эмоционально-оценочного заряда из непрерывного диапазона [-1, 1].
Автоматическая обработка текстов на естественном языке и анализ данных
Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.
Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).
Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.
Датасет состоящий из русских предложений.
Event2Mind для русского языка
Данные: github.com/Alenush/russian_event2mind
Отслеживание семантических сдвигов для русского языка
Прилагательные вручную аннотированные для временных семантических сдвигов в промежутке времени от 2000 до 2014 года.
RULEC-GEC - это набор предложений, написанных изучающими русский язык и помеченных на ошибки.
Определение композиционности существительных с использованием распределительной семантики для русского языка
Математический набор данных переведен на русский язык
The Knowledge Base Question Answering
Рукописные символы русских берестяных грамот
Национальный корпус русского языка
@bigdatai
Открытая семантика русского языка
Тональный словарь русского языка КартаСловСент — слова и выражения русского языка, снабжённые тональной меткой («положительное», «отрицательное», «нейтральное») и скалярным значением силы эмоционально-оценочного заряда из непрерывного диапазона [-1, 1].
Автоматическая обработка текстов на естественном языке и анализ данных
Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.
Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).
Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.
Датасет состоящий из русских предложений.
Event2Mind для русского языка
Данные: github.com/Alenush/russian_event2mind
Отслеживание семантических сдвигов для русского языка
Прилагательные вручную аннотированные для временных семантических сдвигов в промежутке времени от 2000 до 2014 года.
RULEC-GEC - это набор предложений, написанных изучающими русский язык и помеченных на ошибки.
Определение композиционности существительных с использованием распределительной семантики для русского языка
Математический набор данных переведен на русский язык
The Knowledge Base Question Answering
Рукописные символы русских берестяных грамот
Национальный корпус русского языка
@bigdatai
👍9❤3🔥1
Полный список хранилищ данных для каждого типа проблем
Блог содержит несколько полезных наборов данных и репозиториев, классифицированных по различным классам проблем и отраслей промышленности.
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍3❤1
machine-learning-cheat-sheet.pdf
1.9 MB
https://github.com/soulmachine/machine-learning-cheat-sheet
Ставь ❤️ и сохраняй себе, чтобы не потерять.
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18👍8🔥4
Большое количество наглядных интерактивных визуализаций. Рекомендуем ознакомиться.
📗 Книга
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍3❤2