👍17❤5🔥2🤩1
Шпаргалки помогут:
- подготовиться к экзамену
- подготовиться к собеседованию
- в повседневной работе – быстро вспомнить нужную информацию
Сохраняйте себе, чтобы не потерять
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤3👏3🔥2
Специально подобранная коллекция классической музыки с пометками.
homes.cs.washington.edu/~thickstn/musicnet.html
Набор данных « Миллион песен» свободно доступная коллекция звуковых функций и метаданных для миллиона современных популярных музыкальных треков.
millionsongdataset.com
База данных русской речи : записанная в 1996-1998 годах, база данных русской речи STC была создана для исследования индивидуальной вариативности говорящего и проверки алгоритмов распознавания говорящего.
catalogue.elra.info/en-us/repository/browse/ELRA-S0050/
Набор данных: CSS10 - это набор наборов данных одного диктора на русском языке для 10 языков, включая русский.
kaggle.com/bryanpark/russian-single-speaker-speech-dataset
M-AILABS Speech Dataset : большой набор аудиоданных на русском языке, свободно используемый в качестве обучающих данных для распознавания и синтеза речи.
caito.de/2019/01/the-m-ailabs-speech-dataset/
Набор данных Russian Open Speech To Text (STT / ASR) : набор данных, содержащий более 4000 разнообразных, междоменных речей для обучения моделей преобразования речи в текст на русском языке.
towardsdatascience.com/russian-open-speech-to-text-stt-asr-dataset-4c4e5d6a292c
Крупномасштабный набор данных вручную аннотированных аудиособытий.
research.google.com/audioset
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍3🔥1
TensorFlow — это одна из наиболее популярных открытых библиотек с датасетами для задач машинного обучения. Разработкой TensorFlow занимаются исследователи из Google Brain. Библиотека предоставляет доступ к датасетам с изображениями, видео, аудио и текстами.
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥4❤2
Перед тем как перейти к парсингу Яндекс Карт, расскажу, какую задачу я хотел решить.
Я решил узнать, кто является целевой аудиторией для сервисов мультиссылок, например Taplink. Если зайти на сайт Taplink'a[ссылка удалена модератором], то они там показывают сценарии использования сервиса и пишут о категориях клиентов, на которые они ориентируются. Это “популярные люди”, “бизнес”, “интернет-магазин” и “каждый”. На лендинге немало примеров работ для оффлайн бизнеса, поэтому появилась идея проверить, используют ли вообще эти категории бизнеса сервисы мультиссылок. И для этого пригодится информация с Яндекс Карт.
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🔥2
📌 Шпаргалка по математической статистике (пригодится в машинном обучении)
✅ Основные определения и формулы
✅ Статистические тесты с примерами
✅ Теория вероятностей
✅ Таблицы критических значений
#cheatsheet
✅ Основные определения и формулы
✅ Статистические тесты с примерами
✅ Теория вероятностей
✅ Таблицы критических значений
#cheatsheet
🔥11❤5🤨4👍2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤2🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤4🔥2
Russian Open Text To Speech (TTS) Dataset
Набор данных русской речи
Набор данных по русской речи - Zpoken Dataset [RU]
Большой открытый корпус устной русской речи
Golos dataset
Разметка аудиокниги Николая Старикова "Шерше ля нефть" в озвучке Эндшпиля
Наборы данных для русского языка жестов
Два новых набора данных для разговорного ИИ
Огромный открытый датасет русской речи
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤2🔥1