Parsing Conf
596 subscribers
6 photos
2 videos
14 files
162 links
Data collection conference/meetup

Митап о сборе данных

Тематические объявления и посты бесплатно размещаем


По всем вопросам можно обращаться в чат
https://t.iss.one/joinchat/HvuCPzwpPJHrrDfC
или в личку @NikolayKrupiy @cuda23
Download Telegram
rozetka_notebooks.xml
19.4 MB
#данные

Коллекция компьютеров

Иногда разные данные проскакивают у нас в чате заходите: https://t.iss.one/joinchat/HvuCPzwpPJHrrDfC

src: @realefs
#данные
https://pastukhov.com

Базы ключевых слов/поисковых запросов
Онлайн русская база ключевых слов
Релиз русской базы ключевых слов. База ключевых слов содержит 1.8 миллиарда (1,861,458,630) поисковых запросов по апрель 2021 года с данными Яндекс Вордстат и Яндекс
instagram_comments_ru_1M.csv.zip
75.6 MB
#данные

1М русскоязычных комментариев из Instagram

src
instagram comments 7M.csv.zip
427.1 MB
#данные

7.3M русскоязычных комментов из Instagram

src
techcrunch_articles_links.csv.zip
6.4 MB
#данные

Все 211 000 публикаций Techcrunch с 2005 до наших дней

src
instagram_user_private_2.5M_2021-01-22.csv.zip
361.1 MB
#данные

1 000 000 картинок Инстаграмма

* число лайков, комментов, просмотров
* описание, хештеги
* автор, локация, дата публикации
* ссылки на фотки уже не работают

src
instagram_user_private_2.5M_2021-01-22.csv.zip
361.1 MB
#данные

2 500 000 приватных юзеров инстаграмма

* имя, описание, внешняя ссылка
* аватарка, is_verified?
* число подписок/подписчиков/картинок
* внешние ссылка
* иногда гео, иногда почта, иногда мобила

src
#ресурс
#данные

OrgPage

Один из крупнейших, высокопосещаемых, независимых сайтов, предоставляющий информацию о компаниях и организациях, осуществляющих свою деятельность на территории России и стран СНГ.
#данные

CV

Синтетические данные для моделей машинного обучения

src