#ссылка
#github
Как и для любой сферы, для парсеров есть awesome-репозитории. Иногда про них забываешь https://github.com/BruceDone/awesome-crawler
#github
Как и для любой сферы, для парсеров есть awesome-репозитории. Иногда про них забываешь https://github.com/BruceDone/awesome-crawler
GitHub
GitHub - BruceDone/awesome-crawler: A collection of awesome web crawler,spider in different languages
A collection of awesome web crawler,spider in different languages - BruceDone/awesome-crawler
#ссылка
#github
https://github.com/Hedgehogues/yandex-toloka-parser
Появился yandex-toloka-parser сегодня вечером. Вдруг, кому пригодится. Ничего особенного. Разобрал запросы. Получил апишки. Готово.
#github
https://github.com/Hedgehogues/yandex-toloka-parser
Появился yandex-toloka-parser сегодня вечером. Вдруг, кому пригодится. Ничего особенного. Разобрал запросы. Получил апишки. Готово.
GitHub
GitHub - Hedgehogues/yandex-toloka-parser: This parser extracts all info about your workers via private API
This parser extracts all info about your workers via private API - GitHub - Hedgehogues/yandex-toloka-parser: This parser extracts all info about your workers via private API
#ссылка
#github
https://github.com/Hedgehogues/kaggle-parser
Ещё один парсер. Он умеет собирать данные с kaggle.com
#github
https://github.com/Hedgehogues/kaggle-parser
Ещё один парсер. Он умеет собирать данные с kaggle.com
GitHub
GitHub - Hedgehogues/kaggle-parser: This parser will allow you to get all users out of the competition. But you will need a proxy…
This parser will allow you to get all users out of the competition. But you will need a proxy, since kaggle blocks frequent calls to the user service - GitHub - Hedgehogues/kaggle-parser: This pars...
#ссылка
#github
Сбор данных через консоль браузера с помощью js скрипта
Пример реализации парсера подписчиков и подписок instagram
https://github.com/leoneedpro/instagram-parser
#github
Сбор данных через консоль браузера с помощью js скрипта
Пример реализации парсера подписчиков и подписок instagram
https://github.com/leoneedpro/instagram-parser
GitHub
GitHub - leoneedpro/instagram-parser: Парсер аккаунтов подписчиков и подписок в Instagram на основе прокрутки списков
Парсер аккаунтов подписчиков и подписок в Instagram на основе прокрутки списков - leoneedpro/instagram-parser
#ссылка
#github
https://github.com/GRAAL-Research/deepparse
Ещё одна библиотечка для разбора адресов. Русского, к сожалению, нет.
#github
https://github.com/GRAAL-Research/deepparse
Ещё одна библиотечка для разбора адресов. Русского, к сожалению, нет.
GitHub
GitHub - GRAAL-Research/deepparse: Deepparse is a state-of-the-art library for parsing multinational street addresses using deep…
Deepparse is a state-of-the-art library for parsing multinational street addresses using deep learning - GRAAL-Research/deepparse
#ссылка
#github
Я очень люблю библиотеку ferret для парсинга. Спасибо Тиму Воронову за её создание. Основная фишка её в том, что происходит разделение логики извлечения данных с html-страницы и кода (бизнес-логики). Это позволяет оперативно исправлять парсеры без передеплаивания системы, а также позволяет легко тестировать их.
До недавнего времени эта библиотека была доступна только на golang. Но я сделал c-библиотеку и теперь её можно использовать на python. На python портирован пока что лишь ограниченный функционал, но Вы уже можете попробовать её использовать
https://github.com/MontFerret/pyfer
#github
Я очень люблю библиотеку ferret для парсинга. Спасибо Тиму Воронову за её создание. Основная фишка её в том, что происходит разделение логики извлечения данных с html-страницы и кода (бизнес-логики). Это позволяет оперативно исправлять парсеры без передеплаивания системы, а также позволяет легко тестировать их.
До недавнего времени эта библиотека была доступна только на golang. Но я сделал c-библиотеку и теперь её можно использовать на python. На python портирован пока что лишь ограниченный функционал, но Вы уже можете попробовать её использовать
https://github.com/MontFerret/pyfer
GitHub
GitHub - MontFerret/pyfer: Python wrapper for Ferret
Python wrapper for Ferret. Contribute to MontFerret/pyfer development by creating an account on GitHub.
#ссылка
#github
https://github.com/openvenues/libpostal
Замечательная библиотека для структурирования адресов. Реализована на основе OSM. Т.е. из сырой строки она получает полноценный адрес. В том, числе и на русском. К моему большому удивленю, до сих пор жива.
#github
https://github.com/openvenues/libpostal
Замечательная библиотека для структурирования адресов. Реализована на основе OSM. Т.е. из сырой строки она получает полноценный адрес. В том, числе и на русском. К моему большому удивленю, до сих пор жива.
GitHub
GitHub - openvenues/libpostal: A C library for parsing/normalizing street addresses around the world. Powered by statistical NLP…
A C library for parsing/normalizing street addresses around the world. Powered by statistical NLP and open geo data. - openvenues/libpostal
#github
Привет, друзья!
Всех тех, кто пользуется или интересуется библиотекой Ferret, приглашаем в новый чат в Телеграмме, где вы можете задать интересующий вас вопрос или просто пообщаться!
https://t.iss.one/montferret_chat
А ещё есть телеграм-канал, в котром будут публиковаться новости
https://t.iss.one/montferret
Привет, друзья!
Всех тех, кто пользуется или интересуется библиотекой Ferret, приглашаем в новый чат в Телеграмме, где вы можете задать интересующий вас вопрос или просто пообщаться!
https://t.iss.one/montferret_chat
А ещё есть телеграм-канал, в котром будут публиковаться новости
https://t.iss.one/montferret
#github
Библиотека, которая умеет делать запросы и разбирать полученный html.
https://github.com/psf/requests-html
Библиотека, которая умеет делать запросы и разбирать полученный html.
https://github.com/psf/requests-html
GitHub
GitHub - psf/requests-html: Pythonic HTML Parsing for Humans™
Pythonic HTML Parsing for Humans™. Contribute to psf/requests-html development by creating an account on GitHub.
#github
https://github.com/sdushantha/tmpsms
Если Вы хотите обезопасить Ваш номер и не регистрироваться на сомнительных ресурсах, специально для Вас есть утилита
https://github.com/sdushantha/tmpsms
Если Вы хотите обезопасить Ваш номер и не регистрироваться на сомнительных ресурсах, специально для Вас есть утилита
GitHub
GitHub - sdushantha/tmpsms: A temporary SMS utility right from your terminal written in POSIX sh
A temporary SMS utility right from your terminal written in POSIX sh - sdushantha/tmpsms
#github
Ещё одна интересная библиотека. JS-интерпретатор на golang. Но, к сожалению, давно не развивается.
https://github.com/robertkrimen/otto
Ещё одна интересная библиотека. JS-интерпретатор на golang. Но, к сожалению, давно не развивается.
https://github.com/robertkrimen/otto
GitHub
GitHub - robertkrimen/otto: A JavaScript interpreter in Go (golang)
A JavaScript interpreter in Go (golang). Contribute to robertkrimen/otto development by creating an account on GitHub.
#github
puppeteer plugin
https://github.com/berstend/puppeteer-extra/tree/master/packages/puppeteer-extra-plugin-stealth
puppeteer plugin
https://github.com/berstend/puppeteer-extra/tree/master/packages/puppeteer-extra-plugin-stealth
GitHub
puppeteer-extra/packages/puppeteer-extra-plugin-stealth at master · berstend/puppeteer-extra
💯 Teach puppeteer new tricks through plugins. Contribute to berstend/puppeteer-extra development by creating an account on GitHub.
#github
JavaScript to Python Translator & JavaScript interpreter written in 100% pure Python
https://github.com/PiotrDabkowski/Js2Py
JavaScript to Python Translator & JavaScript interpreter written in 100% pure Python
https://github.com/PiotrDabkowski/Js2Py
GitHub
GitHub - PiotrDabkowski/Js2Py: JavaScript to Python Translator & JavaScript interpreter written in 100% pure Python🚀 Try it online:
JavaScript to Python Translator & JavaScript interpreter written in 100% pure Python🚀 Try it online: - PiotrDabkowski/Js2Py