В корпоративном блоге Uber Engineering вышла крутая статья с обзором инфраструктуры для хранения, обработки и анализа данных компании Uber. На минуточку, у них сейчас под рукой более 100 петабайт данных → https://eng.uber.com/uber-big-data-platform/
Доклад на Kafka Summit SF 2018 от Martin Kleppmann (автор книги Designing Data-Intensive Applications) под названием "Is Kafka a Database?": https://martin.kleppmann.com/2018/10/17/kafka-summit.html
В блоге Insight Data Science вышла вводная статья про Apache Airflow. Хорошее руководство для начинающих свой путь в построении batch processing jobs → https://bit.ly/2NSWRiF
Forwarded from DevBrain
Нашел солидный вводный курс в экосистему Amazon Web Services на русском языке.
Сейчас без опыта работы хотя бы с одной из облачных систем (AWS, Google Cloud, MS Azure) сложно разрабатывать масштабируемые приложения.
Советую к просмотру, автор проделал титанический труд → https://bit.ly/2yWCJGD
Сейчас без опыта работы хотя бы с одной из облачных систем (AWS, Google Cloud, MS Azure) сложно разрабатывать масштабируемые приложения.
Советую к просмотру, автор проделал титанический труд → https://bit.ly/2yWCJGD
Jack Vanlightly открывает серию постов про внутреннее устройство распределенной Pub-Sub (брокер сообщений) системы под названием Apache Pulsar.
Apache Pulsar была разработана в стенах компании Yahoo, а позже передана под патронаж Apache Foundation. На данный момент выпущена уже 2-я версия системы.
Читать → https://bit.ly/2S51IQX
Apache Pulsar была разработана в стенах компании Yahoo, а позже передана под патронаж Apache Foundation. На данный момент выпущена уже 2-я версия системы.
Читать → https://bit.ly/2S51IQX
Jack Vanlightly
Understanding How Apache Pulsar Works — Jack Vanlightly
I will be writing a series of blog posts about Apache Pulsar, including some Kafka vs Pulsar posts. First up though I will be running some chaos tests on a Pulsar cluster like I have done with RabbitMQ and Kafka to see what failure modes it has and its…
Ярослав Ткаченко, Senior Data Engineer из Activision, на конференции dotScale 2018 рассказал как выглядит их Data Pipeline для игр серии Call of Duty — https://bit.ly/2O5itZf
Также Ярослав ведёт свой личный блог — https://sap1ens.com/
Также Ярослав ведёт свой личный блог — https://sap1ens.com/
В сети стали доступны доклады с прошедшего в Сан-Франциско саммита про Apache Kafka (Kafka Summit)
Смотреть https://bit.ly/2ERVIZs
Смотреть https://bit.ly/2ERVIZs
Confluent
Kafka Summit San Francisco 2018 - Confluent
Confluent, founded by the creators of Apache Kafka, delivers a complete execution of Kafka for the Enterprise, to help you run your business in real time.