Некоторое — уже значительное — время назад Observable проводили мастер-класс по анализу временных рядов с использованием Observable Notebooks, понятное дело. Доступны материалы — запись трансляции на YouTube и собственно ноутбуки с данными и примерами: https://observablehq.com/@observablehq/timeseries-workshop-materials
Хочу отметить, что мастер-класс был посвящён именно анализу, а не моделированию (ARIMA и т.п.) и предсказанию. При этом, основные инструменты анализа — грамотная группировка данных и подходящая визуализация. Для любителей хардкорного статистического численного анализа такой подход может показаться "детским", но тем не менее, демонстрируется пара приёмов, полезных перед применением "статистического хардкора" и после — для донесения результатов до "заинтересованных неспециалистов", в том числе в виде красивых визуализаций.
#datascience #analysis #visualization #timeseries
Хочу отметить, что мастер-класс был посвящён именно анализу, а не моделированию (ARIMA и т.п.) и предсказанию. При этом, основные инструменты анализа — грамотная группировка данных и подходящая визуализация. Для любителей хардкорного статистического численного анализа такой подход может показаться "детским", но тем не менее, демонстрируется пара приёмов, полезных перед применением "статистического хардкора" и после — для донесения результатов до "заинтересованных неспециалистов", в том числе в виде красивых визуализаций.
#datascience #analysis #visualization #timeseries
Observablehq
Workshop Materials: Analyzing Time Series Data
Introduction This three-part hands-on tutorial is based on the techniques and concepts put forth in the Analyzing Time Series Data articles. Each part guides you through implementing essential data visualization techniques for time series analysis. The live…
AlexTCH
Некоторое — уже значительное — время назад Observable проводили мастер-класс по анализу временных рядов с использованием Observable Notebooks, понятное дело. Доступны материалы — запись трансляции на YouTube и собственно ноутбуки с данными и примерами: ht…
Ну и некоторая "выжимка" из этих приёмов визуализации была — снова значительное время назад — опубликована в блоге Stack Overflow: https://stackoverflow.blog/2022/03/03/stop-aggregating-away-the-signal-in-your-data/
#datascience #analysis #visualization
#datascience #analysis #visualization
Stack Overflow Blog
Stop aggregating away the signal in your data
By aggregating our data in an effort to simplify it, we lose the signal and the context we need to make sense of what we’re seeing.
It was recommended to me, the book "Introduction to Statistical Learning":
https://hastie.su.domains/ISLR2/
and the lectures based on it:
https://www.youtube.com/watch?v=5N9V07EIfIg&list=PLOg0ngHtcqbPTlZzRHA2ocQZqB1D_qZ5V
The lectures seem pretty fun. 😊
#statistics #datascience #book #lectures
https://hastie.su.domains/ISLR2/
and the lectures based on it:
https://www.youtube.com/watch?v=5N9V07EIfIg&list=PLOg0ngHtcqbPTlZzRHA2ocQZqB1D_qZ5V
The lectures seem pretty fun. 😊
#statistics #datascience #book #lectures
YouTube
StatsLearning Lecture 1 - part1
❤1
https://percival.ink/
It's essentially ObservableHQ, but with Datalog instead of JS while reusing the same plotting libraries. Genius.
#datascience #visualization #notebook
It's essentially ObservableHQ, but with Datalog instead of JS while reusing the same plotting libraries. Genius.
#datascience #visualization #notebook
percival.ink
Percival • Web-based, reactive Datalog notebooks
Percival is a declarative data query and visualization language for exploring complex datasets, producing interactive graphics, and sharing results.
https://www.trymito.io/
Or maybe
(Paraphrasing https://en.wikipedia.org/wiki/Jamie_Zawinski#Zawinski's_Law and https://en.wikipedia.org/wiki/Greenspun%27s_tenth_rule if you didn't recognize them at once. 😊)
Though curious thing about this tool is that it generates Python code that performs transformations you specify in the spreadsheet. Advantages are obvious. Would be super cool if it could synchronize the other way round, but it can't unfortunately.
#datascience #jupyter #python
Every Data Analysis platform attempts to expand until it includes a Spreadsheet. Those platforms which cannot so expand are replaced by ones which can.
Or maybe
Any sufficiently complicated Data Analysis platform contains an ad hoc, informally-specified, bug-ridden, slow implementation of half of Excel.
(Paraphrasing https://en.wikipedia.org/wiki/Jamie_Zawinski#Zawinski's_Law and https://en.wikipedia.org/wiki/Greenspun%27s_tenth_rule if you didn't recognize them at once. 😊)
Though curious thing about this tool is that it generates Python code that performs transformations you specify in the spreadsheet. Advantages are obvious. Would be super cool if it could synchronize the other way round, but it can't unfortunately.
#datascience #jupyter #python
www.trymito.io
Best Python Spreadsheet Automation & Code Generation | Mito
Mito is the fastest way to do Python data science. Edit your data in a spreadsheet, and generate Python code automatically.
https://imgur.com/a/rnATR7D
A flowchart guiding a regression model construction out of bunch of variables. Touches subtle causal issues.
#statistics #datascience
A flowchart guiding a regression model construction out of bunch of variables. Touches subtle causal issues.
#statistics #datascience
Imgur
A Flowchart for Constructing a Regression Model
Post with 1582 views. A Flowchart for Constructing a Regression Model
https://lost-stats.github.io/
"LOST is a Rosetta Stone for statistical software"
Or "Rosetta Code". Useful reference either way.
#statistics #datascience
"LOST is a Rosetta Stone for statistical software"
Or "Rosetta Code". Useful reference either way.
#statistics #datascience
https://econml.azurewebsites.net/spec/spec.html
The EconML Python SDK, developed by the ALICE team at MSR New England, incorporates individual machine learning steps into interpretable causal models.
Pretty cool. Docs feature introduction into the topic and the methods.
#datascience #causalinference #machinelearning
The EconML Python SDK, developed by the ALICE team at MSR New England, incorporates individual machine learning steps into interpretable causal models.
Pretty cool. Docs feature introduction into the topic and the methods.
#datascience #causalinference #machinelearning
Ещё одна книжка от ДМК про #causalinference
https://dmkpress.com/catalog/computer/data/978-5-93700-365-2/
"Причинно-следственный анализ в науке о данных"
Несмотря на #datascience в названии, в большей степени является введением в Causal Machine Learning (#CausalML) в целом и DoubleML в частности. Что? вообще-то? хорошо и интересно.
В любом случае, автор делает акцент на вопросах практического применения статистического вывода причин и эффектов, в каких случаях он подходит, а в каких — нет, и что делать чтобы подходил хорошо и давал осмысленные (и обоснованные) результаты. В частности, подробно обсуждается A/B тестирование.
Для этого в книге даётся много примеров кода на R и Python.
Одновременно с этим рассматриваются более "классические" методы, такие как инструментальные переменные, difference-in-differences, propensity scores и causal graphs a-la Judea Pearl (вместе с понятием d-separation).
Автор не чурается математики, и в приложениях приводит доказательства ряда "технических" статистических теорем о свойствах рассматриваемых методов.
Некоторые сомнения вызывает вопрос перевода технических и статистических терминов, как и корректность словосочетания "краткое главление". Но есть надежда, что ещё успеют исправить хотя бы опечатки.
https://dmkpress.com/catalog/computer/data/978-5-93700-365-2/
"Причинно-следственный анализ в науке о данных"
Несмотря на #datascience в названии, в большей степени является введением в Causal Machine Learning (#CausalML) в целом и DoubleML в частности. Что? вообще-то? хорошо и интересно.
В любом случае, автор делает акцент на вопросах практического применения статистического вывода причин и эффектов, в каких случаях он подходит, а в каких — нет, и что делать чтобы подходил хорошо и давал осмысленные (и обоснованные) результаты. В частности, подробно обсуждается A/B тестирование.
Для этого в книге даётся много примеров кода на R и Python.
Одновременно с этим рассматриваются более "классические" методы, такие как инструментальные переменные, difference-in-differences, propensity scores и causal graphs a-la Judea Pearl (вместе с понятием d-separation).
Автор не чурается математики, и в приложениях приводит доказательства ряда "технических" статистических теорем о свойствах рассматриваемых методов.
Некоторые сомнения вызывает вопрос перевода технических и статистических терминов, как и корректность словосочетания "краткое главление". Но есть надежда, что ещё успеют исправить хотя бы опечатки.
Dmkpress
Причинно-следственный анализ в науке о данных
Купить книгу «Причинно-следственный анализ в науке о данных», автора Роберт Алекс Руис де Вилья в издательстве «ДМК Пресс». Выгодные цены в Москве, доставка. Заказать книги и учебники на официальном сайте издательства.
👎1