Статистика и R в науке и аналитике
4.1K subscribers
39 photos
80 links
Всем привет!
Подробнее о канале со списком самого интересного: https://t.iss.one/stats_for_science/108
Чат канала: https://t.iss.one/chat_stats_for_science
По всем вопросам - @lena_astr
Download Telegram
Продолжение серии постов про бутстреп.

Сегодня разберем более подробно, как именно применяется бутстреп для сравнения двух выборок между собой.

https://telegra.ph/Primenenie-butstrepa-dlya-sravneniya-vyborok-12-10

Важное напоминание - бутстреп не является спасением от маленьких выборок и более чувствителен к репрезентативности исходного набора данных, чем тот же тест Манна-Уитни, и на это нужно обращать внимание при работе с данным методом.

#bootstrap #stat_hard
Решила ввести небольшую систему хештегов, с распределением по теме и сложности материала
🔥2
Небольшое дополнение к материалам про бутстреп, на этот раз понятное интерактивное объяснение принципа действия (в первом видео), а во втором применение бутстрепа для оценки p-value при тестировании гипотез. В данном случае гипотеза о том, действует ли препарат на группу испытуемых.
Этот принцип расширяется на сравнение групп, описанный в предыдущем посте, так же здесь более подробно объясняется идея центрирования данных. Посмотрите, думаю, будет интересно.

https://www.youtube.com/watch?v=Xz0x-8-cgaQ
https://www.youtube.com/watch?v=N4ZQQqyIf6k

В целом рекомендую этот канал, очень качественные материалы о статистике, машин лернинге и даже биоинформатике, например, здесь очень неплохо разобран материал про RNA-seq: дифференциальная экспрессия (DESeq2, edgeR), методы нормировки (FPKM, TPM) и некоторые другие аспекты.

#bootstrap #stat_hard #recommendation
🔥1
На прошлой неделе ушел из жизни Дэвид Кокс (Cox), великий британский статистик, в возрасте 97 лет.
https://en.memesrandom.com/david-cox/

Мне кажется, что он известен широкой общественности чуть меньше, чем того заслуживал, поскольку именно он сформулировал логистическую регрессию, proportional hazards model (думаю, можно перевести как модель отношения рисков), а также Cox process, являющийся общим случаем распределения Пуассона.
Кроме того, он является одним из соавторов Бокс-Кокс (Box-Cox) трансформации, уже упомянутой на этом канале в одном из первых постов.

Признаюсь, я сама узнала буквально только что, что теория логистической регрессии была изобретена именно им. Возможно, сделаю парочку постов с объяснением сути логистической регрессии и чем она замечательна (кстати, логистическая регрессия это не регрессия, а метод классификации).
Подборка материалов по освоению языка программирования R

Книги:
1. R in a Nutshell
неплохая книга для того чтобы начать знакомство с R, разбираются базовые концепции языка, необходимые для работы с ним (основные типы объектов, функции, ввод и вывод данных). Далее есть довольно значительный разбор применения R именно для анализа данных. Книгу рекомендую для в первую очередь пользователей R (а не разработчиков).
UPD: похоже, что книга немного устарела

2. R in action

Кроме того, есть перевод книги на русский язык, у меня кстати есть бумажная версия, я ее почти дочитала, мне очень понравился подробный разбор статистических моделей и методов. С одной стороны он был недостаточно подробен, чтобы перейти на сухой язык формул, но достаточно доходчив, хотя и рассчитан, пожалуй, для не новичков в статистике. Примеры применения например перестановочных и бутстреп тестов в R тоже порадовали.
Бумажную версию можно купить здесь:
https://dmkpress.com/catalog/computer/statistics/978-5-94074-912-7/

3. R for Data Science
Соавтор этой книги Хадли Викхам (Hadley Wickham), разработчик среды/экосистемы tidyverse, разработчик IDE R Studio и вообще один из центральных игроков в развитии R как языка программирования. Книга эта, как следует из названия, подходит для т.н. датасаенса, то есть для всяческой работы с данными: анализ, визуализация, проверка статистических гипотез. У меня книга пока в списке для чтения.

4. Advanced R
Книга предназначена больше для программистов, для тех кто собирается погрузиться в разработку языка, здесь объясняется почему при выполнении определенных действий происходит так, а не иначе. Подробно разбирается ООП-парадигма программирования в языке R: основные классы, S3, S4, R6. Планирую разобраться с классами в R и с принципом метапрограммирования.

5. Введение в язык программирования R
https://textbook.rintro.ru/index.html
Одна из немногих книг на русском языке про R, на мой взгляд, подойдет для знакомства с языком и для дальнейшего продвижения, поскольку в ней затрагиваются довольно продвинутые вещи. Более детально смогу оценить, когда прочитаю сама)

6. Книга Ивана Позднякова "Анализ данных и статистика в R". Очень крутая, всем рекомендую! https://pozdniakov.github.io/tidy_stats/index.html

Курсы:
На степике
Очень люблю эту платформу, поэтому советовать буду на основании личного опыта прохождения курсов.
https://stepik.org/course/129 Анализ данных в R
https://stepik.org/course/724 Анализ данных в R. Часть 2.
Оба курса от Анатолия Карпова, замечательные курсы с бОльшим акцентом на анализ данных
https://stepik.org/course/497 Основы программирования на R
Не менее хороший курс, а может и более, поскольку здесь разбираются темы, более актуальные для разработки. Это неудивительно, потому что автор курса опирался в том числе на вышеупомянутую книгу Advanced R.

Кроме того, существуют курсы на курсере, но про их качество я точно сказать не смогу.

Пишите комментарии, какие курсы проходили и какие книги читали, а также советуйте свои источники, будем пополнять информацию!

#literature #R #recommendation
👍11
Channel name was changed to «Статистика и R»
Всем привет! Давненько тут не было постов, исправляюсь. На этот раз предлагаю подборку обучающих материалов по статистике с моими очень ценными комментариями и мнениями о них)

Книги:
1. Статистика и котики. Информация например здесь
Книгу все советуют для новичков в статистике, признаться, я сама ее прочитала уже спустя некоторое время работы со статистикой, поэтому мне было особенно легко ее воспринимать. Книга действительно очень забавная, написана приятным языком, мне понравилось. Однако могу отметить, что более сложные темы стат анализа, например про факторный анализ написано скорее запутанно, чем понятно, поэтому я бы тоже рекомендовала книгу именно новичкам в статистике.

2. Голая статистика. Информация здесь
Эту книгу тоже советуют новичкам, ее я не читала, но судя по отзывам, там довольно простой стиль изложения, многим нравится.

3. Медико-биологическая статистика Гланца. Скачать здесь https://medstatistic.ru/articles/glantz.pdf
Относительно неплохая книга, раньше тоже советовали начинающим статистикам-биологам и медикам, особенно когда не было вышеприведенных книг. Здесь чуть более строгий язык повествования, но все еще не перегруженный формулами и терминами. Существенный минус - книжка старая, здесь нет описания поправок на множественное тестирование FDR.

4. Теория вероятностей и математическая статистика, Гмурман В.Е. https://lib.maupfib.kg/wp-content/uploads/2015/12/Teoria_veroatnosty_mat_stat.pdf
Книга уже чуть более сложная, помимо базовых вещей, здесь разобрано про Монте-Карло пермутационные тесты и немного про скрытые марковские модели.

5. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. В.К. Шитиков, Г.С. Розенберг
https://www.ievbras.ru/ecostat/Kiril/Article/A32/Starb.pdf
Это уже немного в сторону от базовых вещей в статистике, здесь действительно целая книга, посвященная применению бутстрепа для анализа данных. Не могу похвастаться что осилила ее, но мне очень понравилось введение про сам принцип, во многом опиралась на него, пока писала про бутстреп на канале. Очень рекомендую почитать тем, кто интересуются бутстрепом.

6. Statistics in a Nutshell, Sarah Boslaugh. Издательство O'Reilly.
Нашла ссылку только на первое издание https://theswissbay.ch/pdf/Gentoomen%20Library/Maths/Statistics/OReilly.Statistics.in.a.Nutshell.A.Desktop.Quick.Reference.Aug.2008.pdf
Есть перевод на русский, говорят неплохой, но находили неточности в переводе. Мне кажется именно эта книга должна быть мастхев для интересующихся и работающих со статистикой людей, потому что здесь есть баланс между простым языком изложения и в то же время не поверхностным.
Единственное, что вызвало у меня недоумение, это отсутствие главы про поправки на множественное тестирование вообще, хотя книга относительно новая. Зато здесь есть много других очень важных вещей, например принципы планирования исследования, анализ мощности стат тестов, работа с пропущенными значениями и тп. Сама планирую приобрести бумажную версию книги.

Курсы:
Здесь все просто, советую три курса по статистике на степике от Анатолия Карпова
https://stepik.org/course/76/syllabus
https://stepik.org/course/524/syllabus
https://stepik.org/course/2152/syllabus
курсы замечательные, именно с первой части курса я перестала бояться и начала осваивать статистику. Думаю, все и так про них наслышаны, я присоединяюсь к позитивным отзывам и рекомендациям.
Есть еще вот такой курс, Математическая статистика
https://stepik.org/course/326/syllabus
Это курс для продвинутых, я его пока не прошла, но когда-нибудь соберусь.

Пишите комментарии, что читали и проходили, понравилось или нет, а также добавляйте свои материалы!

#literature #base_stat #recommendation #stat_hard
👍181
Небольшой апдейт к предыдущему посту. В одном биоинформатическом чате в пух и прах раскритиковали курсы Карпова за неточности в описании центральной предельной теоремы (ЦПТ) и о требованиях к данным для применения корреляции Пирсона. Почитать можно здесь: несколько грубовато, но ошибки разобраны. Ошибки в курсе уже исправлены, спасибо воинам статистики за то что стоят на страже истины!
В ходе дискуссии я вспомнила про статквест, который уже ранее упоминала на канале:
https://www.youtube.com/c/joshstarmer/videos
Очень хорошо разобран материал про статистику, машинное обучение, статистические модели в рнк-секах и не только.

Курс от курсеры очень рекомендовал вышеупомянутый воин статистики
https://www.coursera.org/specializations/statistics
Как ни странно, с моего аккаунта курсеры, привязанного к университету (НГУ), мне удалось получить доступ к материалам курса. Однако при попытке зарегистрировать новый аккаунт, мне сообщили что не предоставляют услуги для юзеров в санкционных странах. Так что да, курсеру уже так просто не пройти, к сожалению. Посмотрела программу, вроде бы да, очень достойно выглядит. Еще понравилось, что там есть предустановленная среда R со всеми нужными пакетами, можно кодить прямо в браузере без необходимости установки R себе (вдруг у кого есть сложности с этим).

Кроме того, небольшое дополнение к посту про R:
https://textbook.rintro.ru/ учебник по языку R на русском (!), мне кажется очень годный. Понравилась глава про историю языка, пока прочитала только ее, довольно любопытно осознавать контекст, в котором развивался язык. Первые три четверти книги вроде бы для начинающих пользователей, а дальше уже про ООП, работу с памятью, производительностью кода - то есть материал скорее для программистов.
И еще вот подборка материалов из чата по R
https://t.iss.one/hotlineR_EU/7692

#literature #R #recommendation
🥰3👍2
Скачиваем курсы с курсеры без регистрации и смс

Всем привет!
Может быть, напрямую не относится к теме канала, но я думаю, что проблема закрытия доступа к курсере волнует многих, поэтому делюсь способом, как можно скачать курсы оттуда.
Нашла питоновскую библиотеку: https://github.com/coursera-dl/coursera-dl которая позволяет скачивать все материалы: видео лекций, текстовые файлы, задания (правда без возможности проверить ответы).

Пара рекомендаций по установке и использованию, по крайней мере для Windows 10:
1) Лучше начинать с установки зависимостей в файле requirements.txt (команда
pip install -r requirements.txt
, запущенная из anaconda prompt).
2) После установки зависимостей устанавливается сама программа:
pip install coursera-dl
(тоже из консоли anaconda prompt).
3) Для корректной работы скачивания мне понадобилось создать в директории для скачивания файл-конфиг с указанием юзернейма, пароля, языка субтитров и самое главное - хеш cauth, инструкцию к нахождению которого можно найти здесь. Это что-то связанное с куками в браузере, у меня все равно не получилось выгрузить список курсов, но по крайней мере загрузка работает.
4) Скачивается конкретный курс просто:
coursera-dl bioinformatics
, где bioinformatics название курса. Название можно посмотреть на самом сайте курса в адресной строке, написано между /learn/.../home/welcome: https://www.coursera.org/learn/bioinformatics/home/welcome
5) Еще для корректного скачивания нужно обновить дедлайны по курсу (просто на сайте из браузера), иначе могут быть ошибки со старыми курсами, которые не до конца пройдены.

Вот примерно и все, скачивается все довольно быстро, раскладывается по папкам, есть субтитры и другие необходимые вещи, только конечно не будет проверки квизов и получения сертификатов)

Делитесь информацией с другими, что есть такой довольно легкий и удобный способ сохранить знания!

UPD: еще забросила в комменты пример конфиг файла для скачивания с английскими и русскими субтитрами
#coursera #recommendation #learn
🔥134😱1
Пятничный мем

Поставьте себя на место менеджера балабановской спичечной фабрики, который утверждает, что количество спичек в одном коробке, выпускаемом на фабрике, варьирует в пределах 60-61 спичек.
Один из клиентов жалуется, что в недавней поставке спичек их было то 58, то 62 в одном коробке, так что вы решили взять выборку из коробков и посчитать в них спички, чтобы оценить, сколько из них соответствует стандарту.
Вы проведете двусторонний Z-критерий, чтобы проверить вашу гипотезу о том, что 95 процентов коробков соответствуют указанным стандартам.
Вопрос: какая нулевая гипотеза о том, кто же все-таки сумасшедший?

#stat_fun

Дорогие подписчики, я все еще готовлю пост о разборе программы статистика, но разбор оказался сложнее, чем я думала, надеюсь за выходные успею закончить.
👍13😁3🤔2🤯1🤬1
Долгожданный разбор программы Statistica готов!

Ознакомиться можно по ссылке:
https://telegra.ph/Razbor-programmy-Statistica-04-28

Когда я его задумывала, ни за что бы не предположила, что уйдет почти два месяца на разбор, понимание и написание. Более того, оказалось, что часть вещей не удалось осветить, чтобы не перегружать текст еще больше, поэтому это останется на другой раз, например, когда буду разбирать суть двухфакторного дисперсионного анализа (ановы).

Пожалуйста, распространяйте по своим чатам, пишите комментарии, замечания, мне бы очень хотелось, чтобы как можно больше людей ознакомились с разбором.

Скоро будет простой пост о недостатках среднего и стандартного отклонения как мер центральной тенденции и разброса, так что не переключайтесь.

#stat_hard #analysis
👍13🔥6👏3🤯1
Предложение подработки для тех кто разбирается в статистике и R от Бластима.

Для тех, кто разбирается в R, статистике и анализе данных также есть возможность онлайн подработки в даты с 27 июня — 7 июля по будням (9 дней) с 10:00 до 18:30. Нужно будет помогать людям преодолеть страх перед кодингом и освоить язык программирования R :)

По вопросам можно писать @korzhks
Я сама тоже записалась на помощь с проведением очных занятий в Москве, посмотрим как пройдет, пока мне очень нравится идея и программа занятий у ребят от Бластима.
А также еще не поздно записаться на саму программу, есть возможность очного и онлайн участия
👍3
Отзыв о курсе бластим по анализу данных в R

Я съездила на курсы в Москву в качестве технического ассистента, суть работы в том, чтобы помогать участникам, когда у них отвалится очередной R пакет при установке, не будет работать какая-то функция и другие подобные вещи. Сказать по правде, я и так в рабочее (и иногда в нерабочее) время постоянно помогаю коллегам и друзьям с отвалившимися пакетами, так что было приятно, что за это еще и платят. Сам курс был организован на высоком техническом уровне, лектор был онлайн, была очная аудитория и онлайн участники. Я помогала преимущественно в зале, но и в онлайне тоже, когда успевала отвечать.
Для меня было полезным подтянуть и систематизировать кое-какие вещи про R, например наконец-то перестать гуглить каждый раз how to reshape data from wide to long format R (правда, я еще не успела проверить, но думаю, что с синтаксисом pivot_longer/pivot_wider у меня больше не будет таких проблем).
Атмосфера на курсах была очень классной, познакомилась с кучей крутых ребят, заценила сидрерию в Москве.
Однозначно рада проведенному времени и могу порекомендовать курс к участию, особенно для среднего уровня (для совсем новичка возможно будет тяжеловато). А если вы уже разбираетесь в статистике и R, то советую посетить курс как технический ассистент, очень любопытный опыт.


По моему мнению, курс преимущественно настроен на все-таки ненулевой опыт, например, даже поверхностное знание другого языка программирования уже будет ненулевым уровнем. Мне показалось, что небольшой опыт работы в R и/или с другим языком программирования очень способствовал эффективному обучению, поскольку совсем с нулевым бэкграундом, возможно, было тяжеловато. Продвинутые вещи тоже разбирались, но боюсь, что они могли эффективно усвоиться при знании, что такое бывает (например, Бокс-Кокс трансформация). Но наверное, суть в том, что даже если при прохождении курса часть вещей не воспринялась, то по крайней мере появилось понимание, какие продвинутые темы в статистике и R бывают, и поскольку доступ к материалам сохраняется, никто не помешает вернуться к этому, когда уже будет необходимость.

Возможно, с предыдущим абзацем могут не согласиться остальные преподаватели, но я так считаю, исходя из опыта общения с участниками. Кто из участников читает, напишите в комментариях, что думаете по этому поводу.

А еще в процессе курса я вспомнила один смешной момент. Я в апреле ездила на курсы Сириуса, где преподавала математическое моделирование, и на семинаре я использовала R-пакет для генерации паттернов Тьюринга. И естественно, все пакеты отвалились при установке у половины участников и мне понадобилось вручную починить их, я в шутку заметила, что могла бы вести курсы по установке пакетов в R. Ну и так и случилось. Но, конечно, курсы по установке пакетов это уже чересчур, хотя я например считаю, что у нас в НГУ не хватает курса по R. Однако, это уже тема для отдельного обсуждения, с начальством)

В общем, курс от бластима я рекомендую, если есть вопросы, пишите

#feedback #recommendation #blastim
15🔥7
Компания RStudio переименовывается в posit

Вчера на rstudioconf было анонсировано, что компания RStudio (именно компания, IDE RStudio сохранит прежнее название) меняет название на posit, чтобы больше привлекать пользователей/разработчиков других языков программирования, в частности Python, Julia. Сначала мне показалось, что сами создатели арстудио и тайдиверса и много чего еще открещиваются от языка, но тогда я думала, что еще и IDE переименуют, а оказалось, что только компанию. Может, это и неплохой ход, чтобы привлечь больше программистов, чтобы не было связи с R в названии. Но пока меня это все равно скорее огорчает, посмотрим, насколько позитивно скажется переименовывание.

Кроме того, анонсировали shiny для python. Для меня это не так важно, потому что я еще собираюсь освоить shiny для R, даже недавно купила бумажную книгу Mastering Shiny в переводе Александра Гинько. Но в целом это здорово, насколько мне известно, до настоящего момента не было аналогов shiny для питона. Небольшое пояснение: shiny - это пакет для создания веб-приложений, веб-страниц напрямую из R. Для биологов/биоинформатиков мне очень например нравится idep и shinyGO для анализа дифференциальной экспрессии данных RNA-seq и функциональной аннотации, соответственно. Здесь реализованы очень классные вещи с точки зрения анализа, и это очень классный пример того, зачем нужны shiny apps.

Пока из показавшихся мне важными новостей rstudioconf все, можно следить в твиттере по хештегу, а также на сайте самой конференции.

#R
👍9
Советы для эффективной организации работы в R

Опрос показал, что очень малый процент подписчиков использует проекты в RStudio (19%), это меньше чем процент людей, не пользующихся R (23%).

Поэтому я написала небольшой пост с набором рекомендаций о работе в R.

https://telegra.ph/R-how-to-organize-work-08-08

Об этом к сожалению не всегда рассказывают на курсах, например ар-проекты я начала применять спустя 5 лет после начала работы с R (стыдно признать).
Также собрала лайфхаки для удобной работы и ссылки, чтобы двигаться в правильном направлении.
Бонусом презентация о правильном наименовании файлов, которая будет полезна вообще всем, не только пользователям R.


И еще я обновила рекомендуемую литературу по R классной книгой Ивана, которая к тому же на русском языке. Очень радует, что русскоязычное R-сообщество развивается и появляются книги, посвященные языку!

#R #lifehack #literature
👍18🔥61
Вчера был день рождения у автора канала - Лены. Лена выбрала крутую тему и интересно её раскрывает, особенно классно смотреть не только на авторские тексты, но и рисунки :D А ещё с Леной круто играть в Нечто. И ездить куда-нибудь с рюкзаком. У Лены вообще много интересного можно узнать и это прикольно!
Лена, удачи тебе с реализацией твоих таких разных проектов! И успехов в эффективном донесении своих идей до любой аудитории:)
43👍2
Рада представить обновленную программу репетиторства по статистике, R и обработке данных RNA-seq для студентов, научных сотрудников и любых желающих

Цена: 2500 рублей в час (астрономический)
Формат: в основном онлайн, однако для местных желающих можно подумать об организации очных занятий
Студентам скидка 10%

Возможно как изучение интересующих вас тем, так и занятия по программе, приведенной ниже.
В любом случае гарантируется индивидуальный подход к каждому ученику, с учетом бэкграунда и необходимых к изучению тем

Обо мне:
Я закончила бакалавриат и магистратуру факультета естественных наук НГУ, работаю младшим научным сотрудником в институте цитологии и генетики в секторе системной биологии морфогенеза растений. Сейчас на третьем курсе аспирантуры по направлению биоинформатики.
Опыт работы в R: с ~2017 года, тогда же начала изучать статистику, однако скажу честно, что действительно продвинулась в изучении в последние два-три года.
Вообще я конечно очень люблю R, как многие могли заметить, и стремлюсь передать это остальным.

Преподавательский опыт:
* Преподаю семинары по компьютерной транскриптомике (обработке данных RNA-seq) для магистрантов НГУ (ссылочка на программу здесь)
* Работала техническим ассистентом на курсе бластим "Статистика, R и анализ данных", впечатления можно почитать здесь
* В течение последних двух лет консультирую коллег и друзей по вопросам статистики, уже проводила индивидуальные занятия, в основном статистику для медиков, также консультировала по обработке RNA-seq, за отзывами можно к Тане
* Вела кураторские занятия по дифференциальным уравнениям для студентов 2 курса
* Преподавала в летней физматшколе биологию для учеников 10 класса

Приблизительные темы занятий:
* базовый R, считывание данных, препроцессинг, проведение статистических тестов (параметрических, непараметрических), построение графиков (ggplot2)
* tidyverse, а именно использование dplyr, пайпов, stringr для работы со строками, а также purrr для замены циклов и функций семейства apply
* базовая статистика: теория, лежащая в основе статистических тестов, понимание области применения тестов и их ограничения (например у параметрических)
* продвинутая статистика: применение перестановочных тестов как альтернатива классическим
* пайплайн обработки данных RNA-seq: от сырых данных с прибора до списка дифференциально экспрессирующихся генов и дальнейший анализ этих списков
В рамках этих тем почти все на ваш выбор, кроме пожалуй data.table и shiny по R (еще сама изучаю), а также линейных моделей со смешанными эффектами (пока не чувствую компетенции это преподавать).

Обратите внимание! В этот раз НЕ подразумевается формат решения за вас учебных/рабочих задач, я теперь только за обучение, а не за решение вместо.
Пишите по вопросам лично или в комментарии к этому посту, записываться на занятия в личные сообщения.
Еще буду благодарна, если раскидаете по чатам тем, кому это может быть интересно

#R #stat #RNA-seq
🔥21👍111
Приветствую подписчиков, особенно новоприбывших!
Я подготовила инструкцию, как установить и настроить R и RStudio для разных операционных систем.

https://ubogoeva.github.io/R4Analytics/posts/how_to_install_R.html

Инструкция будет полезна для тех, кто только начинает знакомство с этим языком программирования, а также для того чтобы скидывать студентам на курсах)
По своему преподавательскому опыту знаю, что нередко возникают проблемы с установкой библиотек на Ubuntu и с кириллическими путями в Windows, разобрала, что нужно сделать, чтобы это исправить.
Пишите, сталкивались ли вы с подобными или другими сложностями в начале освоения R.

P.S. А еще я научилась наконец-то делать странички на гитхабе и вообще интегрировать Git + R в RStudio

#R #install
🔥22👍8🥰6
Всем привет!

Кто хочет подтянуть знания по статистике и научиться круче анализировать данные в R, рекомендую 9-дневный курс-интенсив "Статистика R и анализ данных" от бластима, начнется 31 октября. Участвовать можно очно (в Москве) или онлайн, оба формата оказались достаточно эффективными.
Но сразу скажу, что если вы будете участвовать онлайн, то готовьтесь, что курсу нужно будет посвящать целый рабочий день, параллельно работать скорее всего не получится. Однако если что-то не успеете посмотреть сразу, организаторы предоставляют неограниченный доступ к видеозаписям курса, так что можно будет пройти в удобное время. Хотя конечно одним из преимуществ таких курсов является возможность задать вопросы лектору, поэтому рекомендую все-таки найти время на полноценное прохождение курса.

⚡️По промокоду ELENASTATR15 можно получить 15% скидку!

Я сама участвовала как технический ассистент в прошлый раз и могу гарантировать, что каждому участнику уделяется достаточно много внимания и помощи в решении конкретно ваших задач. Лектор Иван Поздняков очень крутой, объясняет все максимально понятными словами, с кучей примеров + используя реальные датасеты.

В программе R разбирается с нуля, что подойдет для совсем новичков в программировании, но лектор также рассказывает тонкости и фишки языка R, примерно на уровне Advanced R, что будет интересно и тем, кто более-менее разбирается в R (знаю по своему опыту).
Мне еще нравится в курсе, что почти сразу происходит погружение в tidyverse, как я уже упоминала, это набор пакетов для анализа данных, объединенных общей философией и подходом. Ну и в целом, считается, что в R без тайдиверса сейчас особо делать нечего.

В части по статистике делается акцент на понимании основ статистического вывода и связи методов друг с другом, а также различных тонких моментах применения различных методов. Кто уже пробовал применять статистические тесты в R, наверняка знает, что запускаются они обычно в одну строчку, но сложность заключается в правильной подготовке данных и интерпретации результатов.
Разбор статистики начинается с основ статистического вывода и самых простых тестов (тест Стьюдента например), а заканчивается линейными моделями, методами понижения размерности и другими достаточно серьезными методами. Так что если вы уже не совсем новичок в статистике, но хотите продвинуться в освоении более сложных методов, добро пожаловать на курс!

В этот раз я тоже буду участвовать как технический ассистент онлайн, буду помогать с установкой пакетов, запуском функций и вообще)
Если есть вопросы, пишите в личку

P.S. Основываясь на результатах опроса, я уже готовлю пост по базовой статистике, выйдет в ближайшие несколько дней.
P.P.S. Если не хватает времени на курс, то можно записаться ко мне на индивидуальные занятия, подробности тут.
🔥87👍3🥰1