Наверняка многие уже видели этот красивый сайт, но у меня лично руки дошли только вчера ночью.
https://seeing-theory.brown.edu/
Здесь собраны анимированные интерактивные картинки, иллюстрирующие разные понятия и даже методы из теории вероятностей и статистики. Очень красиво, качественно. Но изучить что-то по этим картинкам вряд ли получится :)
А вот поиграться — очень интересно.
https://seeing-theory.brown.edu/
Здесь собраны анимированные интерактивные картинки, иллюстрирующие разные понятия и даже методы из теории вероятностей и статистики. Очень красиво, качественно. Но изучить что-то по этим картинкам вряд ли получится :)
А вот поиграться — очень интересно.
seeing-theory.brown.edu
Seeing Theory
A visual introduction to probability and statistics.
Полезняшка юному солюшен архитектору
Если вам, как и мне, проще всего разбираться с новыми понятиями, отталкиваясь от примеров, то вам однозначно стоит ознакомиться с вот этой замечательной статьей о Domain Driven Design:
https://www.mirkosertic.de/blog/2013/04/domain-driven-design-example/
Если вам, как и мне, проще всего разбираться с новыми понятиями, отталкиваясь от примеров, то вам однозначно стоит ознакомиться с вот этой замечательной статьей о Domain Driven Design:
https://www.mirkosertic.de/blog/2013/04/domain-driven-design-example/
www.mirkosertic.de
A Domain-driven Design Example: From Chaos to Clean Architecture
Journey through a real-world transformation from messy Excel sheets to a well-structured domain-driven design solution in body leasing business! See how breaking down a monolithic model into bounded contexts and applying DDD patterns can create magic, while…
А пока наша история с ЦМФ всё никак не закончится (мы всё сдали, но оценок нет и не предвидится в ближайшем будущем), я решил попробовать ставший уже довольно известным курс Data Mining In Action от @kantor_ai и компании.
Вроде как должно быть коротенечко, удалённо и не слишком напряжно. А то сам я никогда это ваше мышиное облучение не сяду ботать.
На самом деле я и на этот курс пару раз заходил, ещё когда учился в универе, но тогда как-то не пошло. Посмотрим, что получится в этот раз.
Вроде как должно быть коротенечко, удалённо и не слишком напряжно. А то сам я никогда это ваше мышиное облучение не сяду ботать.
На самом деле я и на этот курс пару раз заходил, ещё когда учился в универе, но тогда как-то не пошло. Посмотрим, что получится в этот раз.
Расскажу немного про первые впечатления от DMIA
Для того, чтобы попасть на курс, нужно было пройти довольно-таки несложный тест. В тесте задачки на (не самый) простой матанализ (градиенты, условные оптимизации), немножко линейной алгебры, немножко _очень_ базовой прикладной статистики, щепотка теории вероятностей и совсем крохи пайтона. Ограничения по времени нет — я нещадно гуглил и вообще решал два дня и вместе с другом-однокурсником. Прошел, как всегда, по краю — набрал минимальный проходной балл 🙃.
Любопытно, что была и вторая часть, в которой проверялось знание основ машинного обучения, чтобы те, кому будет скучно, не занимали места. Во второй части я тоже прошел по краю — на балл меньше допустимого максимума (подрандомило).
Судя по табличкам с результатами, желающих попасть на курс было около 500 человек, а взяли примерно 45-50. Так что задание по сложности было составлено близко к идеалу. Состав задания Виктор объяснил тем, что одних олимпиадников-математиков видеть на курсе не очень хочется, это все-таки не тот профиль, но работать приятнее с людьми, обладающими математической культурой.
Курсы бесплатные, преподаватели работают в собственный кайф — хозяин-барин!
В этом смысле здесь подход аналогичен ЦМФ. Но о нем расскажу в другой раз.
Для того, чтобы попасть на курс, нужно было пройти довольно-таки несложный тест. В тесте задачки на (не самый) простой матанализ (градиенты, условные оптимизации), немножко линейной алгебры, немножко _очень_ базовой прикладной статистики, щепотка теории вероятностей и совсем крохи пайтона. Ограничения по времени нет — я нещадно гуглил и вообще решал два дня и вместе с другом-однокурсником. Прошел, как всегда, по краю — набрал минимальный проходной балл 🙃.
Любопытно, что была и вторая часть, в которой проверялось знание основ машинного обучения, чтобы те, кому будет скучно, не занимали места. Во второй части я тоже прошел по краю — на балл меньше допустимого максимума (подрандомило).
Судя по табличкам с результатами, желающих попасть на курс было около 500 человек, а взяли примерно 45-50. Так что задание по сложности было составлено близко к идеалу. Состав задания Виктор объяснил тем, что одних олимпиадников-математиков видеть на курсе не очень хочется, это все-таки не тот профиль, но работать приятнее с людьми, обладающими математической культурой.
Курсы бесплатные, преподаватели работают в собственный кайф — хозяин-барин!
В этом смысле здесь подход аналогичен ЦМФ. Но о нем расскажу в другой раз.
На первом занятии рассмотрели какие вообще задачи решаются машинным обучением, ввели терминологию и пробежались по стандартным методам типа knn, k-means, лин рег, решающие деревья, увидели как разные задачи формализовывать через оптимизацию impurity и даже немного потрещали про наивного байеса.
На втором уже подробнее разобрали деревья и посмотрели на ансамбли, в основном на бустинг, конечно.
Получается довольно плотно, но подача мне нравится. Особенно классно у Виктора получается не отвлекаться от темы! Вот он рассказывает какие-то прикладыне вещи, которые сейчас используются на практике, упоминает, что есть/были раньше еще другие подходы, методы, точки зрения, говорит, где можно об этом послушать и почитать для общего развития, и идет дальше. Минутка, чтобы дать ссылку, чтобы оставить в голове засечку, что бывает еще как-то иначе, а дальше чистая прикладуха. На мой вкус идеально.
Посмотрим, справлюсь ли я с домашкой. Объемы впечатляют, а времени на нее у меня не так много.
Всем 再见!
На втором уже подробнее разобрали деревья и посмотрели на ансамбли, в основном на бустинг, конечно.
Получается довольно плотно, но подача мне нравится. Особенно классно у Виктора получается не отвлекаться от темы! Вот он рассказывает какие-то прикладыне вещи, которые сейчас используются на практике, упоминает, что есть/были раньше еще другие подходы, методы, точки зрения, говорит, где можно об этом послушать и почитать для общего развития, и идет дальше. Минутка, чтобы дать ссылку, чтобы оставить в голове засечку, что бывает еще как-то иначе, а дальше чистая прикладуха. На мой вкус идеально.
Посмотрим, справлюсь ли я с домашкой. Объемы впечатляют, а времени на нее у меня не так много.
Всем 再见!
Спешу поделиться с вами ссылочкой на хороший курс по случайным процессам от ВШЭ на курсере.
Если давно хотели научиться решать стох диффуры или узнать разницу между фильтром и фильтрацией, то вам сюда. Курс на английском, поначалу может показаться сложным, но просто игнорируйте это ощущение и смотрите дальше, на самом деле изложено очень доступно.
Задания я, естественно, не решал, поэтому все мои комментарии относятся только к лекциям.
https://www.coursera.org/learn/stochasticprocesses/home/welcome
Если давно хотели научиться решать стох диффуры или узнать разницу между фильтром и фильтрацией, то вам сюда. Курс на английском, поначалу может показаться сложным, но просто игнорируйте это ощущение и смотрите дальше, на самом деле изложено очень доступно.
Задания я, естественно, не решал, поэтому все мои комментарии относятся только к лекциям.
https://www.coursera.org/learn/stochasticprocesses/home/welcome
Coursera
Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Specializations, & MOOCs in data science…
В самой-самой последней лекции есть прикольная модель, которую я почему-то раньше не встречал, но которая, казалось бы, довольно очевидная.
Для ряда цен выбирается винеровский процесс, но со стохастическим временем! Можно взять время пуассоновским процессом и получится, что ряд цен моделируется в трейд-тайм, а это гораздо правильнее моделирования в физическом времени.
Вообще для квантов там есть решение Блэка-Шоулса, Васичека и даже Орнштейн-Уленбека, а в конце камео какой-то мин-ревертящейся стохастик волатильности, вроде Cox-Ingress-Ross.
Прикольно, короче, посмотрите.
Для ряда цен выбирается винеровский процесс, но со стохастическим временем! Можно взять время пуассоновским процессом и получится, что ряд цен моделируется в трейд-тайм, а это гораздо правильнее моделирования в физическом времени.
Вообще для квантов там есть решение Блэка-Шоулса, Васичека и даже Орнштейн-Уленбека, а в конце камео какой-то мин-ревертящейся стохастик волатильности, вроде Cox-Ingress-Ross.
Прикольно, короче, посмотрите.
За торговые стратегии
Ха! Я знаю, что вы ждали такого. Но ничего сильно умного, боюсь, не выскажу.
А подумалось мне вот что. Сделали вы модель, которая делает прогнозы. Как теперь сделать торговую стратегию на её основе?
Кажется, что один из вариантов это запустить бинарный классификатор на прогнозах вашей модели: 1 - торговать, 0 - ничего не делать.
Но как же выбирать аллокацию? У нас есть старый добрый критерий Келли, например. Ему нужны вероятности и размеры выйгрыша и проигрыша в результате действия. С размерами вроде понятно, а вероятности можно взять из AUC ROC. Тогда подгоняя порог классификации в AUC ROC можно получить нужные вероятности, а значит и агрессивность/шарп.
А теперь расскажите мне, где я не прав/не точен?
Навеяно чтением вот этой статьи:
https://dyakonov.org/2017/07/28/auc-roc-площадь-под-кривой-ошибок/
Ха! Я знаю, что вы ждали такого. Но ничего сильно умного, боюсь, не выскажу.
А подумалось мне вот что. Сделали вы модель, которая делает прогнозы. Как теперь сделать торговую стратегию на её основе?
Кажется, что один из вариантов это запустить бинарный классификатор на прогнозах вашей модели: 1 - торговать, 0 - ничего не делать.
Но как же выбирать аллокацию? У нас есть старый добрый критерий Келли, например. Ему нужны вероятности и размеры выйгрыша и проигрыша в результате действия. С размерами вроде понятно, а вероятности можно взять из AUC ROC. Тогда подгоняя порог классификации в AUC ROC можно получить нужные вероятности, а значит и агрессивность/шарп.
А теперь расскажите мне, где я не прав/не точен?
Навеяно чтением вот этой статьи:
https://dyakonov.org/2017/07/28/auc-roc-площадь-под-кривой-ошибок/
Анализ малых данных
AUC ROC (площадь под кривой ошибок)
Площадь под ROC-кривой – один из самых популярных функционалов качества в задачах бинарной классификации. На мой взгляд, простых и полных источников информации «что же это такое» нет. Как правило, …
Forwarded from Канал Фила (Filip Georgiev)
Кстати залетайте на соревнование в кодфорсес. Надо написать модель, которая будет ставить на реальные футбольные матчи и будет выигрывать (или сливать) деньги. Если повезет можно денег выиграть. Я много сил вложил в проведение, не расстраивайте Фила https://codeforces.com/contest/1522/standings
Продолжаю держать вас в курсе DMIA. Как это постоянно бывает с курсами на добровольных началах, сроки едут, занятия продалбываются. В позапрошлую субботу лекция растянулась на два часа (из-за кучи вопросов, конечно), поэтому для семинара времени не осталось. В прошлую субботу занятия не получилось совсем.
Послушали про линейные модели в необычной подаче: сначала классификаторы, а уже в самом конце регрессии. Не могу оценить, насколько это лучше обратного порядка, потому что линейными регрессиями я уже был напихан до отказа еще до курса.
С домашкой я, кстати, таки справился, даже заранее. Задачки в формате ноутбуков, в которых нужно что-то дописать, реализовать функции и методы, мне очень зашли. Я бы назвал это лабораторками, сам похожие штуки делал для студентов своих операционных систем и джавы.
Контест вообще захватил мою душу. Я невероятно сильно хотел попасть в десятку, а у меня несколько дней это не получалось. Потому что в задании было явно сказано: используйте ансамбли, а я все пытался затащить линейной регрессией. В какой-то момент я таки влетел в тройку лидеров и успокоился. Люди, сдававшие в последний момент, в итоге выбили меня из десятки, но это было уже не важно. А важно здесь то, что в попытках затащить контест я начитался про стекинг, беггинг, разные скоры, кросс-валидацию, попробовал xgboost, catboost, разные sklearn'овские модели для регрессий, научился использоват фолды и оптимизаторы гиперпараметров. Контест для обучения — круто.
Самым сложным для меня традиционно стало теоретическое задание. Я снчала вообще не мог понять условия задач. Спасибо Саше, с которым мы тащим эту ношу вместе, он мне объяснил, что всё просто, на примерах с картинками. Я тоже дурачкам картинками все объясняю. Зарешал четыре из пяти. Мог бы и пятую (погуглить, почитать, мозгами не смог), но дедлайн подкрался незаметно. Теорию не люблю, но зато она помогает увидеть связи между, казалось бы, совершенно разными аспектами предмета.
Третьей домашки пока еще нет. Семинара-то тоже еще не было. Так что пока немножко чилл.
Послушали про линейные модели в необычной подаче: сначала классификаторы, а уже в самом конце регрессии. Не могу оценить, насколько это лучше обратного порядка, потому что линейными регрессиями я уже был напихан до отказа еще до курса.
С домашкой я, кстати, таки справился, даже заранее. Задачки в формате ноутбуков, в которых нужно что-то дописать, реализовать функции и методы, мне очень зашли. Я бы назвал это лабораторками, сам похожие штуки делал для студентов своих операционных систем и джавы.
Контест вообще захватил мою душу. Я невероятно сильно хотел попасть в десятку, а у меня несколько дней это не получалось. Потому что в задании было явно сказано: используйте ансамбли, а я все пытался затащить линейной регрессией. В какой-то момент я таки влетел в тройку лидеров и успокоился. Люди, сдававшие в последний момент, в итоге выбили меня из десятки, но это было уже не важно. А важно здесь то, что в попытках затащить контест я начитался про стекинг, беггинг, разные скоры, кросс-валидацию, попробовал xgboost, catboost, разные sklearn'овские модели для регрессий, научился использоват фолды и оптимизаторы гиперпараметров. Контест для обучения — круто.
Самым сложным для меня традиционно стало теоретическое задание. Я снчала вообще не мог понять условия задач. Спасибо Саше, с которым мы тащим эту ношу вместе, он мне объяснил, что всё просто, на примерах с картинками. Я тоже дурачкам картинками все объясняю. Зарешал четыре из пяти. Мог бы и пятую (погуглить, почитать, мозгами не смог), но дедлайн подкрался незаметно. Теорию не люблю, но зато она помогает увидеть связи между, казалось бы, совершенно разными аспектами предмета.
Третьей домашки пока еще нет. Семинара-то тоже еще не было. Так что пока немножко чилл.
Начну потихоньку рассказывать про ЦМФ
Прежде всего надо объяснить, что это такое. Сейчас, когда я уже довольно много общался с организаторами в том числе за рамками обучения, у меня есть понимание, как они себе видят ЦМФ сами.
Центр Математических Финансов это такой образовательный кружок. На добровольных началах группа людей из индустрии и академии проводит популяризацию количественных финансов. Есть и коммерческие истории, например, курсы подготовки к CFA и FRM, но о них я ничего толком не знаю.
Программа достаточно утилитарная и нацелена на подготовку к работе в области количественных финансов.
Бояться ничего не нужно. Это действительно _кружок_. Все работают и учатся в кайф. Нет никакой потогонки, рейтингов, публичного осуждения. Задача заинтересовать и показать какие-то основы области и разных связанных профессий.
Поступление
Поступить довольно просто. В мой год нужно было проанализировать бизнес компании Tesla и дать прогнозы по ней. То есть это буквально эссе. Такой вступительный нужен, чтобы сразу отсеять случайных людей, оставить только тех, кому действительно интересны около-трейдинговые вещи.
Второй вариант поступить — предоставить диплом одного из топовых технических ВУЗов страны (МФТИ, ВШЭ, МГУ и т.д.) со средним баллом не ниже 4.5 или около того. А говорили, что мне мой красный диплом не понадобится! Право, не про Tesla же писать.
Заявок была тьма, штук 500. Зачислили тоже огромную толпу, человек 150. Но видно, что эссе-фильтр получился довольно неплохой.
Прежде всего надо объяснить, что это такое. Сейчас, когда я уже довольно много общался с организаторами в том числе за рамками обучения, у меня есть понимание, как они себе видят ЦМФ сами.
Центр Математических Финансов это такой образовательный кружок. На добровольных началах группа людей из индустрии и академии проводит популяризацию количественных финансов. Есть и коммерческие истории, например, курсы подготовки к CFA и FRM, но о них я ничего толком не знаю.
Программа достаточно утилитарная и нацелена на подготовку к работе в области количественных финансов.
Бояться ничего не нужно. Это действительно _кружок_. Все работают и учатся в кайф. Нет никакой потогонки, рейтингов, публичного осуждения. Задача заинтересовать и показать какие-то основы области и разных связанных профессий.
Поступление
Поступить довольно просто. В мой год нужно было проанализировать бизнес компании Tesla и дать прогнозы по ней. То есть это буквально эссе. Такой вступительный нужен, чтобы сразу отсеять случайных людей, оставить только тех, кому действительно интересны около-трейдинговые вещи.
Второй вариант поступить — предоставить диплом одного из топовых технических ВУЗов страны (МФТИ, ВШЭ, МГУ и т.д.) со средним баллом не ниже 4.5 или около того. А говорили, что мне мой красный диплом не понадобится! Право, не про Tesla же писать.
Заявок была тьма, штук 500. Зачислили тоже огромную толпу, человек 150. Но видно, что эссе-фильтр получился довольно неплохой.
😁1
Программа курса состояла из четырех модулей:
1. Алгоритмическая торговля
2. Структурные продукты
3. FX Options Trading
4. Оценка, аллокация и управление портфелем акций
Угадайте, после каких модулей отваливалось больше всего людей и на какие больше всего людей приходило?
1. Алгоритмическая торговля
2. Структурные продукты
3. FX Options Trading
4. Оценка, аллокация и управление портфелем акций
Угадайте, после каких модулей отваливалось больше всего людей и на какие больше всего людей приходило?
Недавно посетил два довольно длинных вебинара школы Московской биржи по торговле фьючерсами и опционами.
В общем для новичков на Московской бирже это полезный вебинар: рассказали что за инструменты, как считать фикс и вар маржу, где есть ликвидность, как это посмотреть, немножко даже про интеграцию квика с экселем.
Но это всё перемежается рассказами лекторши о её успешных успехах в теханализе и средненьких 50% годовых. Это можно понять, ей же надо свои платные вебинары продавать тоже. Однако рассказ об опционах абсолютно некомпетентен и вводит в заблуждение. Из него выходит, что опционы это практически чисто спекулятивный инструмент, который к тому же всегда хуже фьючерсов. И единственная толковая причина купить опцион -- это отложенная покупка акций.
С другой стороны, пусть лучше новички и правда не лезут в сложные продукты, сберегут кошельки.
В общем для новичков на Московской бирже это полезный вебинар: рассказали что за инструменты, как считать фикс и вар маржу, где есть ликвидность, как это посмотреть, немножко даже про интеграцию квика с экселем.
Но это всё перемежается рассказами лекторши о её успешных успехах в теханализе и средненьких 50% годовых. Это можно понять, ей же надо свои платные вебинары продавать тоже. Однако рассказ об опционах абсолютно некомпетентен и вводит в заблуждение. Из него выходит, что опционы это практически чисто спекулятивный инструмент, который к тому же всегда хуже фьючерсов. И единственная толковая причина купить опцион -- это отложенная покупка акций.
С другой стороны, пусть лучше новички и правда не лезут в сложные продукты, сберегут кошельки.
Quant Valerian
Программа курса состояла из четырех модулей: 1. Алгоритмическая торговля 2. Структурные продукты 3. FX Options Trading 4. Оценка, аллокация и управление портфелем акций Угадайте, после каких модулей отваливалось больше всего людей и на какие больше всего…
Самой попсовой темой (куда больше всего пришло и после которой больше всего ушло) оказался, конечно, алгоритмический трейдинг. Никаких тайн не рассказали, а задание оказалось довольно объемным и трудоёмким.
Акции тоже были весьма популярны, но до них дожило так мало людей, что там никто не отвалился.
Для многих оказался тяжёлым формат опционов, на котором я кайфанул больше всего. Вёл коллега по цеху, с которым мы торговали, тоже парень с Физтеха. Но тут не было домашек толком, люди просто сдались и забили ходить.
Так что в комментариях в общем довольно правильно всё оценили.
Акции тоже были весьма популярны, но до них дожило так мало людей, что там никто не отвалился.
Для многих оказался тяжёлым формат опционов, на котором я кайфанул больше всего. Вёл коллега по цеху, с которым мы торговали, тоже парень с Физтеха. Но тут не было домашек толком, люди просто сдались и забили ходить.
Так что в комментариях в общем довольно правильно всё оценили.
В комментариях принесли ссылку на летнюю школу ВШЭ на тему финтеха
https://cs.hse.ru/fintechschool/
https://cs.hse.ru/fintechschool/
cs.hse.ru
Школа по финтеху — 2025
Я пропал, но это было временно!
В связи с внезапно появившимся свободным временем сейчас буду графоманить.
Ближайшие два поста будут про последние два занятия на DMIA.
В связи с внезапно появившимся свободным временем сейчас буду графоманить.
Ближайшие два поста будут про последние два занятия на DMIA.
Третье занятие на базовом курсе DMIA провела Эмили Драль. В этот раз была очень длинная и очень плотная лекция. Рассказала она нам про разные метрики качества. Причем там было всё: и классификация, и регрессия, и ранжирование. Так же был блок про практику. Как метрики выбирать, строить, кастомизировать, объяснять заказчику, интерпретировать самому. В общем, три часа отборного материала в высоком темпе. Я уснул за 15 минут до конца первой части и за час до конца второй 😂
Пришлось потом пересматривать запись. Очень интересно, подробно и полезно. Я даже всё понял, кажется.
Пришлось потом пересматривать запись. Очень интересно, подробно и полезно. Я даже всё понял, кажется.
Финальная лекция (и небольшой семинар) были по обучению без учителя. Всякие там кластеризации, понижения размерностей. Прикольные штуки типа t-SNE (https://distill.pub/2016/misread-tsne/) и word2vec. Но получилось на мой взгляд как-то очень по верхам. Я мало чего запомнил из такого обзора. Заодно выдали последнюю домашку: сентимент анализ текстов (есть размеченый корпус). Я успел посидеть за ней пару вечеров и сколь-нибудь хорошего скора у меня не получилось. Как будет возможность, попробую ещё — расскажу потом, что получлось.
Stay tuned.
Stay tuned.
Distill
How to Use t-SNE Effectively
Although extremely useful for visualizing high-dimensional data, t-SNE plots can sometimes be mysterious or misleading.