Модель для сборки
2.48K subscribers
122 photos
3 videos
2 files
107 links
Если и быть, то быть первым.

Хочется что-то спросить? Тебе сюда: @yk4r2
Download Telegram
#schedule

👾 С новым годом, товарищи. Спасибо, что читаете мои редкие, но объёмные заметки 🎉

🧠 Нашёл вам мегаполезный блог про очевидные и не очень ошибки во временных рядах и ML. А если вы ещё не видели аналог Kaggle для квантов, то зацените: вот такая штука. Ну и до кучи вот прикольный ресурс про quantitative ml, цените.


📆 Я не писал в канал месяц, а за это время...
– Я полежал в больни4ке, подлечился и теперь каждую неделю езжу к доктору на мониторинг состояния. Ничего серьёзного, плановая операция 🏥.
– Начал смотреть Emily in Paris 🇫🇷, прикольный ситком, всем советую.
– Съездил на два корпоратива трейдёров в банке, было весело, но это не точно 💴.
– Составил примерные планы на будущее. Ну, пониже увидите🔮.
– Купил всем подарки на Новый Год. Было реально сложно, но, надеюсь, всем понравится 🎁!
– Начал проходить курс по финансам от Калтеха. Там поляк, похожий на ватоадмина, затирает за бонды, свопы и прочую интересную лабуду 🤯.
– Мы запустились на работе, поэтому если у вас многа_деняк, вы можете отдать деньги в доверительное управление нашей нейросеточке 🧠.
– Потихоньку ботал алгосики и leetcode. Конец года, поэтому идёт сложно, но в следующем году дал себе обещание пропускать daily только в исключительных случаях 💻.
– Подумал о стоячем рабочем месте. Посоветуете что-нибудь 🪑?
– Нарешал достаточно много задачек на динамическую прогу. Теперь почти не боюсь их, хотя ещё работать и работать, конечно 👨‍💻.
– Договорился с тимлидом, что буду работать 40 часов. По факту я уже так работаю, но теперь официально 💪.


🤷‍♂️ Ну окей, вроде ты что-то там поделал. Какие планы на праздники и на следующий год?

🍾 Праздники:
– Точно надо закрыть курс от лысого из Браззерс дяди из Калтеха по прайсингу деривативов математическими моделями 🎰.
– По-честному построить бустинг для предсказания timeseries. И как-нибудь подумать над тем, как можно прикрутить туда ответы в виде распределений 🍆.
– А ещё хочется посмотреть на данные из numer.ai, вдруг там что-то интересное. У ребят прикольная система поощрения: по факту, ты ставишь свою крипту на свой (или даже чужой) алгоритм, конвертируя его в битки, если хочется 💶.
– И, наконец, хочется добить первую сотку на leetcode, расслабился я в конце года и в больничке, поэтому зарешал только 25 задачек за месяц. Зато сложность повысил 🥵.

🗓 Год в целом:
📚 АЛГОСЫ 📚: хочу дочитать-таки лекции ШАДа по алгосам и "Спортивное программирование" братьев Халимов. Ещё надо прочитать Cracking the code interview, System Design (Alex Xu) и остальные книжки по проге, которые у меня пока лежат на айпаде.
📊 ФИНАНСЫ 📊: курс по прайсингу, курс по классическому трейдингу, курс по ML в трейдинге. Ещё надо на работе больше общаться с шаристыми ребятами и на практике применить Black-Scholes model.
СЕРТИФИКАТЫ : тут не загадываю, но если вдруг мне дадут общагу, мне должно хватить на покупку CQF, дорогой, зараза, стоит около 14k английских фунтов. Правда, вместе с РЭШ я его тупо по времени не вытяну, как мне кажется.
🤖 ML 🤖: расширить мои скудные знания в RL, посмотреть на distributional RL, читать SotA-алгоритмы в Quantitative Research. Ну и в целом повторить основную теорию ML, давно не смотрел.
👨‍💻 ПРОЕКТЫ 👨‍💻: хачю сделать-таки трейдинк бота для крипты и сделать контрибьют во что-нибудь сложное, полезное и, возможно, плюсовое.
🎙 СОБЕСЫ 🎙: как минимум дважды в месяц ходить на одно собеседование, чтобы не терять форму.
💃 OTHER 💃: не сбавлять темп, не уходить в сумрак на месяц, возможно, попробовать сходить на паркет с бачатой. А что, а вдруг! Кроме этого, хочется ещё посмотреть в сторону probabilistic data structures, настолько сильно меня зацепила идея структур вроде HyperLogLog.


👾 Делитесь своими достижениями, ребята, а я пойду смотреть на новогоднее обращение Гендальфа.
#schedule

👾 Новогодние праздники, поэтому я пельменил и строил планы. Батя подарил молескин и крутую ручку, отчего жутко захотелось ручками писать в тетрадке: решил выписать туда запланированные на год книги, алгоритмы и прочую всячину.

🥵 Leetcode максимально иронично сделал сегодняшним daily hard-задачку на DP, надо было лопать воздушные шарики. Не удалось сделать её сильно быстро по времени, но после пары сишных оптимизаций, спёртых с codeforces, заработало быстрее чем у 75% человеков, что неплохо. Короче говоря, успел только её, и то подсмотрел подсказки, эх.

💬 Решил, что раз уж мы тут ботаем собесы, надо научиться объяснять, как решил задачку. Буду объяснять другу, с которым ботаем.


Сегодня я:
– Решил hard-задачку на DP, завтра надо будет объяснить решение 🎈.
– Посмотрел 15 минут курса по прайсингу, сегодня прайсим те call- и put-опционы, которые не зависят от модели 💴.
– Собираюсь посмотреть мульт про Моану, хех 👧.
– Переписал кучу книжек с книжной полки айпада в тетрадь 📝.
– Купил билеты на полное собрание фортепианных сочинений Скрябина 6 числа. Залетайте, будем вместе вдохновляться классикой 🎧.
– Обнаружил, что на пушкинскую карту положили 5к и сблатовал друга пойти на Locals Only 2022. Прикиньте, можно купить билет на anacondaz и noize mc по пушкинской карте 😱!
– Предложил друзьям с Физтеха пойти со мной на балет на оставшиеся 3000 рублёв. Жду реакции, но как-то они не сильно вдохновились. Вообще было бы неплохо, ведь я ни разу не был на балете 💃.


✈️ Завтра надо будет:
– Сделать зарядку с утра и помедитировать 🧘‍♂️.
– Перестать пельменить и посмотреть на numer.ai 👀.
– Дорасписать планы на год в тетрадку, чтобы можно было трекать активность 👣.
– Досмотреть неделю курса по прайсингу деривативов, сделать экзамен по ней 🎥.
– Решить как минимум две задачки на leetcode 👾.
– Если останется время, посмотреть пару лекций курса от Дойче, спасибо за напоминание в комментах 🧮.


👾 Кстати, скоро приедет мерч от Асафьева, футболка "ебашить маленькими ручками"))
#useful


👾 Я вам почитать всякого про трейдинг и пехтон на оставшиеся праздники принёс:
Годный простой блог для любителей поторговать криптой 🌌.
– Преинтереснейшая научпоп-статья про то, как Matt Hurd мутил свою HFT-компанию. Великолепно, захватывающе, на русском (перевод) 😱.
– Кстати, если вы тоже не в курсе общих паттернов при запуске python main.py, то вот небольшой классный пост об этом 🤖.

🧑‍🏫 Дальше — сложнее, потому что пойдут объёмные обзорные статьи, которые я прямо сейчас читаю:
– 2002, классическая обзорная статья про feature selection methods с приложениями 🧩.
– 2012, интересный подход с хеджированием рисков через сбалансированные корзины 🗑.
– 2015, новые подходы к автоматическому майнингу информации из trade data 🤑. (Если не откроется, называется DISCERNING INFORMATION FROM TRADE DATA).
– 2020, попытка предсказать short-term market price trend DL-ем 📻.
– 2021, вообще статья про классификацию разных сценариев для дальнейшего выявления, но я пока тырю оттуда идеи для feature engineering 🏗.


👾 Когда-нибудь я оцифрую свою маленькую шпору по feature engineering в timeseries, но пока я не сильно дофига знаю об этом и стыдновато такое выкладывать(
#useful


👾 Сегодня немножко на почитать и на пощупать ручками.

Очень интересная научпоп-статья про типичные ошибки инвесторов, как можно замечать «red flags» на графиках, мне крайне зашло 🔖.
– Если вы вдруг не видели (ну вдруг), сборище открытых датасетов со всего мира: awesome datasets. А @Abnegantes сделала более СНГ-ориентированный список, который я благополучно стырил 🪆.
– А вот статья о GameStop, Elon Musk, NFT и падения Китая в «10 самых безумных историях из финтеха за 2021». Увлекательно, советую, будет чем выпендриться перед девушкой на свидании 🤑.

– Кстати, если у вас в универе была теория компиляторов и ЯП или что-то, где рассказывали про LL- и LR- анализаторы, а вы совершенно не понимали, куда это говно применять и как оно выглядит, вот офигенный ресурс с ВИЗУАЛИЗАЦИЕЙ деревьев парсинга 🌲.
🤷‍♂️ Нафига козе баян? На самом деле, LL(1)-дерево /флешбеки пошли, да?/ — первый этап работы с вашим гениальным кодом в петахончике, в котором потом выделяются ключевые слова типа return, чтобы сделать абстрактное дерево команд AST, из него левым обходом в глубину строится символьная таблица, а дальше внутри такая жесть происходит при парсинге типов и переводе объектов в бинарный код, что я пока не осознал.
🌩 В комменты призывается @DGmajor, чтобы поправить меня, несведущего.
🗿 А коль скоро вы ещё не закончили читать этот опус, есть крутая статья на хабре про деревья парсинга, а вот бесплатная книжка, где можно почитать про все эти процессы в python подробнее.


👾 На подходе конспект четвёртой главы курса от DB по опционам. Там сложновато для непосвящённого пользователя, постараюсь сделать максимально понятно.
#schedule

👾 Здравствуйте, мои дорогие. Новогодние праздники закончились, а я так ничего толком и не успел из запланированного.


👀 За эти каникулы я:
– Сходил на фортепианный концерт в день 150-летия Скрябина 1️⃣5️⃣0️⃣.
– Каждый день решал daily на leetcode и как-то неохотно решал DP 🧮.
– Доформулировал-таки себе все книжки, которые надо прочитать, курсы которые надо посмотреть и всё такое. Предыдущая версия — здесь 🥵.
– Медленнее, чем хотелось бы начал разбираться с numer.ai 📈.
– Начал писать себе великую шпору по препроцессингу временных рядов для бустингов, параллельно читая тонны статей по поводу 📝.
– Расшарил вместе с курсом Калтеха за опционы и дискретные модели прайсинга деривативов, пришлось считать кучу дурацких примеров, я как в школку попал 😥.
– Почитал и восхитился бесплатной книжкой Inside the Python Virtual Machine, буду вникать дальше 📠.
– Открыл (и закрыл сразу) курс от DB по финматематике 🏧.
– Подался ещё на пару курсов на курсере (надо же как-то не разучиваться учиться) 👨‍🏫.
– Забил на медитацию, ранние подъёмы и зарядку, а зря 🌞.


За эту неделю очень хочется:
– Вернуться в рабочий режим без последствий вроде недосыпов и позднего подъёма. Раздолбать там пару тасков 🐞.
– Попробовать порешать задачки в режиме моков, то есть, на скорость + так, чтобы они заведомо компилировались 🎮.
– Решить weekly-задачку на leetcode 7️⃣.
– За пятницу + выходные написать качественный бейзлайн c бустингом и optuna для numer.ai 📊.
– Пройти заново, понять, осознать модель Блэка, Шоулза и Мертона вместе с леммой Ито и сделать задания на них 💴.
– Подумать с другом насчёт того, куда потратить оставшиеся 3к с пушкинской карты 🤑.
– Найти собесов на следующий месяц, а то сто лет никуда не собесился 🗣.
– Сделать конспект 4 главы курса от Дойче и выложить в канал ♿️.
– Читать минимум по 10 страничек в день, что сложно 📚.
– Вернуть ежедневные медитацию и зарядку 🧎‍♂️.


👾 Ещё мне приехала футболка "ебашить маленькими ручками", по вечерам работаю в ней.
#useful

👾 А вот здесь я попытался максимально понятно объяснить, что же происходило в сегодняшнем daily на leetcode, там была прикольная задачка.
#schedule #useful


👾 Произошло не то чтобы много всего, зато я нашёл вам немножко интересностей. А ещё меня позвал на импровизированный подкаст друг с Физтеха, надеюсь когда-нибудь он выйдет.


🚀 А вот и интересности 🚀:
NGBoost. 🤷‍♂️ Что, очередной градиентный пуссинг, но теперь от Andrew Ng? Нет. У меня часто бывает, что источников дофига, но они показывают разные цифры. Раньше распределения не умели напрямую без ухищрений предсказывать бустингами, но уже два года как умеют. Убер-полезная вещь в некоторых ситуациях, например, при предсказании zero-coupon yield curves, пользуйтесь ⭐️.
– Кстати, если вдруг тебе хочется потрогать SotA ручками и ты уже даже знаешь, что трансформер это не только Оптимус Прайм, можешь пощупать RuDOLPH, насколько я понял, это микс GPT-3 и DALL-E. Ссылка на канал товарища с сайтиком для определения КБЖУ в еде по фоткам вот, а несколькими сообщениями выше есть и ссылка на гит. Колаб выложит попозже 🤖.
– Если ты подумывал про вторую работу (а я вот подумывал), то смотри, какой прикольный сайтик: overemployed.com. Можно почитать даже про людей, которые совмещают FAANG с не-FAANGом 👷🏼‍♂️.


🍆 Мой небольшой прогресс на сегодняшний день выглядит так:
– Потихоньку долблю багов на работе 🐞.
– Weekly-задачки на leetcode никуда не делись и стабильно решаются. А вот моки пока не прошёл 7️⃣.
– Качественный бейзлайн c бустингом и optuna для numer.ai пока ждёт выходных 📊.
– Непрерывный прайсинг пока тоже ждёт, но надеюсь уже послезавтра найти силы его поботать 💴.
– Поиском собесов пока не озаботился, эх 🗣.
– Дико надеюсь завтра сделать конспект 4 главы курса Дойче по финматематике ♿️.
– Читаю сейчас сложную книжку про петахоновский компилятор, поэтому не очень быстро двигаюсь 📚.
– Ежедневные медитация и зарядка пока идут по плану 🧎‍♂️.


🗓 Планы на неделю пока такие же, не буду переписывать.
#schedule

👾 Только что зафигачил 100 на литкоде. Я молодец, скриншот прикреплю в комментики. Кстати, последняя задачка была Medium и теперь у меня официально больше Medium’ов, чем Easy при Acceptance Rate > 75, что неплохо. Вот только задачки я решаю медленно, надо постараться ускориться.

🗿 В последнее время почему-то все силы бросил на leetcode. Надо исправляться и до конца недели решать только daily, а потом ботать финансы и читать книжки.


🚀 Я не то чтобы дофига сделал кроме литкода, но вот вам новости:
– Работа работается, сегодня закончил одну таску, завтра починю тесты под другую и буду совсем молодцом 🕵🏽‍♂️.
– Weekly-задачки каждый день решал, пока ни одной не пропустил 👨‍👩‍👧‍👧.
– Меня нашёл рекрутер яндекса, предложил пособеситься, решили в понедельник. Есть большое подозрение, что я завалю ML, потому что сто лет не повторял основных принципов, но посмотрим 🏃‍♂️.
– Завтра поеду к доктору вечером, ох уж эти развлечения после 20ти 🥴.
– Остальные штуки делаются потихоньку, но не сильно быстро 😴.


👾 РОД ТУ З ДРИМ пацаны.
#useful

🙇‍♂️ Если вы вдруг начинаете свой день с чтения свежих статей за кофе, вот вам крутой сайтик. Тут анализируется количество ссылок на статьи с arxiv на реддите/твиттере и т.д. и выкладывается ссылка вместе с abstract.
📝 Удобная штука, короче.
#schedule

👾 Короче говоря, ещё неделя прошла.

🔮 Внезапное наблюдение: если решать задачки на кодинг на python, сильно больше ошибаешься по сравнению с плюсами. Видимо, потому что в целом код пишешь дольше и больше edge-case'ов за это время обдумываешь.


⌛️ За это время я:
– Каждый день решал leetcode, пока не пропустив daily ни разу, слишком уж хочется свой первый бейдж 📛,
– Решил один мок, получил оценку 4.10/10, считаю что удос заслужен 4️⃣,
– Не посмотрел ни одной главы курса по прайсингу деривативов 🙈,
– Начал вспоминать за трансформеры и BERT, завтра, если останутся силы, буду впервые файнтюнить RoBERTa для соревнования 👘,
– Прошёл один собес в Яндекс, ожидаю реджект. Я в конце не проверил, что отключил камеру и громко сказал "да в пизду" 😂,
– Написал бейзлайн для numer.ai, но понял, что два соревнования одновременно + курсы + работа == нереально 😭,
– Понял, что переоценил свои силы в курсе по финматематике, получилось пока законспектировать где-то 33% главы, эх 🤑.


7️⃣ На следующей неделе очень хочется:
– Зафигачить дашбордик на streamlit на работе 🎨,
– Продолжить делать зарядку с утра ☀️,
– Перестать тратить время на соревнованиях, а заблендить уже туда тыщу бертов вместе с регрессией 🐷,
– Решить ещё один мок как минимум 🍎,
– Не слететь с январского бейджа на leetcode 🤖,
– Доделать конспект по курсу от DB (он меня уже достал, если честно) 🔵,
– Найти ещё собесов, возможно, в зарубежные компании 👀,
– Почитать ещё книжку про компилятор пехтона 🐍.
#useful

👾 Почему вы ещё не написали бота, который оповещает вас про новые твиты Маска?

Маск: постит в твиттер смайлик 🔝

Криптовалюта $TOP: +56% за пару часов
#useful

👾 Ну тут даже добавить нечего. Актуалочка, потому что я пытаюсь сейчас языковую соревку зарешивать, а боевой и теоретической экспертизы не хватает.
Forwarded from DL in NLP (Vlad Lialin)
Как мне подойти к задаче классфификации/QA/NER/...? В чатах можно часто услышать такие вопросы. И несмотря на обилие туториалов по всем стандартным задачам NLP, я пока что не видел хорошего места, куда можно было бы послать людей, где есть все эти задачки.

Теперь такое место есть! 🤗 Tasks

Вы выбираете задачу, которая вас волнует: классификация, QA, NER, MT, суммаризация, генерация, схожесть текстов

На каждую из них есть короткая лекция, описываются вариации задачи, есть ссылки на датасеты и предобученные модели. Самое главное: есть ссылки на A) хороший ноутбук, который подробно, но доступно описывают как применить условный BERT к этой задаче B ) хорошо задокументированный скрипт, который вы можете легко подогнать под свою задачу.

Кроме этого есть ссылки на релевантные блогпосты, которые могут рассматривать задачу с разных сторон. В общем советую теперь слать людей на 🤗 Tasks.
#schedule

👾 Ну что, время чекапа?))

🏎 Как-то мне очень зашёл драйв соревнования, где за короткое время надо попробовать как можно больше подходов. Понял людей, которые каждую неделю где-то участвуют... И заболел короной.


💬 За эту огромную кучу времени я:
– Прорешивал daily на leetcode каждый день и получил бэдж, вау 😱.
– Заболел короной и потерял желание работать, слился с соревнования по этой же причине ☹️.
– Научился в streamlit для работы, вау ☄️.
– Зафайнтюнил DeBERTa-v2-xl, потратил на это какое-то нереальное количество времени (я в целом ничего сложнее LSTM до этого не щупал), в итоге выяснилось, что это нафиг не нужно, а токсичность в тесте как будто размечалась линейными моделями 🤯.
– Почти дошёл до оффера в Яндексе 😆.
– Начал собеситься в McKinsey и BCG Gamma 💙, Гамма предложили пособесить сейчас, а оффер сделать на окончание магистратуры, удобно 🕊.
– Заказал себе корректор осанки от Xiaomi, буду писать, как оно 📱.
– Не успел в финматематику, буду потихоньку досматривать на неделе 🧮.
– Скоро IDAO, нам уже даже выдали аккаунт на яндекс.контесте 🤩.
– Купил себе colab pro plus 🔋.
– Каждый день пил ~литр молока 🥛.


⌛️ Планы на будущее:
– Провести анализ стратегий на работе 🏋️‍♂️.
– Получить оффер в яндекс 🍭, чтобы потом шантажировать тимлида
– Сделать небольшой перерыв в соревах, пока не выздоровел 😷.
– Начать готовиться к интервью в google (зачем?) 📝.
– Потихоньку ботать финматематику и DB 🔵.
– Пройти собесы в McKinsey и Бостон Консалтинг Групп 🎙.
– Продолжить читать умные книжки 📚.
– Решать один мок в выходные 🔚.
– Делать с утра зарядку 💪.


👾 А вы тоже собеситесь параллельно с работой?))
#schedule

👾 Оказывается, когда вы собеситесь в яндекс, на написание задачки на алгоинтервью отводится 30 минут.
Я сидел 45 (сложно без запусков искать ошибки головой), но в итоге решил несложную вайтборд-задачку, получив реджект по времени, эх.

🦋 Прикол в том, что яндекс сказали, мол, я сильно понравился одной команде (спасибо, академия авито), и она хочет меня поспрашивать, заменив алгоритмы на общее знание SQL, питона и ML и добив ML System Design. SQL-задачки я не решал сто лет, на меня наехал один из собеседующих, якобы я не знаю left join, в итоге спустя 15 минут выяснили, что это он не дослушал условие (лол).


За прошедшую недельку я:
– Выздоровел от короны, не болейте, народ 😷!
– Научился по-взрослому бэктестировать стратегии на работе 🔙.
– Начал потихоньку проводить собесы на работе, провёл 3 штуки, последний в паре с тимлидом и получил от него фидбек о том, что если видно по человеку, что он не знает темы, можно просто скипать, а не выдавливать раба по капле 😥.
– Начал носить штуку для выпрямления осанки от Xiaomi, Hipee Smart. Прикольная штукенция, сначала сильно болела холка, теперь уже ок 📏.
– Загрустил, что как только я ушёл в магу другого ВУЗа, в МФТИ появились действительно интересные предметы. Вот какие приглянулись:
* Оптимальное инвестирование (CAPM Theory, Risk, Kelly’s optimal leverage criterion, NPV, IRR, EMV, Pattern-Machine Learning и другие интересности) на кафедре банковских информационных технологий (сбер) ⬇️,
* Вычислительные финансы (Монте-Карло для стохастических, алгоритмы оптимизации и дифференциальное программирование), открытый курс от запаренных инвесторов, который ведёт квант-Oxford PhD in Math 🔥.
Записался на оба, чёб нет. Удобно, что оба в пятницу 👀.
– Начал работать над задачкой с IDAO. Пока не сильно продвинулся, думаю завтра хорошенько поработать. Предсказываем энергию запрещённой зоны в разных соединениях машинкой по формулам кристаллов 🙈.
– Заботал (надеюсь) модель Блэка-Шоулза, решил по ней кучу задачек 🔐.
– Прошёл 2 собеса в яндекс с переменным успехом 🇷🇺.
– Пинганул рекрутера BCG Gamma, чтобы скинул мне тест 🧾.
– Записался обратно на бачату 💃.
– Стал грандмастером стримлита (вот достижение-то, лол) 🥋.
– Решал задачки на leetcode каждый день и навёл порядок в репозитории с решениями 📮.


❤️‍🔥 Очень хочется успеть на следующей неделе:
– Зафигачить хорошее решение на IDAO, вот парочка идей для него 👘.
– Закрыть неделю (а лучше две) курса от Калтеха, посмотреть лекцию оптинвестирования и вычфинансов 📈.
– Пройти финал в Яндекс, а перед этим подготовиться к нему основательно. Хочу высокий оффер и не принять его типа я собака бешеная 💸.
– Решить мок в выходные 🏋️.
– Продолжить носить корректор осанки 🕺🏼.
– Сходить на первый урок продвинутой группы по бачате и на балет 💃.
– Сходить на хастл-вечеринку 👯.
– Продолжить читать умные книжки, как водится 📚.
– Делать зарядку с утра ☀️.


👾 Почему в сутках так мало времени???
#startup_idea

💡Персонализировать рекламу дипфейками

/Идея не моя, но я бы вписался/