DL летописец
1.82K subscribers
107 photos
8 videos
36 files
79 links
Пытаюсь выжить в питерской вышке и пойти в науку (контакт - @Pashteticus)
Download Telegram
DL летописец
Кажется пришло время планов на лето (до поступления): 0) набрать на ЕГЭ по инфе 75+ и подтвердить бви ☑️1) апнуть фиола (по возможности - жёлтого) на codeforces 2) стать competition kaggle expert 3) заботать несколько курсов и книг повышмату (в том числе…
На данный момент я собираюсь решать на каггле kore (RL) и ещё какую нибудь соревку (пока не определился да и школа пока ещё мешает). Собственно сам вопрос: стоит ли делать посты по ходу того, как я буду решать эти соревки (по типу "сегодня сделал это, получил то"), и если стоит, то насколько часто?

А пока держите ссылочку на новый курс от Hugging Face по RL
12
DL летописец
image_2022-04-19_21-24-24.png
Я успешно слил фиола (1939 - (~120) = ~1819) . Поста про глобал не будет( Скажу только что задачи мне оч не понравились). Но будет пост про каггл
Сегодня начал смотреть https://www.kaggle.com/competitions/kore-2022/overview. С виду прикольная соревка, кажется есть немало хороших стратегий (ну а что, игра все таки). Но у меня в планах не стратегии ифать, а всякие штуки обучать (и не потому что я ленивый, а потому что хочется сделать нормальное масштабируемое rl-решение).

Кратко правила игры:
Изначально есть верфь, которая может строить и запускать флоты (группы кораблей) по заранее заданным циклическим маршрутам. Корабли могут добывать руду, если попали в клетку с ней, могут сражаться с другими кораблями, если он в соседних клетках. Задача - собрать как можно больше руды или уничтожить врага.

Какие основные проблемы:
1) у нас большое пространство возможных действий из-за маршрутов - их 440 (поле 21х21, следовательно всего 441 клетка, 1 из которых - текущая).
2) у нас есть враг, который будет нам мешать

2я проблема связана с 1й - обе решаются грамотным построением маршрутов. В первом случае надо максимально далеко от врагов по наибольшим скоплениям руды. Во втором наоборот - не проходить через руду, идти максимально близко к врагам. Впринципе это уже выглядит как 2 симметричные стратегии, но я думаю RL сможет понять это сам.

Что я планирую делать:
1) эвристики - рандомизированные взвешенные решения на основе важностей тех или иных клеток (тут еще будет немного алгоритмов)
2) перейти к полностью эвристическому решению (убрать алгоритмы, чтобы код сам решал какие пути ему важнее)
3) обучить какой нибудь alphazero и mlp. Alphazero на принятие решений (в какую клетку лететь и циклически или обратно), mlp на построение путей (можно наверно даже какой нибудь lstm или обычный эвристический алгоритм)
4) Перейти к полностью ИИшному принятию решений и построению путей - пусть alphazero (или иная архитектура) сама выберет маршрут (на самом деле их гораздо больше 400, их 4**20 примерно (раньше мы могли алгоритмически искать эффективный маршрут, теперь нам лень думать и мы хотим заставить думать нейронку), из-за чего будут явные проблемы с обучением, так как в классификатор мы такое не запихнем никак, а рекуррентно строить пути не самая лучшая затея)

Но пока это только планы. По мере реализации вышеописанных пунктов и успехов я буду выкладывать свои ноутбуки на соответствующей вкладке в соревке. (если не залутаю медальку за соревку, то наверняка будут хотя бы медальки за ноутбуки и обсуждения)
👍9
Какой же кайфовый вид из качалки отеля ...
С телефона это конечно хуже смотриться, но тоже неплохо
👍22
Пост про спорт имеет 14% лайков (относительно просмотров),
пост про каггл имеет 3% лайков.

Это многое говорит об обществе....
😢7🤯2👎1
Довольно неплохая программа для последнего дня награждения НТО ИИ.
Лекция от Соколова кстати очень актуальна, ведь там будет 25 человек, многие из которых занимаются ds'ом (в том числе нейронками) уже несколько лет
DL летописец
Обязательно задам вопрос Соколову, почему ИИ не даёт бви на ФКН)
Ответ: скоро (в мае) скорее всего на фкн объявят конкурс на набор на бюджет по портфолио (я так понимаю что то вроде гранта на физтех). В следующем году обещает добавить НТО ИИ в список на ФКН
Последние 4 дня прошли классно - я был на награждении НТО ИИ в Москве. Туда были приглашены дипломанты олимпиады и спецномы, многих из них я уже знал, мы были друзьями и познакомились на прошлогоднем награждении. Мы жили в отеле "бега", у нас под балконом был ипподром, по которому регулярно бегали лошади и колесницы.
Во второй день была экскурсия по Москве по маршруту Красная площадь - Зарядье - Москва-Сити (но экскурсия честно говоря была такой себе). Помимо этого мы также играли в настолки и другие игры, особенно мне запомнились игры в мафию (меня всегда убивали первым, так как я выглядел "колоритным" игроком), "деревню" (мы пытались держать баланс, но в итоге все умерли и проиграли) и "рыбки" (у нас сразу сформировалось 2 коалиции, имеющих разные взгляды, "вождь" был из враждебной нам коалиции, в итоге мы собирали рыбу через "оффшоры", чтобы она не попадала на общую дележку (такие законы издавал вождь, типо для равенства), в конечном итоге мы собрали больше рыбы и победили). Также нам выдали неплохой мерч
👍2
👍5