DL летописец
1.82K subscribers
107 photos
8 videos
36 files
79 links
Пытаюсь выжить в питерской вышке и пойти в науку (контакт - @Pashteticus)
Download Telegram
Последние 4 дня прошли классно - я был на награждении НТО ИИ в Москве. Туда были приглашены дипломанты олимпиады и спецномы, многих из них я уже знал, мы были друзьями и познакомились на прошлогоднем награждении. Мы жили в отеле "бега", у нас под балконом был ипподром, по которому регулярно бегали лошади и колесницы.
Во второй день была экскурсия по Москве по маршруту Красная площадь - Зарядье - Москва-Сити (но экскурсия честно говоря была такой себе). Помимо этого мы также играли в настолки и другие игры, особенно мне запомнились игры в мафию (меня всегда убивали первым, так как я выглядел "колоритным" игроком), "деревню" (мы пытались держать баланс, но в итоге все умерли и проиграли) и "рыбки" (у нас сразу сформировалось 2 коалиции, имеющих разные взгляды, "вождь" был из враждебной нам коалиции, в итоге мы собирали рыбу через "оффшоры", чтобы она не попадала на общую дележку (такие законы издавал вождь, типо для равенства), в конечном итоге мы собрали больше рыбы и победили). Также нам выдали неплохой мерч
👍2
👍5
Теперь про само награждение. У нас была довольно насыщенная программа, похожая на программу награждения прошлого года. Из отличий: пришли гораздо более интересные лекторы (среди них был как раз Соколов, которому я задал вопрос по поводу НТО ИИ, на пару постов выше тут).
Нам показали сбер, мы поболтали, все было топово. В конце нас повели в зону отдыха, где мы играли в настолки, если пиццу и кучу другой вкусной еды, наслаждаясь топовым видом с 39-го этажа.
Немного хочу добавить по поводу призов: в этом году призеры получили "сбер салют", а победители "сбер портал". Команда-победитель получила дополнительно дроны.
В целом это получилась действительно очень крутая и ламповая поездка, на которой я вновь увиделся с друзьями и мы прекрасно провели время
👍7
🔥 HF выложили первый урок по RL!

Рассказывается зачем RL вообще нужен и его основы: пространство действий, окружение, награда, штрафы и т.д.

Довольно подробно рассказывается математика, которая стоит за всем этим. В качестве практики предлагают потренироваться на одном из базовых окружений - lunar lander, уже даже есть лидерборд).

Помимо этого есть много очень хороших дополнительных материалов для самостоятельного изучения.

Кажется самое время начать изучать этот ваш RL.

Урок
Лидерборд
🔥31