FRAT - Financial random academic thoughts
4.89K subscribers
238 photos
1 video
15 files
1.23K links
Academic research, macrofinance and crypto.

Contact me:
[email protected], @Oleg_Shibanov

Только личное мнение, без представления позиции организаций.
При перепечатке ссылка на канал обязательна.
Download Telegram
Предсказание российской инфляции нейронными сетями.

Вы могли видеть статью Евгения Павлова (2020). Он пробовал предсказывать российскую инфляцию через нейронные сети и преуспел: на горизонте от 6 месяцев они действительно лучше простых моделей типа AR(1).

Я пока не смог воспроизвести результаты, но в статье видно, что главные предсказывающие факторы - ставка, рост кредитования (иногда денежная масса) и прошлая инфляция. Правда, модель всё равно даёт довольно высокую неопределённость будущей инфляции.

Вывод: даже отдельные макропеременные предсказывать всё так же сложно.

#Inflation #ML
Дочитал книгу про чипы. Кратко вы и так всё знаете - построить большую индустрию чипов очень дорого, нужен огромный рынок из-за «экономии на масштабах», а Тайвань будет точкой споров Китая и США.
Из интересного - много про переплетение бизнес-интересов и суверенного технологического развития, в основном для армейских разработок.

Автор справедливо замечает, что теоретически чипы могут потерять свою ключевую роль для будущего. Однако на фоне развития машинного обучения и разных его применений в экономике, финансах и ВПК скорее снизится важность новых сковородок, чем чипов.

#Chips #ML
Как проверять качество анализа моделей машинного обучения?

Перед аналитиками всегда стоит вопрос - как мы можем выделить главные факторы из ML-модели? Вроде бы если данные "произвольные", то требуются довольно существенные усилия для этого. Точнее, в отличие от "регрессий", в которых нам попроще понять значимость и влияние отдельного регрессора, в тех же нейронных сетях ("чёрных ящиках") понимать влияние факторов значительно сложнее.

Авторы (статья 2022) подчёркивают, что можно проверять эффективность методов выявления значимых переменных на синтетических данных по кредитованию. Они генерируют наборы показателей по заранее заданной модели и затем изучают стандартные методы - SHAP и permutation Feature Importance. Я пока не видел более широких сравнений.

Вывод: SHAP в целом лучше, но выводы могут зависеть от структуры данных для анализа.

(Side note: в финансах такие плацебо тесты делают всё время, немного удивился, что в ML не в каждой статье).

#ML
На сколько % Copilot увеличит производительность программистов?

Copilot помогает писать код программистам, и такая автоматизация кажется полезной для снижения издержек/времени работы. Хотелось бы проверить, как меняется производительность при подобном подходе.

Авторы статьи (февраль 2023) сделали эксперимент. Наняв 95 программистов, они разбили их случайным образом на две группы, одной из которых предоставили платный доступ к Copilot, а другой нет. Результат работы над задачей вроде бы впечатляет: время выполнения для людей с Copilot снизилось на 55%.

Проблемы:
1) Copilot может быть доступен всем участникам. Он платный, но если люди пишут open source код, Copilot может оказаться для них бесплатным.
2) (Серьёзное) "Мы также обнаруживаем, что успех в завершении задачи [разумно исполняемый код] у группы с Copilot выше на 7%, но эта оценка не является статистически значимой".

Выводы: скорость растёт - потому что куски кода можно копировать быстрее и автоматически. Но если при этом задача решается в незначимо большем проценте случаев, насколько это хороший результат? Кажется, что требуется больше экспериментов - в крупных компаниях Copilot очевидно полезен, а вот в небольших проверить бы.

#Copilot #ML #Productivity
Поговорили и вот мои выводы:

1. Кажется, машинное обучение достаточно хорошо работает в прогнозировании инфляции во многих крупных экономиках

2. Shapley decomposition позволяет выявить наиболее полезные в ML переменные

3. Качество модели по отношению к линейным довольно стабильно, даже в волатильные периоды

4. Надо больше результатов по 2021-23

5. В России качество «годовой» модели достаточно высокое

#ML #Inflation
Прогнозные модели Европейского Центрального банка: что дальше?

Большая сборка моделей ЕЦБ - в этой статье (2024). Интересны выводы авторов:

1) модели, которые используют Центральные банки, слишком стилизованные, не дают хорошего микроописания экономики, и едва ли смогут предсказывать/ловить кризисы. Более того, они не включали несколько драйверов инфляции 2021-23;

2) несмотря на это, качественная картинка из моделей полезная, а добавить к ним недостающие элементы оказалось несложно, и новые версии стали более адекватными;

3) они прямо говорят, что структура внутренней иерархии в ЕЦБ, доступа к моделям/данным, и принятия-непринятия новых типов моделей (того же машинного обучения) сильно влияет на возможность креатива. И прямо требуют аджайла на рабочем месте (!!!).

Вывод: пока старые методы требуют допиливания, а для использования новых может потребоваться "структурная перестройка". Я с командой в работе стараюсь и знакомиться, и применять современные методы.

(А находить эти статьи можно тут: https://t.iss.one/workingpaper)

#CB #ECB #ML
Машинное обучение и рецессии: сразу по 20 странам.

Очередное применение машинного обучения (МО, ноябрь 2024). Авторы показывают, что наиболее успешным алгоритмом для прогнозов рецессий в 20 странах ОЭСР является "жесткий алгоритм" МО. Он сначала по историческим данным выбирает лучшие наборы переменных, а затем по ним строит предсказания. Такой алгоритм превосходит всё остальное, что они попробовали, в том числе индивидуальные модели для отдельных стран.

Вывод: опять МО значительно улучшают прогнозы. "Ансамбли моделей" обязаны включать МО как один из инструментов.

#ML #Recessions #AI