Small Data Science for Russian Adventurers
11.2K subscribers
296 photos
3 videos
13 files
699 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
Download Telegram
#полезно
Хороший обзор по adversarial learning. Он не энциклопедический (нет полного перечня возможных атак на сети), он больше практический (есть код и вывод формул в простых случаях).
https://adversarial-ml-tutorial.org
#полезно
Ресурс про управление проектами: блог-посты, книги, видео. Не знаю, насколько тут ценная информация для PM-ов, но мне многие материалы показались любопытными.
https://www.projectsmart.co.uk/
#полезно
Сегодня коллега по работе спросил, есть ли ресурс, который позволяет работать с графом цитирования статей. Я нашёл только это:
https://www.connectedpapers.com/
Хотя тут нет всего функционала, который бы хотелось...

UPDATE: в комментариях есть и более крутые решения!
#полезно
Многие, думаю, уже знают. Но поскольку я как-то писал о ресурсах, которые превращают статьи на arxive в html-документы, то для полноты надо и об этом написать...

Теперь достаточно в слове arxiv заменить X на 5. Например, так
https://arxiv.org/abs/2010.09839 (было) -> https://ar5iv.org/abs/2010.09839 (стало) https://ar5iv.org/html/2010.09839 (или так)

Получается довольно приятно, но на примере выше видны возможные проблемы с картинками. Также это пока не работает для свежих статей.
#полезно
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
#полезно
Вчера просматривал DS-чаты, которые обычно не особо мониторю, ответил на несколько вопросов из серии "а почему у меня этот код не работает". Сегодня утром в личку стучится рекрутер с предложением о работе (судя по общим подпискам, как раз из-за вчерашней активности - до этого никогда не стучались). Вакансия на мидла в крупной компании, вилку не называют. Но в целом, мне идея понравилась - отлавливать кандидатов в профильных чатах (не тех, кто все вопросы к политике сводят или про будущее ИИ разглагольствуют, а тех, кто что-то дельное пишет, хоть в телеграме и нет кармы). Интересно только, насколько это действенный способ?
#полезно
Материалы по теории оптимизации, есть ссылки на другие полезные ресурсы.
https://fmin.xyz
#полезно
Пособие для подготовки к DS-собеседованиям.
Мне не очень понравилось, но его делали, опираясь на какие-то реальные кейсы, так что для быстрого повтора тем всё равно будет небесполезно.
https://dipranjan.github.io/dsinterviewqns/intro.html
#полезно
Поучительная схемка из "старенькой" статьи. При работе с рядами часто забывают, что их можно по-разному представлять, например переводя в строки: можно разбить на кусочки и задать правило, по которому кусок кодируется буквой из некоторого алфавита. Когда-то этот способ рекламировал Воронцов для анализа ЭКГ (т.н. метод Успенского В.М.).
#полезно
Довольно любопытный блог, в основном тут описываются идеи научных статей. Тематика: оптимизация, тензорные разложения, GAN-ы. Из последних интересных постов: качество на тестовой выборке почти совпадает с качеством на синтетической выборке, построенной с помощью GAN-a, обученного на обучении (т.е. предсказывается качество на тесте).

https://www.offconvex.org
#полезно
Один интересный кейс, который мне очень нравится: как догадаться до нужной деформации целевых значений.