Small Data Science for Russian Adventurers
11.3K subscribers
307 photos
3 videos
13 files
708 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
Download Telegram
#забавно
А это сейчас...
🤔1
#забавно
Сколько надо работать в день. Картинка из этой статьи.
#забавно
В научных журналах не принято публиковать отрицательные результаты, типа «пробовали и не получилось». Тем более сложно представить, что этому посвящена целая статья… «у нас ничего не получилось», хотя в 80% случаев так и выходит. На этом фоне выглядит забавным, что когда-то пытались сделать целый журнал про отрицательные результаты, собрали представительную редакцию, дали рекламу… за время существования журнала в него была одобрена только одна статья:
https://jinr.site.uottawa.ca

П.С. Есть ещё несколько аналогичных журналов, но они также не изобилуют статьями:
https://www.jnr-eeb.org/index.php/jnr/index
https://www.negative-results.org
👍2
#забавно
Небольшая мотивирующая история... вот эта работа 2004го года Давида Лойе имеет более 65 тысяч цитирований. Её первые версии подавались аж в конце 90х на ICCV 97, CVPR 98 и были отвергнуты... успех пришёл только через 7 лет.
👍31😱2
#забавно
Когда-то гугл ругали за это - по запросу "CEO" в гугл-картинках выводились практически одни мужчины, а первая женщина-CEO в выдаче была Барби. Сейчас это пофиксили, но легко "взломать систему" - немного исправив запрос "CEO" добиться гендерного перекоса.
👍4😁1
#забавно
Давайте в комментах накидаем телеграм-стикеры, связанные в DS/ML/DL? (ну или IT/MATH, если сильно хорошие)
👍30
#забавно
Какая долгая судьба у работы...
Статья Why Random Reshuffling Beats Stochastic Gradient Descent была впервые выложена на Arxiv в 2015 году
https://arxiv.org/abs/1510.08560
В 2019 она выложена на сайте журнала Mathematical Programming (с модификациями)
https://link.springer.com/article/10.1007/s10107-019-01440-w
Официально она опубликована в номере только 2021 года: Mathematical Programming volume 186, pages 49–84 (2021)
А последняя правка на Arxive сделана в этом году.
Статью пишут уже 7 лет;)
13😢10
#забавно
В комментариях к предыдущему посту я поделился ссылкой, но надо бы её вынести на всеобщее обозрение - там есть любопытные статьи (с самым длинным названием, с самым коротким заголовком, с наибольшим числом ссылок и т.п.) А на картинке - мотивашка - такие статьи тоже бывают;) Кстати, я подобную диссертацию видел, и ничего, человек защитился. А через несколько лет он и подобную докторскую представил, точно не помню, вроде страниц 18 всего.
https://www.researchgate.net/post/Have_you_seen_these_strange_statistics_in_scientific_publications
😁50👍10🤩1
#забавно
Есть сайт с объяснением смысла xkcd-комиксов.
Вот, например, объяснение последнего. Надо заметить, что многие объяснения очень качественные - прям заморачивались.
31😁7👍1
#забавно
На выпускном ОзонМастер мы проводим разные конкурсы-викторины, например, один из конкурсов - ML-quiz. Есть серия задания про мемы, пример на картинке - догадаться, что скрыто за маской.

Другой набор заданий - цитаты. Например, назвать автора (писателя) цитаты
“Data! Data! Data!" he cried impatiently. "I can't make bricks without clay.”
Кстати, вроде бы это единственный случай в мировой литературе, когда слово "данные" повторено три раза.

Или вот ещё, мой любимый вопрос... В рассказе Фредерика Брауна все компьютеры галактики собрали в одну сеть. Первый вопрос, который задали получившемуся суперкомпьютеру был "Есть ли бог?", что ответил этот "ИИ"?
👍218🤯4
#забавно
Я тут открыл для себя логическую задачу, которая вызывает максимальное число споров и недопонимания между математиками и не-математиками (не буду писать гуманитариями, т.к. споры возникают и, например, с химиками). Математическое решение парадоксальное и не применяется на практике:)

Есть команда пиратов, пронумеруем их: 1, 2, ..., N. У них чёткая иерархия ("линейный порядок"): 1 - капитан, 2 - его зам и т.д. N - самый последний пират. Они хотя поделить сундук с золотом из 100 монет. Капитан предлагает способ деления (например, "всем поровну" или "мне - 90, заму - 10, остальным - ничего"). После этого все (и он сам) голосуют за предложение капитана. Если предложение набирает большинство голосов, то так и делят (можно по-разному ставить задачу, в зависимости от того, что делать при равенстве голосов). Если не набирает, то капитана кидают за борт, команда сокращается, зам становится капитаном и процедура повторяется.

Вопрос: Вы капитан, N=5 (можно взять любое число), какую схему раздела добычи Вам предложить? Предполагается, что все хотят получить побольше денег и не быть выброшенными за борт.
👍43🤔16😁1
#забавно
В прошлом году на reddit-е в разделе ML cамая популярная заметка - об "ИИ", который наказывает, если человек отвлекается от работы.
В лидерах также машинный перевод speech2speech и прикреплённая картинка с типами ML-статей.
А уже потом идут Stable Diffusion, ArcaneGAN и т.п.
😁44👍16🤔4🐳2
#забавно
Игра, в которой надо стрелять в противников, описывая уравнение кривой полёта снаряда, т.е., исходя из желаемой траектории, Вы учитесь придумывать для неё уравнение.
www.graphwar.com

Кстати, аналогичное и в стиле ML можно сделать (итерационно делить своих/чужих, выбирая классификатор и гиперпараметры, за ошибки - штрафы).
👍70🤔14🔥5👀4