Будущее.42.0.0.2.FNL.PSD
573 subscribers
519 photos
139 videos
49 files
1.63K links
Jin Kolesnikov's future studies notes

Donate: https://boosty.to/u-nity/donate
Download Telegram
Как big data может вселять ложную уверенность и приводить к неверным выводам:

How Big Data Creates False Confidence
Although no one can quite agree how to define it, the general idea is to find datasets so enormous that they can reveal patterns invisible to conventional inquiry. The data are often generated by millions of real-world user actions, such as tweets or credit-card purchases, and they can take thousands of computers to collect, store, and analyze. To many companies and researchers, though, the investment is worth it because the patterns can unlock information about anything from genetic disorders to tomorrow’s stock prices.
But there’s a problem: It’s tempting to think that with such an incredible volume of data behind them, studies relying on big data couldn’t be wrong. But the bigness of the data can imbue the results with a false sense of certainty. Many of them are probably bogus—and the reasons why should give us pause about any research that blindly trusts big data.

https://nautil.us/blog/how-big-data-creates-false-confidence
#bigdata https://www.scoop.it/t/papers/p/4063525418/2016/05/06/how-big-data-creates-false-confidence?utm_source=Complexity+Digest&utm_campaign=66726203a3-RSS_EMAIL_CAMPAIGN&utm_medium=email&utm_term=0_f55ea67de1-66726203a3-67208645
#bigdata #infographic ЛИТЕРАТУРНЫЕ ВКУСЫ ПРОФЕССИОНАЛЬНЫХ ГРУПП В РОССИИ или что говорит бигдата о профессиях и литературных вкусах.
#bigdata #short

ЛИТЕРАТУРНЫЕ ВКУСЫ ПРОФЕССИОНАЛЬНЫХ ГРУПП В РОССИИ или что говорит бигдата о профессиях и литературных вкусах.

https://t.iss.one/mustreat/3634

Сокращенная версия.
Подробнее читайте тут: https://t.iss.one/mustreat/3636

"Шокирует положение двух групп – университетских преподавателей (рядом с учителями средней школы, дальше от Ремарка и Маркеса, чем официантки и индивидуальные предприниматели) и, особенно, врачи (рядом с Донцовой, медсестрами и продавцами)....
Различия масштабные – для врача в четыре раза более вероятно взять Донцову, чем для переводчика, а для переводчика – в два раза более вероятно взять обобщенного Пушкина. ...
В целом, как наши социологические представления о типичных занятиях носителей классовых вкусов, скалькированные из Бурдье (или о составе статусных групп по Голдторпу), так и обывательские представления о «настоящей интеллигенции», состоящей из врачей, учителей и библиотекарей, оказываются чем-то далеким от реальности. Кажется, что граница проходит каким-то гораздо более причудливым образом …"
#bigdata

Яндекс наконец-то рассказал о успехах в нефтянке своей Yandex Data Factory.

Я там ничего нового не узнал, но вам будет интересно познать как, даже для IT корпораций сложно проложить дорожку в мир тяжелотехнологических титанов.

Молодцы! Удачи, ребята! Так держать!

Цитата:

"Сегодня (внезапно!) все вдруг поняли, о чём мы говорим. То, что мы рассказывали ещё в 2014 году, в 2016 году стало регулярно попадать в заголовки."

https://yandex.ru/blog/company/stal-neft-i-iskusstvennyy-intellekt-yandex-data-factory-o-novoy-promyshlennoy-revolyutsii
#nl #dl #ds #bigdata #machinelearning #recognition

Птица-обувь и кот который съел кота и много-много-много всего.

Это все про нейронную сеть pix2pix которая заливает текстурой нарисованный образ.

Пробуйте сами!

https://affinelayer.com/pixsrv/index.html
#ai #fakenews #machinelearning #ml #datascience #ds

Уверен, что мимо вам не прошло стороной обсуждение Навального и странного поведения Яндекс.Новостей.

Замечательный Александр Амзин, основатель «Мы и Жо» и независимый медиаконсультант, опубликовал в своём Telegram-канале пояснение об этой ситуации.

Кстати, у него отличный канал. Рекомендую. https://t.iss.one/themedia

В связи с этим хочу вот что сказать. Каждый сегодня норовит в разговоре про искусственный интеллект перегнуть палку , словно толстая стриптизерша, одну или другую сторону: или "смотрите, роботы классные", или "эскалатор убил 15 человек, а Яндекс все врет".
При этом, если разобраться без истерик, то выяснится, что машина не врет, не обижается, и не мухлюет. Машина делает то, что в нее заложили.

Если вы говорите о работе с гигантской выборкой, то не нужно ждать ответа системы на вопрос жизни, вселенной и всего остального, когда вы положили в нее карандаш, кусочек жвачки, листок с кляксой и левый носок.

Если вы спрашивали тот же вопрос, сведя количество источников к дяде Васе, который Ленина видел, ждите статистических искажений.

В связи с этим претензии к сотрудникам Яндекса тут ровно такие же, как к сотрудникам Гугла, которые взялись на #bigdata предсказывать грипп, похвастались этим, об этом в книгах написали, а потом социологии выяснили, что все это враньё. Фильтруйте запросы, друзья, и соотносите их с реальностью. Машинам еще многое предстоит узнать о мешках с мясом.
#police #secure #cybersecurity #safenet #bigdata #leaks #nationalID

Чуть больше года назад хакеры выложили данные о 49,6 миллиона (из чуть более 75) турецких жителей, взятых из правительственных архивов. Данные включали национальный идентификатор, имя, фамилию, имя матери и отца, пол, дату и город рождения, а также адрес места жительства.

6,6Гб. Я скачал.

А сегодня - вторая часть марлезонского балета.

130 млн индусов проснулись с новостью о том, что их ID и биометрические данные теперь гуляют по сети в открытом доступе.

То ли еще будет!

0. Ссылка на источник про взлом. https://boingboing.net/2017/05/02/what-could-possibly-go-wrong.html
1. Новость о сливе ID турецких жителей на русском - https://habrahabr.ru/post/280896/
2. Новость о сливе ID турецких жителей - оригинал - https://news.ycombinator.com/item?id=11420139
#iot #watch #bigdata #knowledge

И второе место по прекрасности сегодня занимает новость о новой борьбе форматов.

На этот раз — в умных часах. (Пока что).

"
В частности, больше нет поддержки умных часов Apple в последнем обновлении Google Maps для iOS, сообщает Appleinsider.com.
Тем не менее, замечает издание, нововведения остались практически незамеченными — это говорит о том, что владельцы Apple Watch почти не пользуются приложениями от Google, Amazon и eBay.

Amazon и eBay никак не прокомментировали свои решения. В Google достаточно противоречиво заявили, что "в будущем Apple Watch снова будут поддерживаться".
"

Источник: https://life.ru/t/%D1%82%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D0%B8/1004274/google_amazon_i_ebay_otkazalis_ot_poddierzhki_apple_watch_v_svoikh_prilozhieniiakh
#edu #bigdata

С большим удовольствием читаю, как, допустим, Цукерберг (точнее, его жена, и тот, кто считает, что там деньги только жены - пусть первым бросит в меня камень), выкупает и делает бесплатным какую-то большую базу данных, которая в целом и так была доступна, но тут стала полностью содержаться на хребтине какого-то мощного "старика".

Разумеется, во всем мире проще купить проект, если это не слишком дорого, чем лепить такой же свой, да еще и не факт, что выйдет так же хорошо.

Еще лучше брать себе готовую библиотеку.

Особенно, на тему, от которой сегодня уши не горят только у младенцев.

Остается только стоя похлопать ловкой жене. Вовремя прикупила.

Пользоваться можно тут https://meta.science/user/login

Новость тут https://ain.ua/2017/01/24/fond-chan-cukerberg-vykupi-meta
#society #bigdata

Наташа Андреева вернулась из отпуска и снова радует нас открытиями.

1) Исследование применимости больших данных и машинного обучения для судебной системы США, проведенное сборной командой из Гарварда, Университета Чикаго, Стэнфорда и Корнелльского университета (2017); см. https://www.cs.cornell.edu/home/kleinber/w23180.pdf

Если коротко, то, по выводам исследователей, применение ИИ и big data при принятии судебных решений способно, во-первых, снизить уровень преступности в стране на 24,8% (удивительная точность, но ладно уж) и, во-вторых, снизить количество заключённых на 42%, причём без увеличения уровня преступности. В США, собственно, уже были прецеденты, когда судья принимал решение, основываясь на предиктивном анализе данных о поведении подсудимого (предыдущая история правонарушений, аналогичные кейсы и пр.). Публика недовольна, но когда она бывала довольна?..

2) Свежее (шестое) издание NAS, посвященное судьбам американской статистики в эпоху тотальной цифровизации, - «Principles and Practices for a Federal Statistical Agency» (2017); см. https://www.nap.edu/download/24810

Это, конечно, consensus report, а не программа развития, но отдельные его пункты меня порадовали. Во-первых, первым же тезисом идёт тезис о том, что типы и форматы собираемых госстатистикой данных должны – та-дам! – соответствовать приоритетам развития страны (policy). Во-вторых, прямым текстом сказано: Федеральное статистическое агентство США вынуждено будет использовать third party data sources, проще говоря – обращаться за данными к банкам, страховщикам, ритейлерам и прочим ребятам, которые аккумулируют у себя наиболее точные и релевантные данные по многим вопросам. В-третьих, они думают над переходом от «data collections» к «data products».
По-моему, это всё, что госорганам нужно знать об оперативном подходе к цифровизации.

По-моему, все очевидно. Но вдруг, вам нет?!
Что знает о нас Google? #ai #bigdata #iot