Ivan Begtin
8.09K subscribers
1.99K photos
3 videos
102 files
4.7K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
Download Telegram
Пришла пора написать публично о изменениях в моей жизни - я с марта месяца выступаю в роли члена и председателя экспертного совета по информационным технологиям при Генпрокуратуре РФ. Правильнее сказать что это совет по цифровой трансформации.

Анонс уже прошел еще 20 февраля https://genproc.gov.ru/smi/news/genproc/news-1165272/
но я до поры до времени его не афишировал.
Чуть позже я напишу подробнее о том чем будет заниматься совет. Но общая повестка я уверен уже понятна - подружить консервативное ведомство с новой цифровой реальностью.

Задача непростая, но первые шаги уже делаются.

Обратите внимание на слова Генпрокурора на недавно прошедшей коллегии
...
Будущее объективного учета преступлений за высокими технологиями, исключающими любые махинации со статистикой.
Но цифровые технологии должны применяться не только в данной сфере. Прокурорам следует готовиться к тому, что в ближайшие годы мы начнем использовать их на всех направлениях надзора.
Месяц назад моим приказом создан Экспертный совет при Генеральной прокуратуре по вопросам информационных технологий. Он объединил специалистов, признанных лучшими не только в нашей стране, авторитетных в мировом масштабе. Реализация на практике их идей откроет для нас дополнительные возможности осуществления надзора, определит принципиально новые его направления в сфере IT (ай-ти).
Поэтому, уважаемые коллеги, начинайте учиться сами и учить своих подчиненных.
...

Полный текст выступления
https://genproc.gov.ru/upload/17%2003%2013%20%D0%94%D0%BE%D0%BA%D0%BB%D0%B0%D0%B4.doc

Моя должность общественная, это даже скорее не должность, а роль накладывающая ответственность и обязанность во взаимодействии с ИТ сообществом в принципе.

Если Вы журналист и у Вас будут вопросы касательно деятельности совета, то пишите мне в телеграм t.iss.one/ibegtin, по почте на [email protected] или в фэйсбуке и я буду готов рассказать подробнее в форме заметки или интервью.

Если у Вас есть идеи или вопросы по ИТ в контексте органов прокуратуры, то пишите мне на [email protected] и туда же входят любые идеи которые у Вас могут возникнуть про органы прокуратуры в контексте ИТ, новых технологий и интернета. Лучше почтой, продублировать, тогда я точно ничего не потеряю. Я не могу пообещать что все идеи и предложения сразу получат отклик, но они точно будут прочитаны и донесены до руководства ГП.

Ну а "на закуску" ссылка на канал Генпрокуратуры в Телеграм'е - https://t.iss.one/genprocrf - подписывайтесь и пишите идеи если вдруг Вам бы хотелось что-то новое узнать в том числе про деятельность прокуратуры, открытые данные и тд

#genproc #opendata #opengov #digitalgov
И вдогонку к новости - в экспертном совете при ГП я являюсь председателем и вот первая новость на сайте в которой рассказано подробнее о заседании совета https://www.genproc.gov.ru/smi/news/genproc/news-1177071/

Обязательно обратите внимание что сейчас Генеральная прокуратура собирает идеи от граждан и бизнеса по тому как реорганизовать свою работу в цифровом мире - если такие идеи у Вас есть, пишите на [email protected]

#opendata #genproc #digitalgov
Для тех кто любит и ищет новые датасеты по самым разным темам - мы выложили на хаб открытых данных обновленный список дипломатов в рангах послов и посланников. Датасет можно скачать в CSV тут [1] и там же он есть в XLSX формате, а сами данные собраны с сайта МИД России [2]

Но не просто собраны, а расширены. Набор включает дополнительные атрибуты, такие как:
- фамилия, имя, отчество по отдельности
- пол
- этническая принадлежность (насколько можно оценить по ФИО)
- возраст на 27 марта 2017 года
- возраст в котором получил текущий ранг

Было еще желание собрать биографии и показать траектории назначения послов, но этих данных на сайте МиД России маловато, надо собирать их из многих источников.

Откуда данные по полу и по этносу? Много лет назад, в 2008 году я сделал несколько простых алгоритмов по распознаванию пола и, отчасти, этнической принадлежности по ФИО.

Периодически с тех пор я натравливал его на списки сотрудников разных органов власти, вот и, к примеру, на список послов.

Если у Вас есть другие интересные наборы данных по персонам пригодных для гендерного, этнического или возрастного анализа - пишите мне

Ссылки:
[1] https://hubofdata.ru/dataset/midrf-ambassadors
[2] https://mid.ru/activity/shots/personnel/extraordinary_ambassador

#opendata #opengov #midrf
Вышло исследование "Access to New Data Sources for Statistics: Business Models and Incentives for the Corporate Sector"
за авторством Thilo Klein и Stefaan Verhulst посвященное тому как коммерческие компании предоставляют принципиально новое знание о происходящих социальных процессах и то как эти данные используются на практике.

Примеры таких инициатив:
- Telefonica Smart Steps [2] (теперь стало LUCA [3]) - данные телекомов
- Orbital Insight [4] - мониторинг бедности со спутников и с анализом данных
- Open Diversity Data [5] - общественный проект по добровольному раскрытию компаниями информации о их национальном и гендерном составе. Например, Google [6] и Microsoft [7] раскрывают подобную информацию.

В исследовании есть много других примеров. И описание подхода Trusted Third Party позволяющее использовать данные третьих сторон для подсчета статистики.

Ссылки:
[1] https://www.paris21.org/sites/default/files/Paper_new-data-sources_final.pdf
[2] https://dynamicinsights.telefonica.com
[3] https://luca-d3.com
[4] https://orbitalinsight.com
[5] https://opendiversitydata.org
[6] https://www.google.com/diversity/
[7] https://www.microsoft.com/en-us/diversity/inside-microsoft/default.aspx#epgDivFocusArea

#opendata #statistics
Несколько лет жесткого и, иногда, бездумного регулирования Интернета в России оказалось достаточно чтобы теперь при любом намеке на госрегулирование крупные игроки сбегались в СРО. Вот и с "большими данными" такая же история. Mail.ru, Яндекс, Ростелеком и многие банки собираются создать профильное СРО чтобы лоббировать свои интеерсы [1].

Шаг для них правильный, возможно, единственно возможный. Но, как и во всех подобных ситуациях важно помнить что их интересы - это интересы крупного бизнеса. Давний вопрос, а кто же представит интересы граждан? Остается без ответа.

Среди депутатов нет тех кто понимает что такое "большие данные", Общественная палата тоже не является таким институтом.

А структуры защищающие права потребителей в России также неживые. Может опять оказаться так что государство, со всеми его избыточными регуляторными амбициями окажется единственным защитником общественных интересов.

Возможно.

Ссылки:
[1] https://kommersant.ru/doc/3260507

#opendata #personaldata #bigdata
Примеры исчезающих сайтов или зачем нужна веб-архивация.

В 2013-2014 годах когда шла подготовка к Олимпиаде и само грандиозное мероприятие десятки организаций были созданы и десятки сайтов для них также были созданы.

Тогда же с начала 2014 года я начал их архивировать.
Прошло 3 года и значительной части этих сайтов уже либо не существует, либо там нет тех материалов что были раньше. Вот примеры:

- Коллекция "Сочи 2014" Bosco https://sochi2014.bosco.ru/ сайт исчез, теперь там редирект на основной сайт Bosco с частью материалов с сайта (описанием коллекции)
- Управление Олимпийскими Объектами https://www.olimp-ps.ru/ был сайт общества с ограниченной ответственностью "Промсервис", теперь какой-то украиноязычный блог.
- Сайт Росгидромета по погоде на Сочи-2014 https://meteosochi2014.ru/ исчез и вместо него какой-то блог
- Волонтерский центр Томского политехнического университета https://2014.tpu.ru/ более не открывается
- Спецпроект компании Кока-кола по Сочи-2014 https://sochi2014.coca-cola.ru/ не открывается
- Спецпроект Сбербанк-Сочи-2014 https://sochi2014-sberbank.ru/ все материалы удалены, сайт заполнен непонятно чем
- Сайт с информацией о логистике Информация о логистике https://tdog2014.com отсутствует, вместо него запаркованная страница
- Информация о вещании из Сочи-2014 https://panoramahd.ru/ закрыт паролем
- Информация о переселении жителей Сочи https://www.relocation.olympdep.ru/ более не работает
- Информация о деятельности администрации Краснодарского края в предверии Олимпиады Сочи-2014 https://www.olympdep.ru/ вместо него какой-то сайт визитка
- Госкорпорация Олимпстрой https://www.sc-os.ru сайт полностью переделан с 2014 года, доступность материалов надо тщательно перепроверять
- Спецпроекты Оргкомитета https://job.sochi2014.com и https://culture.sochi2014.com сейчас все недоступны

Это не полный список, это список того что я успел заархивировать в 2014 году. Ресурсов у меня тогда было маловато и вся коллекция в сжатом виде около 24 гигабайт.

Я примерно в то же время проводил тотальную архивацию всех ресурсов РИА Новостей и больше сил приходилось на них. Кстати, многие из них также не пережили последние 3 года.

Причем чаще все потери всех ресурсов - это отсутствие культуры, а не злой умысел. Многих просто не волнует что становится с архивными проектами, а еще больше владельцев просто не знают что делать.

Поэтому у меня есть даже такие странные явления как заархивированные сайты МММ (среднее время жизни каждого из них - 1 год), сайты банков поскольку каждый день все они под угрозой и многое другое.

Если Вы знаете какие-либо интернет-ресурсы имеющие культурную ценность и которые могут исчезнуть в любой момент - пишите мне на [email protected] и он будет сохранен.

#digitalpreservation #archival
Я поднял сейчас свои самые ранние архивы сайтов которые я начинал делать в 2012 году и выяснилось
что с 2012 года исчезло не менее 73 государственных или связанных с государством сайтов и порталов. Причем эти 73 - это только по результатам проверки доступности ранее заархивированных сайтов. Это те 73 архивы которых были созданы. Надо полагать что реальные потери составили многократно большее число сайтов и материалов.

Причина этого банальна - в России нет практики архивации цифрового контента, нет государствен
ной цифровой архивной службы, нет обязательной архивации всех документов, всей переписки госслужащих.

Вот тут полный список всего что было сохранено в 2012 году https://docs.google.com/spreadsheets/d/1wQoBFSvEWoUMubqUj3t2q3AaUUFash7RKX2aJZWSBcE/edit#gid=0

И вот лишь некоторые примеры теперь уже несуществующих сайтов, но копии которых сделаны:
https://01-112.ru/ Архив сайта - Оказание помощи пострадавшим в ДТП
https://2004.kremlin.ru/ Архив сайта Администрации Президента до 2004 года
https://2018.minsvyaz.ru Архив сайта Обсуждение целей Минкомсвязи России 2012—2018
https://contract.mil.ru/ Архив сайта контрактной службы Минобороны России
https://duty.mil.ru/ Архив сайта военной службы Минобороны России
https://fssn.ru/ Архив федеральной службы страхового надзора (ныне расформированной)
https://g8finance.ru/ Архив сайта встречи G8 в 2006 году
https://kursk1943.mil.ru/ Архив проекта Курск 1943
https://lib.adm.gov.ru Библиотека Администрации Президента Российской Федерации
https://www.medvedev2008.ru Архив сайта кандидата в Президенты Медведева Д.А.
https://www.mgdf.ru Сайт конференции организованной Министерством Финансов Российской Федерации в 2010 году
https://presscenter.minsvyaz.ru Архив Связьэкспоком 2011 (конференции Минкомсвязь России)
https://roskart.rosreestr.ru/ Архив сайта Роскартографии
https://rosnedv.rosreestr.ru/ Архив сайта Роснедвижимости
https://rosreg.rosreestr.ru/ Архив сайта Росрегистрации
https://rost.ru Совет при Президенте по реализации приоритетных проектов
https://russianlang.ru/ Архив госпрограммы ФЦП "Русский Язык"
https://sovet.mil.ru/ Общественный совет при Минобороны России. Архив сайта
https://www.transport.spb.ru Архив сайта Комитета транспорта Санкт-Петербурга. Комитет расформирован в 2013 году
https://w3.rfbr.ru/ Архив сайта РФФИ до 2011 года
https://rosohrancult.ru/ Архив официального сайта Росохранкультуры
https://zhirinovskiy2012.ru/ Архив кандидата в Президенты Жириновского В.В. за 2012 год
https://210.minfin.ru Архив сайта празднования 210 летия Минфина

#digitalpreservation #archive
Open Aerial Map [1] - краудсорсинговый проект по сбору изображений показывающих Землю со спутников, самолетов и дронов. Уже более 3 тысяч изображений из 51 сенсора и от 46 поставщиков изображений.

Все накопленные изображения можно посмотреть с помощью онлайн инструмента OAM Browser [2], скачать и использовать по своему усмотрению.

На сайте нет информации даже о команде, о ней можно догадаться по репозиторию исходного кода [3] относящегося к HotOSM (Humanitarian OpenStreetMap Team) [4].

Ссылки:
[1] https://openaerialmap.org
[2] https://map.openaerialmap.org
[3] https://github.com/hotosm/OpenAerialMap
[4] https://www.hotosm.org/

#opendata #osm
Отличный проект Electricity Map [1] по визуализации импорта/экспорта электричества в Европе и доли возобновляемых источников энергии на энергобалансе стран.

У проекта открыт исходный код [2] и она работает на открытых данных собранных в том же репозитории кода. Основным источником данных послужил европейский портал прозрачности в энергетике ENTSOE [3].

Это не единственный проект по визуализации сетей в электроэнергетике. На том же проекте ENTSOE есть интерактивная карта всей энергосети Евросоюза [4] и европейской части России.

А у агентства EIA в США есть интерактивная карта их энергосистемы [5]. Вполне возможно что и в России есть аналоги таких проектов, но они явно не являются открытыми.

Ссылки:
[1] https://www.electricitymap.org
[2] https://github.com/tmrowco/electricitymap
[3] https://transparency.entsoe.eu/content/static_content/Static%20content/web%20api/Guide.html
[4] https://www.entsoe.eu/map/Pages/default.aspx
[5] https://www.eia.gov/beta/realtime_grid/#/status?end=20170413T02

#opendata #electricity
Сегодня был на пресс-конференции посвященной новым президентским грантам. В коей-то веки выбрался на мероприятие не поговорить, а послушать.

Многое понравилось, и про требования к прозрачности НКО, и про новый подход к оценке и про управление конфликтами интересов.

Я там хотел задать несколько вопросов о том чего я не услышал.

1. Будут ли требования ко всем грантополучателям публиковать результаты под свободными лицензиями Creative Commons и открытые данные когда создаются базы данных?
2. Будут ли открыты результаты работы НКО по грантам и будут ли публиковаться все их отчеты и иные материалы созданные в процессе?
3. Будут ли обязательно архивироваться все результаты всех грантов в цифровом архиве?

Приведу пример по последнему пункту. Новый сайт президентских грантов https://pgrants.ru сменил предыдущий https://grants.oprf.ru , но материалы со старого сайта не были перенесены. Теперь они доступны только по прямым ссылкам, например, https://grants.oprf.ru/grants2016-1/ но это еще надо догадаться и для незнающего человека старый сайт просто исчез.

Безусловно у меня была его копия и еще одну я делаю прямо сейчас по ссылкам которые остались в доступе, но сохранение результатов работы - это важная задача.

Про открытость НКО подробнее напишу в другой раз.

#opendata #opengov #grants
Илья Массух, директор Центра компетенций по импортозамещению в сфере ИКТ, у себя в фэйсбуке [1] приводит ссылку на годовалой давности судебное разбирательство управления Роскомндзора с МГТС по поводу "больших данных" [2]

Дело примечательное тем что там "всплывают" коммерческие отношения между МГТС и группой компаний рекламодателей по продаже им истории посещений сайтов браузеров пользователей.

Из разбирательства можно узнать что:
1. В МГТС была реализована система сбора данных о пользователях на базе решения ООО "Безопасный интернет" [3]
2. МГТС заключало следующие договора с компаниями о передаче им данных:
- от 31.07.2015 № D150075282 с ООО "АМБЕРДАТА" (договор действующий);
- от 29.08.2014 № 62104 с ООО "ОБМР" (договор приостановлен);
- от 29.10.2015 № 015s00081938 с ЗАО "Современные технологии рекламы"
(договор действующий);
- от 30.07.2014 № 61876 с ООО "Кроссмедиа - Видео Интернешнл" (договор
расторгнут 12.03.2015).
3. Штраф составил всего 30 тысяч рублей.

К этому судебному разбирательству я дополню:
1. ООО "Безопасный интернет" [3] напрямую почти не поставляет, но все же поставляет по госзаказу. Из их профиля на Госзатратах [4] можно найти 1 их контракт на 392 тысячи рублей [5].
2. Компания получала поддержку от РВК [6] и ее заявленная специализация была в фильтрации трафика.

Что важно в этой истории - в том что компании поставляющие контентной фильтрации и DPI включают в свои решения то возможность сбора истории посещений пользователей и передача рекламным компаниям.

Пользуясь Интернетом и без "закона Яровой" Вы всегда должны помнить что можно поднять всю историю Вашего посещения всех сайтов если они не поддерживают HTTPS или если Вы не работает через VPN.

Основные пользователи этой информации - рекламные холдинги, но, при необходимости, доступ к ней могут получить и правоохранительные органы. И, конечно, всегда есть риск что эту информацию могут украсть хакеры, слить сотрудники провайдера или тех компаний которым провайдер продает эти данные.

Если кратко - соблюдайте информационную гигиену, помните что наедине с компьютером рядом с Вами еще и Ваш провайдер.

Ссылки:
[1] https://www.facebook.com/ilya.massuh/posts/1099118726900363?pnref=story
[2] https://kad.arbitr.ru/PdfDocument/898157da-8f67-4c18-8a6b-d74d68162eac/A40-14902-2016_20160311_Reshenija%20i%20postanovlenija.pdf
[3] https://ubic.tech/
[4] https://clearspending.ru/supplier/inn=7704780110&kpp=770401001
[5] https://clearspending.ru/contract/0301100003713000013/
[6] https://www.rvc.ru/investments/innovative_projects/3027/?sphrase_id=2593

#personaldata #privacy
Giorgia Lupi: How we can find ourselves in data [1] отличное выступление о том как визуализировать данные о человеке наглядно, как рассказывать истории о себе на основе собственных данных.

У нее много отсылок на интересные проекты по визуализации. Например Dear Data [2] книга о визуализации данных и примеры работ группы из компании Accurat [3]

Ссылки:
[1] https://www.ted.com/talks/giorgia_lupi_how_we_can_find_ourselves_in_data
[2] https://www.dear-data.com/
[3] https://www.accurat.nyc/

#data #dataviz
Для тех кто работает за MacOSX появился новый бесплатный инструмент по визуализации Tad [1]
Он объединяет просмотр CSV с возможностями анализа данных.

Конечно, ему еще далеко до OpenRefine который объединяет функции просмотра с функциями data wrangling, но новые удобные инструменты - это всегда полезно в работе

Ссылки:
[1] https://tadviewer.com

#data
Хакеры выкрадывают и выкладывают хакерские инструменты спецслужб. Этой товтологией можно назвать публикацию в Motherboard "Your Government's Hacking Tools Are Not Safe" [1]. Хакер взломал [2] ресурсы компании Cellebrite и выложил [3] огромную подборку инструментов для взлома устройств на базе Android, IOS и Blackberry.

Другая группа, "The Shadow Brokers", опубликовала набор эксплойтов для Windows [4] предположительно выкраденных у NSA (Агентства Национальной Безопасности США).

Все это о том что государство плохо умеет хранить свои секреты, даже те которые помогают получать доступ к чужим секретам. Если вернуться к России то проблема последних законов по длительному хранению трафика, создают риск не только их нецелевого использования, но и взлома со стороны хакеров.

Ссылки:
[1] https://motherboard.vice.com/en_us/article/your-governments-hacking-tools-are-not-safe
[2] https://motherboard.vice.com/en_us/article/hacker-steals-900-gb-of-cellebrite-data
[3] https://motherboard.vice.com/en_us/article/hacker-dumps-ios-cracking-tools-allegedly-stolen-from-cellebrite
[4] https://motherboard.vice.com/en_us/article/shadow-brokers-dump-alleged-windows-exploits-and-nsa-presentations-on-targeting-banks

#security #privacy #dataethics
В качестве небольшого оффтопика я написал текст на блог в Medium о выборе минималистичного текстового редактора [1]. Текст немного великоват для отправки в канал в Telegram или в Facebook, но в процессе его написания я в очередной раз задумался насколько актуальны вопрос "чистописания" во всем что касается госуправления.

Государственный и нормативный юридический языки жутковаты для восприятия простыми людьми. Или даже непростыми, но ценящими свое время людьми. Вот уже за долгие годы я до сих пор не встретил ни одного качественного редактора текстов для юристов дающего инструменты упрощения текста для понимания простыми людьми с сохранением смысла.

Ссылки:
[1] https://medium.com/@ibegtin/chooseminimalisticeditor-22b6ccecd980

#opengov #plainlanguage
Jennifer Brody, бывший сотрудник сената США и теперь сотрудник стартапа Voatz [1] написала обзор технологий Blockchain в государстве [2]. Кроме непосредственно стартапа который она представляет и который помогает в технологиях голосования, она упоминает несколько уже внедряемых проектов. Таких как реестр имущества/земель в Грузии [3] реализуемый компанией BitFury [4] и стартап BanQu [5] для идентификации пользователей, тоже на блокчейн.

А 13 апреля правительство Украины подписало с теми же BitFury соглашение о партнерстве [6], [7], [8] и теперь планирует публиковать многие государственные данные через технологии blockchain'а.

Признаться я лично до сих пор считаю blockchain хайпом и слишком часто вижу как стартапы и компании не подкрепленные никакой ценностной идеей кроме как мантры о блокчейне продают ненужное и бесполезное. Однако, с другой стороны, если отойти от маркетингового пузыря и обратить внимание на возможности самих технологий distributed ledger technologies (dlt) подвидом которых является blockchain, то действительно есть области в которых эти технологии могут принести серьезные изменения: в первую очередь в областях связанных с системами доверия между большим числом контрагентов.

Ссылки:
[1] https://voatz.com/
[2] https://medium.com/@brodyjab/blockchain-for-government-dd5708e9d0d8
[3] https://www.forbes.com/sites/laurashin/2016/04/21/republic-of-georgia-to-pilot-land-titling-on-blockchain-with-economist-hernando-de-soto-bitfury/
[4] https://bitfury.com
[5] https://www.banquapp.com/
[6] https://www.dknii.gov.ua/content/garyachi-novyny
[7] https://www.reuters.com/article/us-ukraine-bitfury-blockchain-idUSKBN17F0N2
[8] https://bitfury.com/content/4-press/4_13_17_the_bitfury_group_ukraine_egovernance_release.pdf

#data #blockchain #dlt #government
Будет ли фармацевтика будущего в руках крупнейших фармацевтических холдингов или человечество придумает когда-либо способ сохранять здоровье и излечиваться от болезней без безумных расходов на лекарства и врачей?

Ответ на этот вопрос пока нельзя узнать, что можно узнать так это то что активно в мире развивается движение под названием "open source medicine". Как развитие открытых исследований сопровождаемых публикацией исходных кодов. Организация Medicines for Malaria Ventures финансирует проекты по открытым исследованиям [1], а проект Open Source Malaria [2] привлекает сотни ученых по всему миру к поиску открытого лекарства от малярии. Подробнее можно прочитать в научной статье "Open Source Drug Discovery: Highly Potent Antimalarial Compounds Derived from the Tres Cantos Arylpyrroles".

Structural Genomics Consortium [4] публикует структуры молекул для стимуляции последующих исследований. А CO-ADD The Community for Open Antimicrobial Drug Discovery [5] формирует сообщество по поиску новых антибиотиков.

Это, безусловно, не единственные проекты в этой области, и в то же время именно такие проекты формируют будущее медицины и поиска новых лекарств.

Ссылки:
[1] https://www.mmv.org/research-development/open-source-research
[2] https://opensourcemalaria.org/
[3] https://pubs.acs.org/doi/full/10.1021/acscentsci.6b00086
[4] https://www.thesgc.org/
[5] https://www.co-add.org/

#opensource #health #opendrugdiscovery
Многие уже написали о проекте USAFacts [1] который представляется как "USAFacts is a new data-driven portrait of the American population, our government’s finances, and government’s impact on society."

Действительно, интереснейший проект с собранными и удобно поданными данными о населении, финансах, доходах и расходах бюджета и многом другом.

Проект, очень хорошо сделан, в нем интересно что цифры предоставляются в сравнении с 1980 года и в том что за каждой цифрой есть тщательная методология [2], вдохновением для проекта оказался разговор Стива Балмера с женой [3], в котором он задался вопрос о том что государство делает с теми деньгами что оно собирает в виде налогов.

На мой взгляд это одна из лучших визуализаций бюджетов стран и, конечно, это ровно тот проект который логично было бы иметь любому государственному мозговому центру до начала любых реформ. В какой-то степени он напомнил мне проект DataUSA [4], который тоже совсем недавно упоминался и в котором собрана локальная и гиперлокальная статистика образования, производства, здравоохранения, населения и многое другое.

Подобный проекты практически всегда основанные на открытых данных. Но на открытых данных прошедших тщательную верификацию и упаковку в аналитический продукт.

Ссылки:
[1] https://www.usafacts.org
[2] https://www.usafacts.org/methodology
[3] https://www.usafacts.org/about
[4] https://datausa.io/

#opendata #data #analytics

P.S. Теперь я также начал вести блог на Medium и для тех кому это удобнее, можно читать меня там https://medium.com/@ibegtin/usafacts-e5c623c81097
Вышел доклад "The State of weather data infrastructure" [1] от The Open Data Institute посвященный инфраструктуре метерологических данных в Великобритании, других странах и данных создаваемых частным сектором.

Это интересный отчет для всех кто интересуется тем как устроены метеоданные за пределами России. Главные тезисы отчета можно свести к следующим:

• бизнес активно создает новые сенсоры и платформы и создает и анализирует метеорологические данные без участия государства;
• метеорологические ведомства, с одной стороны должны регулярно обновлять парк оборудования и использовать суперкомпьютеры, а с другой от них ждут открытых данных и сами они публикуют данные открыто, а не продают их;
• необходимы дополнительные инвестиции в data инфраструктуру метеоданных для обеспечения доступности данных.

В докладе много ссылок на существующие частные инициативы. Например, проекты PlanetIQ [2] и TAMDAR [3] , а также много последних новаций в том что касается предсказания погодных явлений.

Ссылки:
[1] https://theodi.org/the-state-of-weather-data-infrastructure-white-paper?utm_source=digg
[2] https://planetiq.com/
[3] https://weather.panasonic.aero/

#opendata #data #weather