Ivan Begtin
7.99K subscribers
1.87K photos
3 videos
101 files
4.58K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
Download Telegram
Многочисленные коллеги троллят меня попаданием в рейтинг экспертов в цифровой экономике [1] Центра политической коньюнктуры где определили мне 4-е место в списке.

Я узнал об этом ещё полтора дня назад, но надо было вволю выматериться прежде чем писать взвешенное мнение.
Если сформулировать моё мнение коротко то звучит оно так что если составлять рейтинг наиболее идиотских рейтингов то этот рейтинг ЦПК будет на первом месте.

Если подробнее, то рейтинг в котором оценка идёт по популярности, в котором намешаны небольшое число реальных экспертов, большое число функционеров, некоторое число пиарщиков и какое-то количество вообще не пойми кого - это не рейтинг, это злое$&*ая хрень нужная ЦПК для самопиара. Мы узнали что в ЦПК ничего не понимают в цифровой экономике? Ну, ок, это не новость. Я знаю лично несколько десятков людей являющихся реальными экспертами.

Не читайте по утрам советских газет рейтинги ЦПК (с) и уж точно не верьте им.

Ссылки:
[1] https://cpkr.ru/analytics/reyting-ekspertov-v-sfere-cifrovoy-ekonomiki

#ratings
The Economist Intelligence Unit выпустил индекс демократий за 2019 год, Democracy Index 2019 [1]
Его краткие выводы:
1. Демократия отступает понемногу. С уровня 5.48 в 2018 году до уровня 5.44
2. Лишь 5.7% населения планеты живут при полных демократиях, ещё 42,7% при искаженной демократии (демократии с недостатками) и остальные при гибридной и авторитарной власти
3. В 2019 году 68 стран стали чуть менее демократичными и 65 стран чуть более демократичными
4. Россия на 134 позиции из 167, обгоняет Казахстан, Китай, Беларусь и отстаёт от Камбоджи и Зимбабве.
5. Оценка на которую стоит особенно обратить внимание это оценка России на 1.71 из 10 по категории "Функционирование государства". Это очень низкая оценка, на постсоветском и восточноевропейском пространстве ниже только оценки Туркменистана и Таджикистана.

Ссылки:
[1] https://www.eiu.com/topic/democracy-index

#ratings #russia #eui
Как устроены разного рода рейтинги и рэнкинги?

В последнее время меня спрашивали о том как устроены те или иные рейтинги. Я, в первую очередь, могу немало рассказать о том что касается разного рода рейтингов открытости, но не только. Рейтинги, часто, по разному, имеют значимые отличия в причинах происхождения и по разному к ним стоит относится. К рейтингам по разному относятся и те кого рейтингуют/ранжируют или косвенно затрагивают этим ранжированием.

Здесь надо оговориться что рейтингование - это выставление оценки, а рэнкинг - это ранжирование объектов по этим оценкам. В России это обычно путают и называют рейтингами результаты рэнкинга, поэтому я буду использовать тут тоже слово “рейтинг” как основное, но держать в голове неоднозначность определения.

Итак зачем вообще делают рейтинги и рэнкинги?
...
Текст полностью в рассылке https://begtin.substack.com/p/rankings

#ratings #rankings
В свежем Democracy Index 2020 Россия на 124 месте с оценкой 3.31 - между Эфиопией и Нигером. Казахстан на 128 месте и Беларусь на 148 месте [1].

Я всегда обращаю внимание на то что у России очень низкие оценки по блоку "Functioning of the government".

Ссылки:
[1] https://www.eiu.com/public/topical_report.aspx?campaignid=democracy2020

#ratings #rankings
Вышла публикация Мирового банка - GovTech Maturity Index : The State of Public Sector Digital Transformation [1].
Кроме самих наблюдений в документе есть рейтинг стран по группам цифровой зрелости. Так, например, Россия относится к странам категории "B", это: High: significant focus on GovTech. В эту группу входит 59 стран, например, Чехия, Кипр, Руанда и ещё много какие ещё.

О некоторых странах там есть более подробные обзоры, но не о России, Россия просто приводится в списках и в рейтинге. Да и сам доклад переведён на французский и испанские языки, но не на русский. В общем, не для нас писали, а для африканских и южноамериканских стран.

Обратите внимание на новые акценты. От Digital government следующим шагом указывают GovTech. То есть отечественные бренд-неймеры инициатив вовремя подсуетились;)

Ну и несколько картинок оттуда прилагаю.

Ссылки:
[1] https://openknowledge.worldbank.org/handle/10986/36233

#ratings #govtech #wb #data #opendata
Я готовлю большое обновление материалов по открытому государственному коду в мире который мониторю уже 7 лет и вот сейчас запустил пересчёт статистики которая почти готова. Через какое-то время опубликую лонгрид и наборы данных по этой теме, а пока просто в цифрах и оценка, пока без какой-либо инфографики и визуальной подачи. Просто текстом.

Есть два рейтинга стран по открытости кода на Github по числу форков и по числу звезд поставленных репозиториям относящихся к госорганизациям из этой страны.

Топ стран по числу форков госкода
1. США - 56541
2. Великобритания - 29339
3. Франция - 7932
4. Канада - 7794
5. Италия - 5368
6. Австралия - 3452
7. Япония - 2941
8. Германия - 2794
9. ООН - 1970 (не страна, но добавлены в сравнение)
10. Норвегия - 1948

Топ стран по числу звезд
1. США - 120246
2. Великобритания - 46536
3. Франция - 22317
4. Германия - 12429
5. Канада - 10475
6. Италия - 8996
7. Япония - 7434
8. Австралия - 5014
9. Норвегия - 3232
10. ООН - 2735

Применительно к США и Великобритании заниженные оценки поскольку учитывались только репозитории центральных органов власти и не учитывались репозитории государственных исследовательских центров.

Топ 5 наиболее популярных госрепозиториев по числу звезд
- gchq/CyberChef от британского киберагентства GCHQ (UK) - 13685 звезд (российскому ФСТЭК на заметку). ПО для инфобеза
- nasa/openmct от космического агентства NASA (США) - 10093 звезд. ПО для контроля миссий
- nasa/fprime от космического агентства NASA (США) - 8653 звезд. ПО обеспечения полетов
- tokyo-metropolitan-gov/covid19 от городских властей Токио (Япония) - 6265. ПО для визуализации данных и сами данные о COVID-19
- uswds/uswds от агентства GSA (США) - 5912. Дизайн система федерального правительства США.
Открытые данные об открытом исходном коде

Органы власти не просто используют открытый код, они публикуют код который используют десятки тысяч пользователей разработчиков.

Продолжение следует
А в лонгриде я добавлю больше сравнений стран, рейтинги репозиториев по разным критериям и сравнение развития репозиториев органов власти и так называемых civil hackers, представителей НКО и неформальных групп помогающих создавать код для повышения качества работы государства.

#opensource #opendata #ratings
Вышел глобальный индекс мира (Global Peace Index), разработан Институтом экономики и мира (IEP).

Россия уверенно обгоняет Сирию, Йемен и Афганистан, но отстаёт в миролюбии от Северной Кореи и Сомали занимая почетное 4-е место с конца списка миролюбивых стран.

На постсоветском пространстве лидирует Эстония, далее Латвия и Литва.

Очень сильно просело миролюбие у Казахстана, на 29 позиций и Киргизстана на 21 позицию. У Казахстана самое большое падение миролюбия в мире.
Миру мир, а аналитикам данные!

Индекс публикуется с почти открытыми данными [1], в формате XLSX, не под свободной лицензией, но это хоть что-то пригодное к анализу.

Ссылки:
[1] https://www.visionofhumanity.org/public-release-data/

#data #ratings #peace #countries
В любом случае я хочу закончить тем же с чего начал, ребята молодцы что делают хоть что-то. Делают как могут. А от себя добавлю что Счетная палата могла бы сделать немало для собственной открытости просто опубликовав таблицу планов проверок и их результатов. В таком, знаете формате: запланировано, проведено, опубликовано (ссылка). А не просто план, без публичного перечня результатов. Открытость, она, всегда, не в том чтобы публиковать что ты можешь, а в том чтобы публиковать то что "вызывает боль".

Ссылки:
[1] https://ach.gov.ru/news/otkrytost-2022
[2] https://www.kommersant.ru/doc/5480518
[3] https://globaldatabarometer.org/country/russian-federation/
[4] https://opendatacharter.net/principles/

#opendata #ratings
Честно говоря хочется больше писать про технологии, что я, обычно, и делаю, но иногда не могу не отвлечься на темы связанные с нашим государством и цифровизацией.

Вот, например, Минстрой РФ выпустил "Индекс IQ городов" [1] где, ожидаемо, Москва на первом месте. Казалось, какой хороший индекс, составляли его по 47 показателям и целых 10 направлений: городское управление, умное ЖКХ, инновации для городской среды, умный городской транспорт, интеллектуальные системы общественной и экологической безопасности, туризм и сервис, интеллектуальные системы социальных услуг, экономическое состояние и инвестклимат, а также инфраструктура сетей связи

Вот только когда посмотришь на его внутренности [2], то сразу выясняется что:
1. Методология не опубликована, неизвестно что там и как это менялось.
2. Перечня показателей нет (должно быть в методологии).
3. В целом сравнение двух городов в статусе субъектов федерации (Москва и Санкт-Петербург) и всех остальных, являющихся муниципальными образованиями, выглядит даже не надуманно, а скажем так, претенциозно.

Я было поискал первоисточник, но на ведомственном проекте Минстроя "Умный город", та же новость [3] с тем же документом.

Поэтому властям Москвы нечем гордится что они на первом месте в этом индексе, потому что индекс этот мусорный.

У любого нормального рейтинга/оценки, разумеется, должны быть доступны методология, таблицы с оценками, показатели, описаны перечень изменений, должен быть ответственный за методологию, тот кто отвечает за его составление и коллектив авторов.

Меня лично, в принципе, крайне печалит продукция многих органов власти в последние годы. Это просто какая-то интеллектуальная хрень не оправданная ничем.

Далее постараюсь побольше писать про технологии, а не про вот это вот всё.

Ссылки:
[1] https://www.minstroyrf.gov.ru/press/minstroy-rossii-opublikoval-indeks-iq-gorodov/
[2] https://www.minstroyrf.gov.ru/upload/iblock/672/REZULTATY-OTSENKI-KHODA-I-EFFEKTIVNOSTI.pdf
[3] https://russiasmartcity.ru/news/publications/51

#government #ratings #bullshit
Global Index on Responsible AI

Новый индекс/рейтинг стран, в этот раз по ответственному отношению к применению искусственного интеллекта [1]․ Сейчас он на стадии проектирования, но уже в 2022-2023 годах планируется сбор данных по 120 странам и публикация результатов. Текущие наработки по индексу авторы регулярно публикуют [2].

Я думаю что первые результаты появятся ближе к 2023 году. Что немаловажно, много гражданских активностей по открытости данных сдвигается в этом направлении. Те НКО которые ранее фокусировались на открытости, сейчас ищут новые цели в своей работе и защита прав граждан при эксплуатации ИИ - это одна из таких тем.

Например, создание этого индекса финансируется IDRC CRDI, канадским агентством развития финансировавшим многие технологические проекты по открытости данных.

Именно этот индекс, почти наверняка, будет основан на анализе законодательства и прав человека в контексте применения ИИ. Увы, я бы не ожидал у России там высокой позиции в оценках.

Ссылки:
[1] https://responsibleaiindex.org/
[2] https://www.d4d.net/news/designing-a-rights-based-global-index-on-responsible-ai/

#opendata #ai #ratings
Чуть подробнее про Critical Technology Tracker [1] проект австралийского мозгового центра ASPI по отслеживанию ведущих научных центров и исследователей по наиболее значимым (критичным) технологиям.

Сделано в виде красивой интерактивной визуализации, весьма наглядно и можно увидеть рейтинги отдельных исследовательских центров и то как перетекают студенты вузов между странами и далее, кто из них остаётся получать научные степени и работать в индустрии.

На картинках примеры визуализации по России и в области анализа данных, но, сразу скажу, рейтинги России тут невысоки. В большинстве направлений лидируют Китай и США с большим отрывом и ещё где-то присутствуют Индия, страны ЕС, Великобритания и Южная Корея. А по умным материалам ещё и Иран(!) [2]

Методология этого проекта в анализе публикаций исследователей и их цитирования. Кто-то может измерять вклад стран по числу патентов, но важнее понимать что почти все такие сравнения стран показывают лидерство Китая.

Ссылки:
[1] https://techtracker.aspi.org.au/
[2] https://techtracker.aspi.org.au/tech/smart-materials/?c1=ir

#china #technology #australia #data #ratings
WBG_GovTech Dataset_Mar2023.xlsx
5 MB
Вдогонку к тому о чём я только что писал про Гостех, таблица с данными по всем странам которые оценивали в рамках индекса GMTI. Там все первичные данные, ссылки на законы, госполитику и тд. Заодно можно увидеть что эксперты Всемирного банка чаще всего сомнительные случаи трактуют в пользу страны и там есть какое-то количество устаревших пунктов, вроде того что в России ещё есть национальный портал открытых данных, тем не менее полезно посмотреть для того чтобы посмотреть на основе чего формируются оценки и из чего складываются оценки других стран.

#govtech #ratings #datasets
Я, кстати, зачитался просто оценкой России по GMTI, она есть в файле который я ранее постил [1]. Открываете вкладку Metadata, выбираете страну Russia и смотрите оценки по каждому пункту. А там столько интересного что я даже не знаю, заполняли ли это эксперты на зарплате у Российского пр-ва или просто не знающие что тут реально происходило и происходит.

Итак, по пунктам:
- I-33.1 - знаете какая основная структура отвечает за Гостех в России? Можно пару попыток. Нет, не угадали. Это Агентство стратегических инициатив https://asi.ru 😐.
- I-34.6 - оказывается в России есть документ определяющий Data Governance strategy / policy. А знаете куда ведёт ссылка? В корень сайта аналитического центра при Пр-ве. 😱 Куда же они его спрятали там ?!
- I-35.1 - оказывается в России есть стратегия цифровой трансформации и это. трам-пара-рам - это Паспорт национальной программы «Цифровая экономика Российской Федерации». В файле ссылка приведена битая, но смысл не меняется. Те кто не читал этот паспорт, могут почитать тут [2]. Это не стратегия, это дорожная карта которые обычно пишут на основе стратегий, но стратегий нет. 😡
- I-37.4.1 - оказывается в России есть очень крутой закон о доступе к информации и он даже мониторится Росстатом [3] (вот этот пункт похож даже не на лукавство, а на чистый подлог, ничего такого нет по этой ссылке и мониторинг если и ведётся то в закрытом режиме и в АП РФ, а не Росстатом. Можно говорить что не ведётся). 😠

И так ещё десятки пунктов, у меня сейчас нет времени все их разбирать.

Но два тезиса я могу точно сформулировать.
1) Оценка России в индексе GMTI завышена и это на совести экспертов Всемирного банка которые её осуществляли. Если бы эта оценка хоть кого-то в мире волновала, то давно был бы скандал где индекс прополоскали бы в не-российских СМИ, но индекс не волнует никого кроме тех кто на него рукоблудит, например, пиарщиков Гостеха.
2) Там вообще нигде, никоим боком нет упоминания платформы Сбербанка которую называют в России Гостехом. Впрочем я об этом писал уже ранее.

Ссылки:
[1] https://t.iss.one/begtin/4835
[2] https://static.government.ru/media/files/urKHm0gTPPnzJlaKw3M5cNLo6gczMkPF.pdf
[3] https://rosstat.gov.ru/gosusligi1

#ratings #govtech #rant
Please open Telegram to view this post
VIEW IN TELEGRAM
Свежий OECD OURdata Index [1] рейтинг открытости данных по странам ОЭСР и кандидатам в члены ОЭСР. На первых местах Корея, Франция, Польша, Эстония, Испания, Ирландия, Словения, Дания, Швеция и Литва.

Выводов там немало, из важнейших то что:
- несмотря на COVID-19 всё ещё мало данных об общественном здоровье
- гораздо больше усилий государств по открытости данных/доступности данных, но не по повторному использованию
- только 48% особо ценных наборов данных доступно
- мало особо ценных данных о госфинансах и подотчетностью органов власти

Лично меня удивили низкие оценки Австралии, всегда был уверен что там неплохо всё развивается, но нет, не всё так хорошо. Также важно что оценивалась именно госполитика открытости данных, а не открытые научные данные, к примеру.

Ссылки:
[1] https://www.oecd-ilibrary.org/governance/2023-oecd-open-useful-and-re-usable-data-ourdata-index_a37f51c3-en

#opendata #oecd #ratings
Ещё один любопытный рейтинг и оценка стран Global organized crime index (Глобальный индекс организованной преступности) [1].

Его, оказывается, проводили ещё в 2021 году, а потом недавно повторили в 2023, а в его основе методика оценки уровня преступности применявшаяся ранее к африканским странам (проект ENACT).

Содержит два ключевых показателя:
- Criminality score (уровень преступности), чем ниже тем лучше
- Resilence score (уровень устойчивости), чем выше тем лучше.

По всем показателям лидирует Финляндия, хорошие оценки у Армении.

Каждый может найти что-то интересное для себя самостоятельно.

Датасет отдают как открытые данные, правда в Excel [2]


Ссылки:
[1] https://ocindex.net
[2] https://ocindex.net/assets/downloads/global_oc_index.xlsx

#opendata #ratings #crime
[EN]
GIRAI (Global Index of Responsible AI) report is available for 138 countries. It includes Armenian scores as well. Not so good to be honest( Looks like government has to do a lot with AI and it's responsibility.

It's generally available at https://global-index.ai

[RU]
Вышел Глобальный индекс ответственного ИИ (GIRAI) в виде отчета по 138 странам.

В нём есть и Армения, с очень низкими оценками, к сожалению( Похоже что Пр-ву есть много того что нужно сделать в этой области.

С индексом можно ознакомиться по ссылке https://global-index.ai

#armenia #indexes #ratings
Рейтинг открытости данных в Германии Open Data Ranking от OKF Germany [1].

На первом месте регион Schleswig-Holstein, на последнем Saxony-Anhalt, а ключевые оценки по юридической обязательности публикации данных.

Если посмотреть на рейтинг то кажется что всё не так уж хорошо, хотя, ИМХО, они игнорируют порталы геоданных которых в Германии немало, особенно на региональном и городском уровне.

В реестре Dateno сейчас 378 каталогов данных в Германии [2] из которых 211 - это геопорталы.

При этом почти наверняка в каталоге собрано далеко не всё, как минимум у каждой из земель в Германии есть собственный статистический офис и много муниципальных порталов данных.

Поэтому этот рейтинг скорее про качество госполитики чем про доступность данных, хотя авторы и пытаются это смешать и добавили туда оценку по доступности документов парламентов. Что, несомненно, важно, хотя и методически странно. Тогда надо бы разделять на меньшее число крупных блоков: законодательство, технологии, прозрачности власти.

В любом случае рейтинг полезен и любопытен.

Ссылки:
[1] https://opendataranking.de
[2] https://dateno.io/registry/country/DE

#opendata #data #germany #ratings
На днях просматривая разные рейтинги стран, регионов и тд. в которой раз убеждаюсь насколько большая часть из них не несёт реальной ценности для потребителей/читателей и сводятся они, в большей части, к хайпу СМИ которые их публикуют и создателей которые, опять же, ничего кто кроме веб трафика не ищут.

Пришла идея что очень простой, буквально студенческой задачей по дата журналистике было бы "опрактичивание" таких рейтингов.

Рассмотрим пример, вот есть рейтинг стран по "силе паспортов" [1] в нём есть список лидеров стран и сам он построен предельно просто, по баллам по числу стран к которым есть безвизовый доступ у владельца паспорта.

Полезен ли этот рейтинг реально? Только одним, что пр-ва стран соревнуются кто больше. Но для пользователя нет.

Что мы знаем про страны и про то как туда уезжают/приезжают? То что страны не одинаковы по территории и экономике. То что поездки в страны можно разделить на экономические, туристические и долгосрочные и наверняка ещё много всего.

Так вот если, к примеру, этот рейтинг дорабатывать/перерабатывать, то первый способ это добавить территории стран. Рейтинг меняется с числа стран, на долю суши к которой есть доступ без виз. Такой рейтинг всё ещё неидеален, поскольку доступность африканских стран не делает их сильно перспективными для туризма, но его теперь уже можно дорабатывать с оглядкой на эту цель.

Второй подход. Берём классификацию мирового банка по уровням доходов стран [2] и добавляем коэффициенты для каждого уровня. Самый простой подход в том чтобы дать коэффициент в 1 для стран Low Income, 4 для Lower-middle Income, 7 для Upper-middle Income и 10 для High Income. Эти коэффициенты примерно соответствуют градации в доходах при классификации стран МирБанком.

А потом скрестим это с индексом "силы паспорта". Будет такой True Passport Index. Потому что он будет показывать реальную силу паспорта по доступу к цивилизации. От текущего рейтинга он будет отличаться очень сильно в середине списка, а самые "слабые" и самые "сильные" паспорта почти наверняка останутся на своих позициях.

Это лишь один наглядный пример, по той же логике можно многие какие рейтинги переделать и нормализовать.

Будь у меня побольше свободного времени сейчас, я бы сам такое сделал просто как пример того как неудобны текущие примеры, и как сделать правильно.

Если никто не сделает в ближайшие месяцы, может быть и потрачу один выходной оформив это как тюториал. А так то любой желающий может проверить полезность этого подхода на этом или других рейтингах;)

Ссылки:
[1] https://en.wikipedia.org/wiki/Henley_Passport_Index
[2] https://blogs.worldbank.org/en/opendata/new-world-bank-group-country-classifications-income-level-fy24

#ratings #datajournalism #ideas