Ivan Begtin
8.09K subscribers
1.99K photos
3 videos
102 files
4.71K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
Download Telegram
В октябре началась общеевропейская кампания против сбора биометрии основанной на лице человека "Reclaim your face" (Верни себе лицо) [1] инициированная группой НКО таких как: AccessNow, Article 19, Privacy International и др. На сегодня их петицию подписали 4362 человека [2]

В кампании даны три акцента:
- прозрачность (объясняйте зачем собирается биометрия)
- красные линии (некоторые способы сбора биометрии опасны и лучше запрещать все)
- уважение к людям (биометрия не должна использоваться для массовой манипуляции, уважайте свободу воли)

Ссылки:
[1] https://reclaimyourface.eu/
[2] https://reclaimyourface.eu/the-solution/#sign

#privacy #sureillance
Для тех кто интересуется как устроена работать с данными юридических лиц по всему миру, существуют как минимум два проекта по открытости в этой области.

OpenCorporates [1] крупнейшая в мире открытая база юридических лиц с информацией по более чем 187 миллионам компаний, с некоторыми пробелами (Беларусь и Украина есть, а России нет). Часто информация очень ограничена, без сведений о владельцах, только первичные записи в страновых реестрах. Но для многих задач, например, журналистики данных и этого достаточно.

OpenOwnership [2] НКО, большой проект и реестр юридических лиц с фокусом на раскрытие информации о владельцах организаций (по России данных также нет, но по россиянам владельцам долей в зарубежных компаниях есть). Уже публикуют значительный по объёму набор данных [3] в 18 GB и, что немаловажно, ведут системную работу над стандартом Beneficial Ownership Data Standard (BODS) [4]

Сам проект является результатом кооперации 6 НКО со специализацией на расследованиях в отношении конечных владельцев организаций и работе с базами юридических лиц.

Ссылки:
[1] https://opencorporates.com/
[2] https://www.openownership.org/
[3] https://register.openownership.org/download
[4] https://standard.openownership.org

#opendata #data #ownership
Стартап Inrupt Тима Бернерса-Ли анонсировал корпоративную версию их платформы приватности Solid [1] основанной на проекте с открытым кодом [2]. Идея проекта в том что персональные данные пользователя хранятся в специальных базах данных Personal Online Data Stores и доступны сервисам только тогда когда выполняются конкретные задачи.

Финансирование проекта $16.44M из фондов Glasswing Ventures и Octopus Ventures. Сейчас это финансирование на посевной стадии, привлечено в начале и в конце 2019 года.

Основатели стартапа John Bruce и Tim Berners-Lee, а главный архитектор безопасности Bruce Schneier [3].

Мой прогноз результаты будут очень сильно зависеть от развития регулирования персональных данных в мире, со стороны центральных банков и правительств. Без сильных лоббистских усилий будет сложно добиться значимого результата.

Ссылки:
[1] https://techcrunch.com/2020/11/08/tim-berners-lees-startup-inrupt-releases-solid-privacy-platform-for-enterprises/
[2] https://solidproject.org/
[3] https://www.schneier.com/

#data #privacy
Solid, конечно, не первый и не последний проект с фокусом на возврат данных пользователя/потребителя под его контроль. Таких проектов было и появляется много, далее краткий список.

- Bits about me [1] стартап базирующийся в Швейцарии. Для пользователей бесплатно, продают сервис корпорациям
- Cozy [2] позиционируют себя как личное облако данных. Ещё не предоставляют услугу передачи данных 3-м сторонам с согласия пользователя, но могут добавить с большой легкостью
- DataFund [3] разработчики ПО по децентрализации контроля за персональными данными, аналога Solid у них нет, но есть некоторые первые шаги
- PolyPoly [4] декларируют разработку продуктов по контролю над своими данными, в открытом доступе пока смотреть нечего
- iGrant [5] ещё один европейский стартап управления согласием пользователя, пока результатов не видать.
- MetaMe [6] аналогично, про монетизацию личных данных. Есть только видео

Таких проектов ещё много, чаще всего они классифицируются как PIMS, Personal Information Management Systems [7] куда входят и продукты по защите приватности и продукты по управлению личными данными.

Ссылки:
[1] https://bitsabout.iss.one/en/
[2] https://cozy.io/en/
[3] https://datafund.io
[4] https://polypoly.com
[5] https://igrant.io/
[6] https://metame.com
[7] https://cyber.harvard.edu/projectvrm/VRM_Development_Work#Personal_Information_Management_Systems_.28PIMS.29

#privacy
Правосудие "тяжёлая тема" не только в России, но и в таких странах как США. Юристы стоят дорого, во многом от того что для граждан судебная система более всего напоминает лабиринт. Приложение UnBail [1] переводит судебные разбирательства на язык и форму понятную обывателям, дает пошаговое объяснение судебного процесса и, в принципе, связывает его с сообществом.

Один недостаток, пока это скорее прототип, доступный только после пожертвования команде разработчиков.

И здесь мне хотелось бы сказать что в России оно было бы актуально как никогда.


Ссылки:
[1] https://www.unbail.org/

#justice #mobile
Stuff That Works [1] израильский стартап превращающий данные личного опыта в здоровье в анализ мер и формулировку рекомендаций.

Продукт позволяет пользователю выбрать его состояние и заполнить подробную анкету по развитию этого состояния, информацию о себе, курсе(-а) лечения и результате. Авторы декларируют подход на основе искусственного интеллекта, правда, непонятно где он там.

Финансирование в $9 миллионов стартап получил в июле 2020 года от трёх венчурных фондов [2].

Общая картина. Stuff That Works не первый стартап в этой области, ранее были CrowdMed [3], SickWeather [4], PatientsLikeMe [5] и другие. Главная проблема таких проектов в объективности тех кто описывает свои случаи. Врачебное сообщество, как правило, выступает против рекомендаций в таких проектах что видно, в первую очередь, и в том что за ними и в их командах нет врачей или врачебных институциональных организацией которые бы подтверждали что такой подход имеет право на существование.

Ссылки:
[1] https://www.stuffthatworks.health
[2] https://www.crunchbase.com/organization/stuff-that-works
[3] https://www.crowdmed.com
[4] https://www.sickweather.com/
[5] https://www.patientslikeme.com/

#health #crowd #data
Тем временем выяснилось что Apple использует проверку ключей разработчиков для отслеживания информации о том какие приложения есть на устройствах пользователей с помощью протокола ocsp [1] используемого для верификации сертификатов.
Может это и не отслеживание каждого запуска каждого приложения, но вполне себе слежка за тем что они установлены и используются.

А также, это важно отметить, поскольку все запросы в протоколе ocsp выполняются через http, то это отслеживание может осуществлять не только Apple, но и Ваш домашний провайдер, Ваш работодатель и Ваш дружелюбный сосед человек-паук хакер из соседнего подъезда прослушивающий Вашу сеть.

Если сервис отслеживания ещё не появился в системах мониторинга трафика, то почти наверняка скоро появится.

Ссылки:
[1] https://blog.jacopo.io/en/post/apple-ocsp/

#privacy #security #apple
Свежее исследование Gartner "Debunking Myths and Misconceptions About Artificial Intelligence, 2021" доступно для скачивания у них на сайте [1] и на ресурсах их партнеров и игроков рынка AI, вроде DataIku [2]


Ссылки:
[1] https://www.gartner.com/en/doc/724462-debunking-myths-and-misconceptions-about-artificial-intelligence-2021
[2] https://content.dataiku.com/gartner-debunking-ai-myths/gartner-debunking-myths-about-ai-2021

#ai #gartner
Нынешнюю деятельность Минцифры России я критикую меньше чем других органов или их же деятельность в предыдущем составе. Это не значит что там всё хорошо, просто:
a) Не доходят у меня руки.
б) Во многих других органах власти ситуация значительно хуже.

Пока приведу несколько примеров в моей области, того что они могли бы исправить быстро и что относится скорее к общей организации работ:
1. Реестр аккредитованных организаций в сфере ИТ ведётся как-то уж очень неаккуратно. Открытые данные не публиковались с 2016 года [1]. По хорошему надо бы обновить
2. Тот же реестр публикуемый на сайте Минцифры содержит не менее 119 некорректных реквизитов организаций [2], кодов ОГРН и ИНН. В код ИНН ещё и вписывается предыдущий код ИНН в случаях если одна организация наследует у другой. Что это означает? Это означает что любая аналитика по ИТ рынку на основе этого реестра имеет минимальную погрешность окого 1% (119 записей из 12 тысяч записей всего) и реальную погрешность пока трудно оценить потому что вес разных ИТ компаний в рынке разный.
3. Реестр отечественного ПО в принципе не публикуется ни как открытые данные, ни как Excel файл, а доступен только в форме веб-сайта с поиском и просмотром [3]
4. В реестр удостоверяющих центров [4] включены юридические лица прекратившие своё существование ещё в 2018 году и ранее. Некоторые были закрыты относительно недавно в 2020 году. Например это такие организации как: ООО "КРИПТОАНАЛИТИКА", ООО "ГСЦ", ООО Компания "Эксклюзивные решения" и другие. Весь список не привожу только из лени, проверять каждую организацию долго, но автоматизировать можно. Что важно - у всех из них на сайте корневого УЦ указано что их лицензии действующие.

В целом ничего из этого чем-то критичным не является. Но качество данных складывается из их доступности, своевременности, открытости, пригодности к машинной обработки и доверительности. А доверительность складывается из регулярных проверок данных на полноту и точность.

Ссылки:
[1] https://digital.gov.ru/opendata/7710474375-registergosaccred/
[2] https://digital.gov.ru/ru/activity/govservices/1/
[3] https://reestr.digital.gov.ru/
[4] https://e-trust.gosuslugi.ru

#data #digital
Я ранее писал про бюджетно-простой инструмент визуализации связей между людьми/организациями и просил присылать мне ссылки. Много ссылок было полезных, а вот все забыли или быть может не вспомнили про Oligrapher [1] (да и я сам про него вспомнил только сегодня и неожиданно). Это инструмент на Javascript по построению графов влияния, так называемый influence mapping. Сделала его команда проекта LittleSis [2], большой открытой базы власть имущих и окружающих их членов семьи, соратников, лоббистов и других участников государственной деятельности.

Проект, создан в США, а пользуются им многие общественные группы для вылавливания разного рода связей между лоббистами и решениями государственных органов.

Не хочу гадать возможен ли в нашей стране такой проект, но не могу не отметить что многое из его кода доступно в том числе как раз этот инструмент Oligrapher [3]

Ссылки:
[1] https://littlesis.org/oligrapher
[2] https://littlesis.org
[3] https://github.com/public-accountability/oligrapher

#visual #lobbists
Мне честно говоря хотелось сегодня дописать очередное письмо в рассылку с долгими рассуждениями на тему качества данных, но поскольку самая злободневная тема сейчас - это реформа госуправления анонсированная председателем Правительства, то я поддамся хайпу и немного опишу как я это всё вижу практически со стороны (я давно стою в одном шаге от госслужбы, но всё ещё не там).

Для разнообразия, писать буду простым русским языком:
1. Не открою большого секрета что из всех статей расходов органов власти самые исполняемые (осваемые) расходы - это фонд оплаты труда. Тут нет срыва контракта, недоведения субсидии и так далее. Даже средства выделенные под вакантные должности до конца года могут быть распределены. Поэтому сокращение вакансий - это, конечно, сокращение премиального фонда, но реально органы власти "зашевелились" бы только в случае прямого директивного сокращения ФОТ. Предусматривается ли сокращение ФОТ вот в чём вопрос?
2. История про сокращение численности ОИВ не нова. За последние лет 15 органы власти более чем эффективно переводили своих сотрудников в бюджетные, автономные и казённые учреждения, а также унитарные предприятия и делали они это именно под таким давлением с требованиями сокращения штата. На что это повлияло? Только на рост числа таких учреждений, торможение приватизации ФГУПов (ну, там много причин).
3. Со временем Минфин стал указывать на то что такая практика есть и что "мы всё видим, не жухлюйте" ну и в принципе госучреждения - это, конечно, полегче чем госслужба, но многих работников творческих профессий и в них не упихнёшь да и 44-ФЗ и 223-ФЗ тоже радости не доставляют. Поэтому пошла мода на массовое создание подведомственных НКО (АНО и Фондов).
4. Подведомственные НКО не надо путать с термином GONGO (Government Oriented NGO). GONGO называют организации НКО зависящие от господдержки и проводящие госполитику из-за этой зависимости. А подведомственные НКО - это когда, например, Правительство РФ переводит Аналитический центр при нём же в статус АНО или как ДИТ Москвы учреждает АНО по Цифровой трансформации. Я писал об этом большую колонку в РБК [1]
5. АНО и Фонды не единственные, но наиболее популярные формы замещения госслужбы с сохранением значительной части административного ресурса и возможности выплаты условно любого размера денежного вознаграждения.
6. К чему приведет текущая реформа сокращения госаппарата? К росту ФОТ в подведомственных госучреждениях и появлению десятка новых НКО созданных органами власти.

А теперь вопрос: Что с этим делать?

Если исходить из текущей парадигмы реформы госаппарата про сокращение денег, то:
1. Приравнивание сотрудников госНКО к госучреждениям.
2. Единый реестр госслужащих и сотрудников бюджетных учреждений (включая сотрудников госНКО).
3. Мониторинг фактического изменения оргструктуры и коллективов (и нормальный учёт вакансий).

Но, скажу честно, важнее знать причины роста госаппарата. И тут мы возвращаемся к росту нормативно-правовой базы. Новые законы, Постановления Правительства и Указы Президента формируют органам власти новые полномочия и очень редко убирают старые. Новые государственные информационные системы - это не ИИ заменяющий оператора, а это новые сотрудники, новые бюджетные расходы и ещё много чего.

Потому что, да простят меня многоуважаемые коллеги, девиз госслужбы и по сей день во многих странах мира - это "не подпалить задницу и расширить штат".

Что могло бы быть настоящей хардкорной реформой?
1. Упразднение территориальных управлений ФОИВов. Частично возврат полномочий субъектам федерации, в остальном перевод взаимодействия онлайн везде где это возможно.
2. Создание в России аналога американского General Services Administration (GSA), это Министерство государственного управления РФ. Передать ему _все без исключения_ хозяйственные службы ФОИВов, перевести туда весь административный персонал. И через него осуществлять закрытие вакансий.

Ссылки:
[1] https://www.rbc.ru/opinions/politics/13/03/2020/5e69e70a9a7947737fc79cf3

#reflection #thoughts
В International Budget Partnership (IBP). выпустили первое исследование о высших органах аудита (supreme audit institutions) о том как устроена их работа [1], также это исследование можно прочесть в кратком изложении [2]

Отчет состоит из анализа шести компонент:
1. Институциональная рамка
2. Публичный внешний отчет от Органа высшего аудита
3. Парламентский надзор
4. Реакция исполнительной власти
5. Независимые последующие шаги
6. Общественное участие

Про Россию отдельно там ничего нет, оценок по странам тоже, есть только сводные графики по группам стран по блокам EUROSAI, ASOSAI и тд.

Эта работа совместная IBP и INTOSAI Development Initiative [3]

В отчёте также много рекомендаций по открытости органов высшего аудита, о них я напишу отдельно.

Например, рекомендации для органов высшего аудита в краткосрочном периоде относятся к публикации всех отчетов, обязательного публичной проверки исполнялись ли рекомендации, коммуникации с организациями гражданского общества при подготовке планов проверок и оценка собственной независимости в соответствии с лучшими мировыми практиками.

И многое другое.

На них же можно смотреть и для построения внутристрановой оценки открытости органов парламентского аудита по субъектам федерации в России.

Ссылки:
[1] https://www.internationalbudget.org/publications/all-hands-on-deck-harnessing-accountability-through-external-public-audits/
[2] https://www.internationalbudget.org/oversight-systems-exec-summary/
[3] https://www.idi.no/

#open #sai #accountingchamber
Аналогичное нужно и по локальным рынкам, вроде российского. Сколько собирает Яндекс, сколько Аэрофлот и тд
Forwarded from Инфографика
Какие компании собирают больше всего персональных данных.
Исторические документы о деятельности гос-ва моя слабость. То что Минфин их публикует - это великолепная новость. Ещё бы Росстат публиковал архивные стат сборники
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Более 1000 документов доступны в Цифровом архиве Минфина России.

В начале ноября заметила [1], что в разделе "Исторический бюджет" на сайте Минфина России перестали отображаться исторические документы.

Пишу апдейт: Данные снова стали доступными на следующий день после публикации поста и отправленного в Минфин запроса. Но это еще не все. Из ответа на запрос (полученного, кстати, через две недели, а не через месяц как раньше), узнала о существовании нового и хорошо спрятанного раздела "Исторические документы", в котором можно познакомиться с содержанием 1186 оригинальных исторических документов на русском и иностранном языках, изданных в период с 1667 по 1917 годы [2].

В этом разделе можно, например, найти:

- Роспись расходов на 1866-1917 годы, в т.ч. с объяснительными записками Министра финансов;
- Государственные бюджеты СССР и Роспись общегосударственных расходов РСФСР;
- Историю всемирной торговли 1876 года;
- Основные элементы политической экономики 1902 года;
- Справочный коммерческий словарь, собранный и изданный Иваном Вавиловым;
- О прошлом и настоящем русской администрации 1913 года;
- и многое другое.

Пока архив представлен в виде сканов документов хорошего качества, но, надеюсь, Минфин России на этом не остановится и данные о бюджетах, расходах и доходах переведет в машиночитаемый вид. Минфин России, если вам нужна в этом помощь - пишите, подумаем, чем можем помочь в рамках проекта "Госзатраты" ^_^

[1] https://t.iss.one/ahminfin/292
[2] https://minfin.gov.ru/ru/ministry/museum/historylib/
Подготовил очередное письмо в рассылку "#8. Качество данных и всё что с ним связано" [1]

Среди многочисленных тем связанных с данными одна является одной из наиболее актуальных и значимых и тем сложнее к ней подступаться чтобы хотя бы начать. Это тема качества данных (data quality). Эта тема очень большая, входящая в тему управления данными (data governance) и охватить её разом не получится, поэтому я сейчас скорее “пробегусь по верхам“, а далее уже в отдельных рассуждениях в следующих письмах буду писать про отдельные её области.

Ссылки:
[1] https://begtin.substack.com/p/8-

#dataquality #data