Отвлекаясь немного от тем данных глобально и локально, по поводу того что РКН активно начали штрафовать зарубежных хостеров за то что те не локализовались в России, а зарубежные хостеры, в свою очередь, массово начали отказываться от клиентов у которых есть хоть какая-то аффиляция с Россией. Пример Hetzner'а и Godaddy показательны. То есть почти все хостеры где есть хотя бы какое-то количество клиентов связанных с Россией будут от таких пользователей избавляться, и не из-за санкций и не невозможности оплаты, а потому что юристы им подобное порекомендуют, думаю что уже рекомендуют достаточно активно.
Но важно не только это. По сути это регулирование и его применение РКН на практике - это шаг к полной изоляции Рунета, возможно один из серьёзнейших. Во первых оно предполагает практически прямую цензуру поисковой выдачи, а единственная поисковая компания до которой российские власти могут сейчас дотянутся - это Яндекс, потому что можно говорить что Google здесь уже нет. Во вторых надо понимать что "зарубежные хостеры" - это практически весь интернет. То есть РКН может уже сейчас _формально законно_ заблокировать вообще всё.
Такая законность - это очень мутно-херовая штука, уж простите за резкость. И без того российскую юрисдикацию воспринимают как токсичную, а тут ещё и подобное.
Кстати, есть же часы судного дня для применения ядерного оружия. А нужны часы судного дня про отключение России от интернета. Произойти это может в любую сторону, но больше шансов что будет это изнутри.
#thoughts #russia #network #regulation #internet
Но важно не только это. По сути это регулирование и его применение РКН на практике - это шаг к полной изоляции Рунета, возможно один из серьёзнейших. Во первых оно предполагает практически прямую цензуру поисковой выдачи, а единственная поисковая компания до которой российские власти могут сейчас дотянутся - это Яндекс, потому что можно говорить что Google здесь уже нет. Во вторых надо понимать что "зарубежные хостеры" - это практически весь интернет. То есть РКН может уже сейчас _формально законно_ заблокировать вообще всё.
Такая законность - это очень мутно-херовая штука, уж простите за резкость. И без того российскую юрисдикацию воспринимают как токсичную, а тут ещё и подобное.
Кстати, есть же часы судного дня для применения ядерного оружия. А нужны часы судного дня про отключение России от интернета. Произойти это может в любую сторону, но больше шансов что будет это изнутри.
#thoughts #russia #network #regulation #internet
В рубрике как это работает у них проект PDAP, Police Data Accessibility Project [1], как очевидно из названия посвящён он доступности данных полиции в США для граждан и исследователей. Фактически это база из 1764 записей со ссылками на общедоступные данные полиции в США. Доступные в самых разных формах: геоданные в виде шэйпов, CSV файлы, страницы HTML или отчёты в PDF и с разбивкой по типу категории данных: преступность, вызовы полиции, остановки на дорогах, сведения о заключённых и так далее. Много всего и на основе этого можно, например, сравнивать штаты и отдельные графства по уровню актуальности и открытости их правоохранительных данных.
Для США это задача актуальная, полиция там децентрализована, систематизация данных процесс трудоёмкий, но одновременно с этим много хороших практик которые можно приводить в пример.
Ссылки:
[1] https://pdap.io
#opendata #usa #crime #police #data #datasets
Для США это задача актуальная, полиция там децентрализована, систематизация данных процесс трудоёмкий, но одновременно с этим много хороших практик которые можно приводить в пример.
Ссылки:
[1] https://pdap.io
#opendata #usa #crime #police #data #datasets
Я регулярно смотрю и слушаю выступления, читаю статьи и изучаю курсы про подготовке госслужащих в мире, сказывается то что я сам много лет выступал перед российскими госслужащими про работу с данными внутри гос-ва. Так вот поделюсь прочитанным, одна из наиболее актуальных тем последних лет - это Digital Public Infrastructure или, по-русски, Цифровая общественная инфраструктура.
Что это такое? Аналог можно провести с дорогами. Они могут быть магистральными или городскими, бесплатными или платными, но они создаются, за редким исключением, как общественная инфраструктура и ограничения по их использования не дискриминационны, а функциональны (по каким-то можно ездить большегрузам, а по каким-то нельзя).
Цифровая общественная инфраструктура - это что-то вроде сети дорог или иных общественных служб. Она состоит из сервисов которые обеспечиваются государством в широком смысле для решения общественных задач.
Например:
- государственная система идентификации, примерно как авторизация через Google или Facebook, как аналогии из коммерческого мира
- государственная система платежей
- государственная система обмена персональными данными (secure data exchange)
И в этот список ещё можно добавлять некоторое число других услуг и компонентов которые выходят за пределы использования только органами власти.
Знаете что самое интересное? Спикеры по этой теме в качестве примера приводят Россию. В их трактовке, вполне логично, НСПК (карты Мир и Система быстрых платежей) - это как раз часть Digital Public Infrastructure. А то что Россия, своевременно или с запозданием, подобное делает - это как раз очень правильно и логично, чтобы не зависеть от частных/глобальных подрядчиков и сервисов. Потому что они могут в любой момент уйти, накручивать цену или иным образом выворачивать руки.
Конечно, цифровая общественная инфраструктура - это куда более глубокая концепция включающая понятия подотчетности, прозрачности, интероперабельности, инклюзивности и ещё много чего, в первую очередь, общественного надзора. Также надо понимать что это скорее социалистическая/патерналистическая модель, которая идеологически ближе к РФ, если не делать оговорку на коррупцию и "сливания тем" приближённым олигополиям.
Лично я пока во многих странах виду движение в сторону DPI и даже предполагаю что рано или поздно это может стать одной из зонтичных концепций продвигаемых одной из междгосударственных структур.
#thoughts #digital #infrastructure
Что это такое? Аналог можно провести с дорогами. Они могут быть магистральными или городскими, бесплатными или платными, но они создаются, за редким исключением, как общественная инфраструктура и ограничения по их использования не дискриминационны, а функциональны (по каким-то можно ездить большегрузам, а по каким-то нельзя).
Цифровая общественная инфраструктура - это что-то вроде сети дорог или иных общественных служб. Она состоит из сервисов которые обеспечиваются государством в широком смысле для решения общественных задач.
Например:
- государственная система идентификации, примерно как авторизация через Google или Facebook, как аналогии из коммерческого мира
- государственная система платежей
- государственная система обмена персональными данными (secure data exchange)
И в этот список ещё можно добавлять некоторое число других услуг и компонентов которые выходят за пределы использования только органами власти.
Знаете что самое интересное? Спикеры по этой теме в качестве примера приводят Россию. В их трактовке, вполне логично, НСПК (карты Мир и Система быстрых платежей) - это как раз часть Digital Public Infrastructure. А то что Россия, своевременно или с запозданием, подобное делает - это как раз очень правильно и логично, чтобы не зависеть от частных/глобальных подрядчиков и сервисов. Потому что они могут в любой момент уйти, накручивать цену или иным образом выворачивать руки.
Конечно, цифровая общественная инфраструктура - это куда более глубокая концепция включающая понятия подотчетности, прозрачности, интероперабельности, инклюзивности и ещё много чего, в первую очередь, общественного надзора. Также надо понимать что это скорее социалистическая/патерналистическая модель, которая идеологически ближе к РФ, если не делать оговорку на коррупцию и "сливания тем" приближённым олигополиям.
Лично я пока во многих странах виду движение в сторону DPI и даже предполагаю что рано или поздно это может стать одной из зонтичных концепций продвигаемых одной из междгосударственных структур.
#thoughts #digital #infrastructure
В рубрике интересных каталогов данных UN Arab Region Data and Policy Support Hub [1] и ARGP: Arab regional geospatial portal [2] порталы данных платформы регионального сотрудничества ООН посвящённые арабским странам.
Отличаются тем что агрегируют довольно много данных из других порталов ООН (data.un.org, data.worldbank.org) и других источников около 10 тысяч наборов данных часть из которых представлена статистическими индикаторами, часть геоданными. Поскольку агрегация данных выборочная лишь частично то много данных собрано не только по арабским странам.
Также декларируют наличие данных и моделей для машинного обучения. Хотя вот это для меня загадка поскольку почти все индикаторы там внутри - это годовые показатели, впрочем в геоданных есть наложение разных детализированных данных и там такое применение вполне логично.
Туда же можно отнести поисковую систему Manara (Istinara) позволяющая искать по миллионам ООНовских документам данным и картам. Конкретно сейчас поиск по данным у них был поломан, но поиск по картам работал вполне сносно
Ссылки:
[1] https://data.as-rcp.org
[2] https://data.as-rcp.org/GIS
[3] https://manara.as-rcp.org
#opendata #data #indicators #datacatalogs #un
Отличаются тем что агрегируют довольно много данных из других порталов ООН (data.un.org, data.worldbank.org) и других источников около 10 тысяч наборов данных часть из которых представлена статистическими индикаторами, часть геоданными. Поскольку агрегация данных выборочная лишь частично то много данных собрано не только по арабским странам.
Также декларируют наличие данных и моделей для машинного обучения. Хотя вот это для меня загадка поскольку почти все индикаторы там внутри - это годовые показатели, впрочем в геоданных есть наложение разных детализированных данных и там такое применение вполне логично.
Туда же можно отнести поисковую систему Manara (Istinara) позволяющая искать по миллионам ООНовских документам данным и картам. Конкретно сейчас поиск по данным у них был поломан, но поиск по картам работал вполне сносно
Ссылки:
[1] https://data.as-rcp.org
[2] https://data.as-rcp.org/GIS
[3] https://manara.as-rcp.org
#opendata #data #indicators #datacatalogs #un
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
«Открытые данные для ИИ: Что дальше». ЮНЕСКО опубликовало руководящие принципы
В цифровой библиотеке ЮНЕСКО опубликован отчет «Открытые данные для ИИ: Что дальше» [1]. Авторы позиционируют данное издание как руководящие принципы, цель которых - «донести до государств-членов понимание ценности открытых данных, а также описать порядок их купирования и открытия. В документе содержатся конкретные шаги, которые необходимо предпринять для открытия данных. Эта публикация призвана сыграть важную роль в поддержке Рекомендаций ЮНЕСКО по открытой науке и содержит призыв к открытию данных для целей искусственного интеллекта».
Публикация содержит базовые понятия о том, что такое открытые данные, зачем их публиковать и как это делать. Есть даже описание пятизвездочного рейтинга открытых данных, описание которого выглядит немного странным для публикации в 2024 году. Раздел «Классификация открытых данных» содержит только критерии, по которым можно классифицировать данные, в разделе «Индикаторы и барометры в области ОД» также встречается только список существующих рейтингов.
Раздел «Руководящие принципы» разбивает на 4 шага каждый этап работы над открытыми данными:
1. Подготовка (разработка стратегии управления данными и их совместного использования; сбор и накопление качественных данных; развитие потенциала в области открытых данных; подготовка данных для использования в ИИ).
2. Открытие данных (выбор наборов данных для открытия; юридическое открытие наборов данных; техническое открытие наборов данных; формирование культуры открытых даных).
3. Обеспечение повторного использования и устойчивости (поддержка участия граждан; поддержка международного участия; поддержка полезного применения ИИ; поддержка высокого качества данных).
Не могу сказать, что в руководстве есть какая-то новая информация или практические алгоритмы, которые могут помочь желающим раскрыть данные, но задачу привлечения внимания к тематике открытых данных и призывом к действию оно вполне может быть.
Также авторы указывают, что «120 стран не приняли политических мер по открытым данным», но, к сожалению, ссылки на первоисточник или каких-то поясняющих комментариев об этой статистике в руководстве нет.
[1] https://unesdoc.unesco.org/ark:/48223/pf0000388373
В цифровой библиотеке ЮНЕСКО опубликован отчет «Открытые данные для ИИ: Что дальше» [1]. Авторы позиционируют данное издание как руководящие принципы, цель которых - «донести до государств-членов понимание ценности открытых данных, а также описать порядок их купирования и открытия. В документе содержатся конкретные шаги, которые необходимо предпринять для открытия данных. Эта публикация призвана сыграть важную роль в поддержке Рекомендаций ЮНЕСКО по открытой науке и содержит призыв к открытию данных для целей искусственного интеллекта».
Публикация содержит базовые понятия о том, что такое открытые данные, зачем их публиковать и как это делать. Есть даже описание пятизвездочного рейтинга открытых данных, описание которого выглядит немного странным для публикации в 2024 году. Раздел «Классификация открытых данных» содержит только критерии, по которым можно классифицировать данные, в разделе «Индикаторы и барометры в области ОД» также встречается только список существующих рейтингов.
Раздел «Руководящие принципы» разбивает на 4 шага каждый этап работы над открытыми данными:
1. Подготовка (разработка стратегии управления данными и их совместного использования; сбор и накопление качественных данных; развитие потенциала в области открытых данных; подготовка данных для использования в ИИ).
2. Открытие данных (выбор наборов данных для открытия; юридическое открытие наборов данных; техническое открытие наборов данных; формирование культуры открытых даных).
3. Обеспечение повторного использования и устойчивости (поддержка участия граждан; поддержка международного участия; поддержка полезного применения ИИ; поддержка высокого качества данных).
Не могу сказать, что в руководстве есть какая-то новая информация или практические алгоритмы, которые могут помочь желающим раскрыть данные, но задачу привлечения внимания к тематике открытых данных и призывом к действию оно вполне может быть.
Также авторы указывают, что «120 стран не приняли политических мер по открытым данным», но, к сожалению, ссылки на первоисточник или каких-то поясняющих комментариев об этой статистике в руководстве нет.
[1] https://unesdoc.unesco.org/ark:/48223/pf0000388373
В истории с отключением Рунета сегодня важно задать самим себе следующие вопросы:
1. Много ли было случаев таких "технических проблем" с другими крупными/некрупными национальными зонами?
2. Будет ли полноценное расследование этой "технической проблемы" с детальным разбором произошедшего и принятых мер?
3. Сколько людей _реально_ пострадало от произошедшего? Можно ли измерить материально возникший ущерб?
4. Если реально пострадавших было немного и экономику не затронуло то насколько это повышает отключение Рунета от интернета в будующем?
5. Стоит ли после этого "события" вообще регистрировать домены в зоне .ru ?
#questions #internet #runet
1. Много ли было случаев таких "технических проблем" с другими крупными/некрупными национальными зонами?
2. Будет ли полноценное расследование этой "технической проблемы" с детальным разбором произошедшего и принятых мер?
3. Сколько людей _реально_ пострадало от произошедшего? Можно ли измерить материально возникший ущерб?
4. Если реально пострадавших было немного и экономику не затронуло то насколько это повышает отключение Рунета от интернета в будующем?
5. Стоит ли после этого "события" вообще регистрировать домены в зоне .ru ?
#questions #internet #runet
Тем временем в Испании Федерация испанских провинций и муниципалитетов приняла типовое положение по управлению данными в местном самоуправлении [1]. Документ на испанском языке, но в целом достаточно прост и понятен.
В его основе:
- Глобальная хартия открытых данных (Open Data Charter)
- Европейское законодательство
- Испанские стандарты UNE 77 и UNE 78 по управлению данными и открытым данным
Ссылки:
[1] https://drive.google.com/file/d/1vam_TAcMrdXr0oKwbiFq1OyHpngi1Lpb/view
#opendata #spain #spanish #localgov
В его основе:
- Глобальная хартия открытых данных (Open Data Charter)
- Европейское законодательство
- Испанские стандарты UNE 77 и UNE 78 по управлению данными и открытым данным
Ссылки:
[1] https://drive.google.com/file/d/1vam_TAcMrdXr0oKwbiFq1OyHpngi1Lpb/view
#opendata #spain #spanish #localgov
Я давно не кидался окаменелостями в адрес российского Гостеха, и тут, уж извините, дам ссылку на выступление Мишустина на Digital Astana 2024 [1]. Как всегда, важно не то что он говорил, а то что _не говорил_. Ни разу не упомянул Гостех, ограничившись разговорами про Госуслуги и российские цифровые платформы. А почему он его не упомянул?
А потому что:
1. Значительная часть государственных информационных систем в Средней Азии делаются за счёт международной поддержки: USAID, скандинавские страны, Германия и др., разного рода глобальные институты развития. Рассчитывать что их будут интегрировать с российскими ИТ разработками или что там будет сотрудничество не стоит. Но это не самое главное.
2. Власти Казахстана уже "отбились" от попыток впаривания им Гостеха, ловко соскочив после того как Сбер попал под санкции. Я бы оценивал шансы на возвращение как минимальные.
3. Российские технологические решения которые пушит Пр-во в другие страны будут восприниматься как инструменты российской "мягкой силы" и влияния, поэтому у их внедренцев неслабые такие шансы влететь на санкции.
4. Гостеха не существует! [2]
В общем-то это показательно что даже главный продвигатель Гостеха теперь этот бренд не продвигает, но внутренней аудитории его продолжают скармливать, в основном потому что у нее выбора меньше.
Ссылки:
[1] https://t.iss.one/government_rus/11105
[2] https://t.iss.one/begtin/5370
#government #govtech #russia #thoughts
А потому что:
1. Значительная часть государственных информационных систем в Средней Азии делаются за счёт международной поддержки: USAID, скандинавские страны, Германия и др., разного рода глобальные институты развития. Рассчитывать что их будут интегрировать с российскими ИТ разработками или что там будет сотрудничество не стоит. Но это не самое главное.
2. Власти Казахстана уже "отбились" от попыток впаривания им Гостеха, ловко соскочив после того как Сбер попал под санкции. Я бы оценивал шансы на возвращение как минимальные.
3. Российские технологические решения которые пушит Пр-во в другие страны будут восприниматься как инструменты российской "мягкой силы" и влияния, поэтому у их внедренцев неслабые такие шансы влететь на санкции.
4. Гостеха не существует! [2]
В общем-то это показательно что даже главный продвигатель Гостеха теперь этот бренд не продвигает, но внутренней аудитории его продолжают скармливать, в основном потому что у нее выбора меньше.
Ссылки:
[1] https://t.iss.one/government_rus/11105
[2] https://t.iss.one/begtin/5370
#government #govtech #russia #thoughts
Telegram
Правительство России
Россия входит в число лидеров по уровню внедрения базовых государственных электронных систем
Правительство РФ продолжает проводить системную работу в сфере цифровизации госуправления. Развивается облачная государственная экосистема. Она, как и международные…
Правительство РФ продолжает проводить системную работу в сфере цифровизации госуправления. Развивается облачная государственная экосистема. Она, как и международные…
Forwarded from Инфокультура
Присоединяйтесь ко Дню открытых данных 2024
6 марта приглашаем к участию в нашем ежегодном мероприятии для сообщества — «День открытых данных 2024».
Мероприятие пройдет в онлайн формате. Центральный фокус программы мероприятия этого года — открытые данные для сообщества. Мы планируем включить программу ваши доклады, презентации проектов и мастер-классы.
Оставьте заявку до 15 февраля, если хотите стать спикером и выступить на мероприятии, и мы с вами свяжемся: https://forms.gle/HMxjCkKi9cR3NYS77
Приглашаем разработчиков, ИТ-специалистов, дата-журналистов, гражданских активистов и других участников российского движения открытости.
Организатором Дня открытых данных в России выступает АНО «Информационная культура».
Подробности и регистрация: opendataday.ru/msk.
6 марта приглашаем к участию в нашем ежегодном мероприятии для сообщества — «День открытых данных 2024».
Мероприятие пройдет в онлайн формате. Центральный фокус программы мероприятия этого года — открытые данные для сообщества. Мы планируем включить программу ваши доклады, презентации проектов и мастер-классы.
Оставьте заявку до 15 февраля, если хотите стать спикером и выступить на мероприятии, и мы с вами свяжемся: https://forms.gle/HMxjCkKi9cR3NYS77
Приглашаем разработчиков, ИТ-специалистов, дата-журналистов, гражданских активистов и других участников российского движения открытости.
Организатором Дня открытых данных в России выступает АНО «Информационная культура».
Подробности и регистрация: opendataday.ru/msk.
Для тех кто интересуется тем как в Евросоюзе внедряется Digital Services Act (Закон о цифровых платформах), стоит посмотреть на DSA Transparency Database [1] специальный портал в виде открытой базы данных регистрации действий платформ по модерации контента. По каждому факту модерации есть зарегистрированное событие которое можно посмотреть и найти [2] можно скачать всю базу событий целиком [3]. А база там немалая, более 3.5 миллиардов записей из которых 2.9 миллиардов записей отрепорчено Google Shopping.
С одной стороны - это важный шаг ЕС в регулировании платформ и усилении давления на Bigtech.
А с другой стороны, там в целом то непонятно как провести связь между пользователями которые жалуются на Bigtech и этими зарегистрированными фактами модерации поскольку никакой дополнительной идентифицирующей информации кроме указания даты и времени, языка и UID'а события там практически нет. Миллиарды почти идентичных сообщений, по ним можно замерять их интенсивность, языка, экономическую зону, и другие стат. показатели, но никаких качественных данных не извлечь. В общем-то много вопросов есть и будет.
Тем не менее данных там много, 67GB CSV файл в последнем дампе, так что можно попробовать найти что-то интересное.
К примеру, России, там совершенно точно нет, а вот модерация контента на русском языке есть. Более 556 тысяч фактов модерации. И даже для армянского языка, 33 факта модерации.
Ссылки:
[1] https://transparency.dsa.ec.europa.eu
[2] https://transparency.dsa.ec.europa.eu/statement
[3] https://transparency.dsa.ec.europa.eu/data-download
#opendata #transparency #private
С одной стороны - это важный шаг ЕС в регулировании платформ и усилении давления на Bigtech.
А с другой стороны, там в целом то непонятно как провести связь между пользователями которые жалуются на Bigtech и этими зарегистрированными фактами модерации поскольку никакой дополнительной идентифицирующей информации кроме указания даты и времени, языка и UID'а события там практически нет. Миллиарды почти идентичных сообщений, по ним можно замерять их интенсивность, языка, экономическую зону, и другие стат. показатели, но никаких качественных данных не извлечь. В общем-то много вопросов есть и будет.
Тем не менее данных там много, 67GB CSV файл в последнем дампе, так что можно попробовать найти что-то интересное.
К примеру, России, там совершенно точно нет, а вот модерация контента на русском языке есть. Более 556 тысяч фактов модерации. И даже для армянского языка, 33 факта модерации.
Ссылки:
[1] https://transparency.dsa.ec.europa.eu
[2] https://transparency.dsa.ec.europa.eu/statement
[3] https://transparency.dsa.ec.europa.eu/data-download
#opendata #transparency #private
Ещё один любопытный рейтинг и оценка стран Global organized crime index (Глобальный индекс организованной преступности) [1].
Его, оказывается, проводили ещё в 2021 году, а потом недавно повторили в 2023, а в его основе методика оценки уровня преступности применявшаяся ранее к африканским странам (проект ENACT).
Содержит два ключевых показателя:
- Criminality score (уровень преступности), чем ниже тем лучше
- Resilence score (уровень устойчивости), чем выше тем лучше.
По всем показателям лидирует Финляндия, хорошие оценки у Армении.
Каждый может найти что-то интересное для себя самостоятельно.
Датасет отдают как открытые данные, правда в Excel [2]
Ссылки:
[1] https://ocindex.net
[2] https://ocindex.net/assets/downloads/global_oc_index.xlsx
#opendata #ratings #crime
Его, оказывается, проводили ещё в 2021 году, а потом недавно повторили в 2023, а в его основе методика оценки уровня преступности применявшаяся ранее к африканским странам (проект ENACT).
Содержит два ключевых показателя:
- Criminality score (уровень преступности), чем ниже тем лучше
- Resilence score (уровень устойчивости), чем выше тем лучше.
По всем показателям лидирует Финляндия, хорошие оценки у Армении.
Каждый может найти что-то интересное для себя самостоятельно.
Датасет отдают как открытые данные, правда в Excel [2]
Ссылки:
[1] https://ocindex.net
[2] https://ocindex.net/assets/downloads/global_oc_index.xlsx
#opendata #ratings #crime