Ivan Begtin
7.98K subscribers
1.85K photos
3 videos
101 files
4.56K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
Download Telegram
Forwarded from Инфокультура
Завтра в 19:00 в Шанинке Алина Владимирова, научный сотрудник ИВ РАН и вице-председатель Исследовательского комитета по политической власти Международной ассоциации политической науки, проведет лекцию об открытых данных международных организаций и подробнее расскажет о базе данных внешней торговли «Комтрейд ООН». Алина расскажет про:
- основные вехи создания базы данных «Комтрейд ООН»;
- проблемы, с которыми столкнулись специалисты, собирая торговую статистику;
- особенности открытых данных международных организаций и их качество.

Лекция может быть интересна тем, кто использует статистику внешней торговли в своих исследованиях, а также тем, кто занимается сбором и публикацией открытых данных. Приглашаем к участию исследователей, аналитиков, научных сотрудников и всех желающих.
Как получить свои данные из всех тех сервисов которыми Вы пользуетесь? Непросто, но точно возможно.

В этот раз вместо поста я собраю такие сервисы в жанре Awesome Lists.

В Awesome Data Takeout [1] ссылки и инструкции на способы получения данных из большинства ключевых сервисо включая российские.

Список пополняемый, не стесняйтесь добавлять ссылки.

Ссылки:
[1] https://github.com/ivbeg/awesome-data-takeout

#data #datatakeout #dataexport
Тут относительно недавно 20 ноября 2019 года Минэкономразвития заключило контракт [1] на доработку портала data.gov.ru на 20 миллионов рублей с компанией РуНетСофт [2]

Предлагаю вопрос знатокам - в течение короткого брейншторма посмотреть на то что _не так_ с этим контрактом.

Лично я своё развернутое мнение напишу позже, скорее всего ближе к 9-декабря, когда будут подводить итоги его первого этапа.

Ссылки:
[1] https://zakupki.gov.ru/epz/contract/contractCard/common-info.html?reestrNumber=1771034949419000094
[2] https://rns-soft.ru/

#opendata #data #contracts
Рубрика "нет слов"
📱Террористы ИГ использовали российский мессенджер TamTam для подготовки к теракту в Лондоне

Они сами обьявили об этом. После проверки в мессенджере обнаружили сотни каналов, принадлежащих террористической организации
Как запросить личные данные от компаний по GDPR. Проект DataRequests.org [1] от германской НКО Datenanfragen.de e. V. [2] помогает составлять запросы в компании обязанные отдавать данные пользователям по запросу. Для этого в их проекте есть форма запроса [3], универсальная для любого типа запроса и для этого они ведут базу компаний [4] с их контактами и политиками приватности.

Всё содержание проекта открыто в виде открытого кода и открытых данных [5] что позволяет применять код проекта и для других задач. Например для запросов в Российские госорганы по 8-ФЗ или по 59-ФЗ.

Ссылки:
[1] https://www.datarequests.org/
[2] https://verein.datenanfragen.de/en/constitution/
[3] https://www.datarequests.org/generator
[4] https://www.datarequests.org/company

#opendata #dataprotection #data #datarights
ASPI, австралийский мозговой центр выпустивший ранее исследование Mapping China technology giants выпустили обновлённое
исследование [1] в которое добавили множество новых данных и теперь покрывают 23 китайские технологические компании.

Были добавлены такие компании как:
- BeiDou
- ByteDance
- CloudWalk
- Dahua
- DJI
- iFlytek
- Megvii
- Meiya Pico
- Sense Time
- Uniview
- YITU

В исследовании немало интересного, например, о компании ByteDance которые являются создателями приложения TikTok и о CloudWalk и колониализме данных (data colonialism) когда все данные распознавания людей по походе в Зимбабве передаются и хранятся в Китае.

Этот отчёт стоит внимания, его можно прочитать в виде PDF по ссылке [2].

Ссылки:
[1] https://www.aspi.org.au/report/mapping-more-chinas-tech-giants
[2] https://s3-ap-southeast-2.amazonaws.com/ad-aspi/2019-11/Mapping%20more%20of%20Chinas%20tech%20giants_1.pdf?cONTm6ETA8RMzlcILgDFNdoHdMN6xGZf

#china #datacolonialism #aspi #australia #surveillance
TechCrunch пишет [1] о том что Amazon выпустили AWS SageMaker [2], удобный инструмент ведения записных книжек по Data Science и разработки моделей машинного обучения.

Я лично гадал что скорее они купят DataIku [3] которые вот вот выпустили платформу DataIku 6 и позиционируют себя как разработчиков экосистемы для Enterprise AI. Но пока больше похоже что DataIku идёт в медленном направлении погружения в экосистему Microsoft и, у них уже есть интеграция с Microsoft Teams, а значит что есть вероятность что Amazon будет не единственным игроком облачных корпоративных решений по data science.

В любом случае SageMaker стоит пристального внимания и апробации.

Ссылки:
[1] https://techcrunch.com/2019/12/03/aws-launches-sagemaker-studio-a-web-based-ide-for-machine-learning/
[2] https://aws.amazon.com/ru/sagemaker/
[3] https://www.dataiku.com/

#datascience #data
Рубрика "Без слов", вернее даже "Нет слов".
Мы «хакнули» серваки Росреестра!

По мнению Росреестра у них упали «сервера» из-за непомерной нагрузки-запросов из ФССП,переданных по средствам электронного документооборота. Мы остались без ответов по недвижимости,взыскатели без обращения взыскания на недвижимое имущество.
У всех бывает.Не спорим.Но мы то здесь причём?
У Росреестра не справляется с нагрузой серверная инфраструктура и поэтому решили нас тупо отключить. Прекрасное решение.Очень правильное и своевременное,учитывая конец года.
По нашим данным в адрес Росреестра за три месяца было направлено 200 млн.запросов. В масштабах страны это очень мало,крайне мало.
А вот почему упали сервера? И сколько было выделено денежных средств Росреестру в рамках федеральной программы «Цифровая экономика» мы оставим за скобками и переадресуем этот вопрос по принадлежности с напоминанием глубокоуважаемому Росреестру об отвественности за неисполнение или ненадлежащее исполнение требований судебного пристава-исполнителя.
Что скажешь МинЭкономРазвитие?
Это примерно то о чём я всё чаще пишу помимо темы открытости данных. Персональные данные пользователей превратились в основной товар (commodity) для большей части ритейловых компаний и не только. Да, современный бизнес просто не может не следить или правильнее "пасти" пользователей, но если это будет развиваться как развивается, то что мы будем делать когда маятник качнется в другую сторону?
Forwarded from Секрет фирмы
​​Данные 40 млн владельцев карт «Пятёрочки» и «Перекрёстка» проданы компании Gazprom-Media Digital для показа таргетированной рекламы.

Клиентам магазинов X5 Retail Group уже начали присылать полезную информацию о брендах чая и кормах для домашних животных.

https://bit.ly/2RKQsvh
Джек Дорси, создатель социальной сети Твиттер в своих последних "твитах" написал о планах построения открытой децентрализованной платформы [1]. Для этой цели компания наняла малую команду из 5 человек архитекторов, инженеров и дизайнеров чтобы разработать децентрализованный стандарт для социальных медиа.

Он, в том числе, ссылается на публикацию Стивена Вольфрама [2] о его выступлении в Сенате (США) по контенту который для пользователей социальных сетей отбирает искусственный интеллект.

Ещё одна статья на которую он ссылается - это "Protocols not platforms" [3] за авторством Майка Масника, со многими ключевыми соображениями о доминировании платформ и о необходимости поиска бизнес моделей.

Важнейший вопрос в том, возможен ли принципиальный переход крупнейших платформ к децентрализации. Стратегии большинства из них до сих пор сфокусированы на том чтобы "пасти" пользователей и на том чтобы "закукливать" пользователей в свою экосистему.

Ссылки:
[1] https://twitter.com/jack/status/1204766078468911106
[2] https://writings.stephenwolfram.com/2019/06/testifying-at-the-senate-about-a-i-selected-content-on-the-internet/
[3] https://knightcolumbia.org/content/protocols-not-platforms-a-technological-approach-to-free-speech

#openness #platforms
На проходящем в России RIW Аналитический центр при Пр-ве РФ, ИРИ и Ассоциация больших данных представили свой этический кодекс работы с данными [1]. Лично я как руководитель другой ассоциации - АУРД (Ассоциация участников рынка данных) не могу его не прокомментировать, сделаю это тезисами.

1. Этот кодекс разрабатывали именно АЦ при Правительстве, ИРИ и Ассоциация больших данных. Наша ассоциация к нему никакого отношения не имела, мы не видели его ни в черновом виде, ни в каком иначе и никто из известных мне экспертов до того как кодекс был опубликован его не видел. Это продукт исключительно в зоне ответственности этих 3-х участников.
2. Кодекс существует в форме благопожеланий, не в формате "мы обязуемся делать" и "мы обязуемся не делать" как это изложено, например, в похожем кодексе в Швейцарии [3], а в форме общего, на мой взгляд, необоснованно забюрократизированного изложения.
3. Часть документа про создание "совета по совершенствованию лучших практик работе с данными" - это довольно бессмысленная идея на том уровне котором предлагается его создание. Я давно ратую за создание совета по данным на уровне правительственной комиссии или совета при Президенте РФ, но совет при АЦ при ПР РФ - это несерьёзный уровень для документа. В этом смысле я лично его бы больше ожидал от Ассоциации больших данных
4. В документе ничего нет про приближение к практикам GDPR, защиту прав пользователей и доступа граждан к их данным. Это не этика для малого бизнеса и не этика для пользователя - это самое минимальное приближение к этике со стороны "больших котов"
5. При этом я, всё равно, приветствую появление одного из первых документов по дата-этике, даже если окажется в будущем окажется что его необходимо будет глубоко переписать или полностью переделать.

Ссылки:
[1] https://ac.gov.ru/files/content/25949/kodeks-etiki-pdf.pdf
[2] https://aurd.ru
[3] https://data-service-alliance.ch/_Resources/Persistent/d8023fbcbd6cfb86e5ed814faa050f6bfa6be284/Codex_V3_english_public.pdf

#data #dataethics
Новость хуже не придумаешь. Nginx стал компанией мирового уровня, а вот Рамблер, похоже, никогда уже ей не станет
Forwarded from addmeto
Не хотел писать про это, но кажется надо. Судя по всему идут обыски в компании nginx, самой успешной русской опенсорс компании. Судя по фоткам иска Рамблер (читай «Сбербанк») настаивает на том, что код программы nginx принадлежал Рамблеру и был присвоен незаконно.

Напомню как все было: Игорь Сысоев, работая в Рамблере кем-то вроде SRE, делал большой опенсорс продукт, Nginx. Благодаря этому веб-серверу Рамблер мог обслуживать миллионы пользователей на небольшом количестве серверов. В какой-то момент nginx стал настолько большим и популярным, что Игорь стал заниматься только им, потом появилась идея сделать из опенсорс небольшой бизнес. Нашлись даже первые инвесторы, и с тех пор nginx независимая компания развивающая опенсорс продукт. Через какое-то время, год назад, проект влился в большую корпорацию F5.

Если все действительно так, как в твитах - это просто провал :( https://twitter.com/AntNesterov/status/1205086129504104460
Минимум полиция 10 стран Евросоюза используют технологии распознавания лиц, пишет Николя Кайзер-Бриль в AlgorithmWatch [1]. Например в Германии эти технологии используются с 2008 года.

Ссылки:
[1] https://algorithmwatch.org/en/story/face-recognition-police-europe/

#police #eu
Какого контента нужно больше на канале?
anonymous poll

Больше про данные и всё что с ними связано – 53
👍👍👍👍👍👍👍 34%

Больше аналитики того что делается в госИТ в России – 43
👍👍👍👍👍👍 28%

Больше аналитики о том как всё работает за пределами России – 27
👍👍👍👍 18%

Больше быстрых и регулярных новостей по govtech, civictech и данным – 16
👍👍 10%

Больше про приватность, слежку, защиту данных – 15
👍👍 10%

👥 154 people voted so far.
Яндекс, через публикацию Григория Бакунова в блоге пишет о поддержке открытого кода, важности проекта Игоря Сысоева [1] и своей позиции в этом вопросе.

Это правильная, хотя и осторожная позиция. Ощущение что рейдерские захваты приходят в ИТ является острым сейчас для многих, вне зависимости от политических убеждений.

Многие годы Яндекс воспринимался и воспринимается в России как технологический лидер рынка, компания с мировым именем и мирового уровня технологиями. Но все проблемы Яндекса, как и многих других российских компаний работающих на переднем крае технологий, находятся в российской юрисдикции. Отстранившись от происходящего в стране Яндекс, как и вся отрасль, столкнулись с разбегу с ужесточением регулирования Рунета не готовностью GR действий в ответ на эти события. И сейчас, ситуация с Игорем Сысоевым, лишь в одной стороне имеет отражение на конфликт между двумя экономическими субъектами, главное же в нём - применение силовых органов для воздействия теми кто умеет и привык пользоваться административно-уголовными методами ведения бизнеса в России.

Каковы был вклад Яндекса за эти годы в декриминализацию статей уголовного кодекса? В системную работу над изменением российского законодательства? В применении не антикризисного GR, а GR проактивного? Есть ли в модели будущего Яндекса понимание ухудшения регуляторной среды?

Разумеется говорить здесь про Яндекс можно довольно условно. Это касается не только одной компании, это касается ИТ отрасли в России в целом, которая сейчас находится в состоянии углубления расхождения глобально ориентированных ИТ компаний и той части ИТ бизнеса которая неотделима от государственного финансирования.

Ссылки:
[1] https://yandex.ru/blog/company/open-source-nashe-vse

#it #dierambler #opensource
Вышел доклад " Exploring digital government transformation in the EU" [1] со 100-страничным обзором практики цифровой трансформации Евросоюза.
В докладе собран обзор развития таких тем госуправления как:
- Искуственный интеллект
- Распределённые цифровые реестры
- Интернет вещей
- Данные и их повторное использование
- Открытое государство
- Цифровая безопасность
- Инновации в предоставлении услуг

Доклад выпущен от EU Science Hub и во многом делает акценты на этике и этическом развитии государственного регулирования.

Ссылки:
[1] https://op.europa.eu/en/publication-detail/-/publication/0fdfa1ed-1bc6-11ea-8c1f-01aa75ed71a1/language-en

#policy #government #eu