Я стараюсь находить на выходных по 1-2 часа времени для выкладки и актуализации старого кода и реестров.
Около 8 лет назад я занимался построением онтологии госуправления и экономической географии и в RDF/OWL моделировал и то и другое пытаясь сформировать эталонные справочники и правила их наполнения.
Далее эти справочники были нужны для незавершенного проекта по экономическим и социальным показателям/рейтингам по субъектам федерации.
Но других проектов идёт много, регулярно нужны эталонные справочники и такой справочник по субъектам федерации на выходных я раскопал, почистил и выложил сегодня в репозитории кода [1].
Многие из этих данных (не все) можно выковырять из Википедии и DBPedia, но в сведенном варианте их не было.
Справочник включает:
- наименованиях субъектов федерации
- коды субъектов (ОКАТО, КЛАДР, налоговые, автомобильные, коды по ISO 3166, коды по ГОСТ 67 и другие)
- сведения о макрорегионах в которые субъекты федерации входят
- сведения о пограничных регионах
- сведения о пограничных странах, если есть
- сведения о железных дорогах
- сведения о федеральных трассах
- сведения о морских побережьях (омывающих морях)
- сведения о наименованиях и ссылках органов власти субъектов федерации
Кому может пригодится такой справочник? Для каких задач?
1. Строите рейтинг по регионам и хотите сравнить позицию региона среди регионов входящих в тот же экономический район, федеральный округ, военный округ, с регионами с которыми у него общая граница и тд.
2. Ищите корреляции социально-экономического положения и других факторов, часть факторов есть в этих метаданных. Например есть ли у субъекта федерации выход к морю (is landlocked) или тип субъекта федерации (республика, область, город федерального значения) и так далее.
3. Нужно обогащение данных для организации навигации в своём проекте, расширение внутренних справочников и тд.
Наверняка есть другие области применения которые я не знаю.
Дальнейшие планы, в будущем:
1. Реестр должен быть актуализирован, поскольку многие ссылки не обновлялись с 2012 года.
2. Расширение реестра другими метаданными привязанными к субъектам федерации (площадь, численность населения и тд)
3. Постепенный охват крупнейших городов муниципальных образований и всех муниципальных образований в будущем
Если есть идеи и предложения какие ещё факторы/признаки/метаданные необходимы и полезны для работы, например, data scientist'ов, то обязательно напишите, реестр будет развиваться.
И, конечно, поскольку это открытый код/данные на Github то прямо в нем можно корректировать данные и вносить дополнения.
P.S. Я давно подумываю создать открытый репозиторий эталонных реестров и справочников, не только официальных государственных, а деятельностных, отсутствующих, но необходимых в работе.
Ссылки:
[1] https://github.com/infoculture/ruregions
#opendata #data #registries
Около 8 лет назад я занимался построением онтологии госуправления и экономической географии и в RDF/OWL моделировал и то и другое пытаясь сформировать эталонные справочники и правила их наполнения.
Далее эти справочники были нужны для незавершенного проекта по экономическим и социальным показателям/рейтингам по субъектам федерации.
Но других проектов идёт много, регулярно нужны эталонные справочники и такой справочник по субъектам федерации на выходных я раскопал, почистил и выложил сегодня в репозитории кода [1].
Многие из этих данных (не все) можно выковырять из Википедии и DBPedia, но в сведенном варианте их не было.
Справочник включает:
- наименованиях субъектов федерации
- коды субъектов (ОКАТО, КЛАДР, налоговые, автомобильные, коды по ISO 3166, коды по ГОСТ 67 и другие)
- сведения о макрорегионах в которые субъекты федерации входят
- сведения о пограничных регионах
- сведения о пограничных странах, если есть
- сведения о железных дорогах
- сведения о федеральных трассах
- сведения о морских побережьях (омывающих морях)
- сведения о наименованиях и ссылках органов власти субъектов федерации
Кому может пригодится такой справочник? Для каких задач?
1. Строите рейтинг по регионам и хотите сравнить позицию региона среди регионов входящих в тот же экономический район, федеральный округ, военный округ, с регионами с которыми у него общая граница и тд.
2. Ищите корреляции социально-экономического положения и других факторов, часть факторов есть в этих метаданных. Например есть ли у субъекта федерации выход к морю (is landlocked) или тип субъекта федерации (республика, область, город федерального значения) и так далее.
3. Нужно обогащение данных для организации навигации в своём проекте, расширение внутренних справочников и тд.
Наверняка есть другие области применения которые я не знаю.
Дальнейшие планы, в будущем:
1. Реестр должен быть актуализирован, поскольку многие ссылки не обновлялись с 2012 года.
2. Расширение реестра другими метаданными привязанными к субъектам федерации (площадь, численность населения и тд)
3. Постепенный охват крупнейших городов муниципальных образований и всех муниципальных образований в будущем
Если есть идеи и предложения какие ещё факторы/признаки/метаданные необходимы и полезны для работы, например, data scientist'ов, то обязательно напишите, реестр будет развиваться.
И, конечно, поскольку это открытый код/данные на Github то прямо в нем можно корректировать данные и вносить дополнения.
P.S. Я давно подумываю создать открытый репозиторий эталонных реестров и справочников, не только официальных государственных, а деятельностных, отсутствующих, но необходимых в работе.
Ссылки:
[1] https://github.com/infoculture/ruregions
#opendata #data #registries
GitHub
GitHub - infoculture/ruregions: Registry of all Russian regions and regional metadata like codes, borders, macro and subregions…
Registry of all Russian regions and regional metadata like codes, borders, macro and subregions and e.t.c. - GitHub - infoculture/ruregions: Registry of all Russian regions and regional metadata li...
В Коммерсанте заметка о том что Минэкономики России собирается создать реестр технологических стартапов [1] и о том что на его основе в том числе будут приниматься решения о господдержке и отслеживаться ее эффективность.
Для этого подготовлен проект поправок к закону «О науке и государственной научно-технической политике» в котором эти полномочия Минэкономразвития будут прописаны. Правда, буквально чуть менее чем 2 месяца назад уже был принят федеральный закон от 31.07.2020 № 309-ФЗ "О внесении изменений в Федеральный закон "О науке и государственной научно-технической политике" где вводили понятие венчурного капитала и др. определения.
Поможет ли как-либо стартапом наличие государственного реестра и государственного мониторинга их эффективности? Честно говоря у меня лично есть сомнения на этот счет и, нельзя не упомянуть проблему того что Минэкономразвития не очень ответственно подходит к ведению их реестров. Реестры СО НКО, пострадавших НКО и системообразующих предприятий опубликованные на data.economy.gov.ru имели большие проблемы с точки зрения полноты и качества данных, не говоря уже о методологии.
Ссылки:
[1] https://www.kommersant.ru/doc/4500503
#registries #opendata
Для этого подготовлен проект поправок к закону «О науке и государственной научно-технической политике» в котором эти полномочия Минэкономразвития будут прописаны. Правда, буквально чуть менее чем 2 месяца назад уже был принят федеральный закон от 31.07.2020 № 309-ФЗ "О внесении изменений в Федеральный закон "О науке и государственной научно-технической политике" где вводили понятие венчурного капитала и др. определения.
Поможет ли как-либо стартапом наличие государственного реестра и государственного мониторинга их эффективности? Честно говоря у меня лично есть сомнения на этот счет и, нельзя не упомянуть проблему того что Минэкономразвития не очень ответственно подходит к ведению их реестров. Реестры СО НКО, пострадавших НКО и системообразующих предприятий опубликованные на data.economy.gov.ru имели большие проблемы с точки зрения полноты и качества данных, не говоря уже о методологии.
Ссылки:
[1] https://www.kommersant.ru/doc/4500503
#registries #opendata
Коммерсантъ
Стартапы поставят на учет
Минэкономики займется новым IT-реестром