Open Data Armenia
274 subscribers
48 photos
1 video
2 files
81 links
Open Data Armenia news channel. English/Armenian/Russian

Join chat at https://t.iss.one/opendataamchat
Download Telegram
[EN] The Armenian Ark: Evidence of the Armenian People's Emigration to North America in the 1930s

The source is a database with various queries and detailed filters searching for information about a person: by name, place of birth or death, place of residence and residence address, and more.

For example, there is a dataset with information about the personal information of passengers and the ships on which they arrived. https://markarslan.org/ArmenianImmigrants/ShipManifests.csv.

Project link: https://markarslan.org/ArmenianImmigrants/Public-ProjectReportsandQueries.php?submit=Project+Reports+%26+Queries

Other historical sources and datasets can be found in the History group at https://data.opendata.am.

If you know of new sources, please share that knowledge with us!

#opendata #armenia #history #emigrants
[EN] We keep working on new data tasks for volunteers and we added new tasks recently:
- Collect data from legal acts drafts website www.e-draft.am
- Collect metadata on the reports of the Armenian NGOs
- Collect the data of the Exchange Rates Archive
- Worldwide Armenian Churches Lists Extraction
- Convert data of Research on Armenian Architecture from HTML to machine readable data (csv, geojson)
- Extraction of Electronic Catalogue of Armenian Cultural Values
- Collect metadata of Armenian historical documents

And we would like to thank Github user arsen41531 for the first completed task: Extract government budget data from Republic of Armenia interactive budget website. Parser and data available at https://github.com/opendataam/opendatam-egov-am-budget-parser Thanks a lot Arsen!

If you have some free time and programming skills, you could help to create more open data about Armenia or related to Armenia. Please take any of these tasks.

If you don't have programming skills but you have ideas in mind about how to find and use data if it will be machine-readable open data, please write in chat https://t.iss.one/opendataamchat, we will help to convert ideas into tasks for volunteers.

if you know IT communities willing to help to bring more open data online, please share, like and repost :)

#opendata #opensource #datatasks #volunteering
[EN, AM ↓] 3D Models preserving Armenian cultural heritage

We continue introducing our team’s findings to you. Today’s highlights are the two sources with three-dimensional models of Armenian cultural sites. Such reconstructions are a wild-card when dealing with objects that are unavailable either due to their far-away location or imminent threat of destruction, especially in the post-war periods. 3D models allow us to monitor their state and disseminate cultural knowledge. Sometimes we have to preserve the digital images of fragile buildings or those already demolished, which will enable generations to come to restore their initial appearance as a 100% precise extract.

The first one is a catalogue by 3Bee.io which already contains almost 20 models that can also be viewed in Virtual Reality. The implementers of the project capture the data at the highest possible resolutions and archive them in raw formats so that it can be re-processed in future.

The second one is fulfilled by the Research on Armenian Architecture team and displays 3D videoclips and images of locations in Ani and Khtzkonk (Western Armenia).

Overall, much more work on these is needed to digitalize Armenia’s cultural heritage. However, file-format support and longevity are major considerations for digital preservation, and the field is yet to develop its best practices. As for now, .PLY (polygon file) and .OBJ (object file) are deemed more appropriate as they are widely supported and compatible across platforms [1].

Other historical sources and datasets can be found in the History group at https://data.opendata.am.
If you are aware of other sources, please share them with us!

#opendata #armenia #history #architecture

[1]Using Three-Dimensional Modeling to Preserve Cultural Heritage (2017). https://blogs.loc.gov/thesignal/2017/01/using-three-dimensional-modeling-to-preserve-cultural-heritage/
[AM, EN ↑] Հայկական մշակութային ժառանգության պահպանմանը ուղղված 3D մոդելներ

Մենք շարունակում ենք Ձեզ ներկայացնել մեր թիմի հետաքրքրաշարժ բացահայտումները: Այսօր կուզեինք առանձնացնել հայկական մշակութային օբյեկտների եռաչափ մոդելների երկու աղբյուր: Նման վերակառուցումները փրկության են հասնում, երբ գործ ունենք այնպիսի օբյեկտների հետ, որոնք անհասանելի են իրենց հեռավոր վայրերում կամ ոչնչացման անմիջական սպառնալիքի տակ գտնվելու պատճառով, հատկապես հետպատերազմյան շրջաններում: Եռաչափ մոդելները թույլ են տալիս հետևել նման կառույցների վիճակին և տարածել մշակութային գիտելիքը: Երբեմն մենք ստիպված ենք պահպանել փխրուն կամ արդեն ոչնչացված շինությունների թվային պատկերները, ինչը թույլ կտա գալիք սերունդներին վերականգնել դրանց սկզբնական պատկերը 100% ճշգրիտ կրկնօրինակի տեսքով:

Առաջինը գրացուցակ է, որը հավաքագրում է 3Bee.io-ն և որն արդեն պարունակում է գրեթե 20 մոդել, որոնք կարող են դիտվել նաև վիրտուալ իրականության մեջ: Ծրագիրը իրականացնողները հավաքում են տվյալները հնարավորինս բարձր լուծաչափով և արխիվացնում դրանք անմշակ ձևաչափերով` հետագա օգտագործման համար:

Երկրորդը իրականացվել է Research on Armenian Architecture թիմի կողմից և ցուցադրում է Անիի և Խծկոնքի (Արևմտյան Հայաստան) վայրերի 3D տեսանյութեր և պատկերներ:

Ընդհանուր առմամբ, Հայաստանի մշակութային ժառանգության թվայնացման համար շատ ավելի մեծ աշխատանք է պահանջվում։ Այնուամենայնիվ, ֆայլի ձևաչափի ընթերցանելիությունն ու կայունությունը տվյալների թվային պահպանման հիմնական գործոններն են, և այս ոլորտում դեռ լավագույն պրակտիկաների հարցում որոշակիություն չկա: Այս պահին .PLY (պոլիգոն ֆայլ) և .OBJ (օբյեկտ ֆայլ) համարվում են ավելի նպատակահարմար, քանի որ լայնորեն հասանելի են և համատեղելի են տարբեր հարթակների հետ:

Այլ պատմական աղբյուրներ և տվյալների հավաքածուներ կարելի է գտնել մեր պատմություն խմբում ՝ https://data.opendata.am:

Եթե գիտեք այլ հետաքրքիր աղբյուրներ, խնդրում ենք կիսել դրանք մեզ հետ:
[RU] Наша команда продолжает собирать наборы данных для наполнения каталога данных и отдельное спасибо волонтерам которые помогают в этом деле, кстати, мы добавили новых задач и сейчас 23 открытые задачи для тех кто готов немного потратить время и помочь превратить существующие немашиночитаемые данные в машиночитаемый формат.

Каталог данных - это не спринт, а марафон, цель его создания в том чтобы быть ответом по умолчанию на вопрос "Где найти данные об Армении, армянскому языку, армянской культуре? ", а также быть основной других проектов.

Мы планируем наполнять каталог данных всё время и до конца лета 2023 г. собрать как можно больше данных, а в начале осени провести конкурс или хакатон по использованию этих и других данных. И вот здесь есть развилка, которую важно проговорить.

Конкурс, обычно, объявляется от нескольких недель до месяца в течении которых участники делают проекты на данных и отправляют на выбранные номинации. Можно самостоятельно управлять своим временем, подаваться хоть сразу, хоть в последний момент и, самое главное, времени много на то чтобы сделать большой продукт/проект/визуализацию. Минусы конкурса в том что они требуют, как правило, уже большого числа участников ожидающих его объявления и готовых участвовать. В конкурсе могут принимать участники откуда угодно, те кто хорошо говорит и пишет на армянском, не всегда знающие армянский язык армяне разбросанные по всему миру и те кто связывает себя с Арменией и её историей и будущем вне зависимости от того откуда они.

Хакатон - это формат интенсивной работы в течении 1-2 дней. Прямо перед хакатоном участники формируют команды или решаются участвовать самостоятельно. Как правильно, для хакатонов есть четкие или примерные задачи того что хотелось бы сделать. Поскольку времени мало то и результаты хакатонов чаще макеты, прототипы, не всегда сложные завершённые продукты. Хакатоны обычно проводили вживую, но во время COVID-19 многие перешли на дистанционную работу и появились онлайн хакатоны где команды и менторы команд общались в чатах без личного присутствия. Онлайн хакатон похож на конкурс, в нём могут принять участие все, офлайн хакатон, это, конечно, мероприятие вживую в Ереване и участие смогут принять, в основном, те кто будут участвовать в нём лично.

Вне зависимости от того будет ли это конкурс или хакатон, у него обязательно будет призовой фонд, а от подаваемые работы должны быть с открытым кодом и на открытых данных. У него будут партнеры и интересные задачи!

Итого, сейчас мы выбираем форму проведения мероприятия, онлайн или офлайн, конкурс или хакатон. Наше сообщество пока только растёт, но уже пришло время задавать вопросы. Поэтому следующим постом как раз будет вопрос о том что Вы думаете и какое мероприятие ждёте.

#opendata #armenia #contest #hackathon
[RU] Конкурс или хакатон в осенью 2023 г.?
Anonymous Poll
35%
Конкурс
30%
Онлайн хакатон
35%
Хакатон вживую в Ереване
[EN] Awesome list: a toolkit for text analyzis Armenian language

- Eastern Armenian National Corpus Electronic Library provides a full view of works by classical authors (these books are in the public domain because their authors died more than 70 years ago). The corpus contains 4547379 words from 104 books by 12 authors. 

- Named entity recognition. pioNer — trained data for Armenian NER using Wikipedia. This corpus provides the gold standard for automatically generated annotated datasets using GloVe models for Armenian. Along with the datasets, 50-, 100-, 200-, and 300-dimensional GloVe word embeddings trained on a collection of Armenian texts from Wikipedia, news, blogs, and encyclopedias have been released.

- The Polyglot library for Python supports language detection, named entity extraction (using Wikipedia data), morphological analysis, transliteration, and sentiment analysis for Armenian.

- Kevin Bougé Stopword Lists Page includes th Armenian language.

- Ranks NL Stopword Lists Page includes the Armenian language.

If you know of new usefull tools and guides, please share that knowledge with us!

Image author Aparna Melaput

#opendata #armenia #language #tools #digitalhumanities
[EN] WorldPop is an Open Spatial Demographic Data and Research project at the University of Southampton. It provides a lot of open datasets via its WorldPop Hub data catalog that aggregates a lot of demographics-related data, and it gives a lot of Armenia-related datasets too.

For example:
- The spatial distribution of population in 2020, Armenia
- National boundaries, Armenia

And many other datasets are available as GeoTIFF files.

All datasets available under CC-BY open license.

We started uploading this data to our data catalog and other datasets with geodata, statistics, and demographics.

Feel free to share if you know any other interesting data sources related to Armenia that are interesting for data analysis and research.

#opendata #geodata #demographics #worldpop
[EN] And here are some new inspiring 3D models, this time of Geghard monastery alongside Ani. They are published at the Open Heritage website. Open Heritage 3D is a project dedicated to making primary 3D cultural heritage data open and accessible as well as to ease sharing these data for publishers.

CyArc which led the documentation of both sites is one of the most authoritative in the field of digital culture preservation. Interestingly, Geghard Monastery was immortalized by the high schoolers of the TUMO Center for Creative Technologies during the two-week workshop ran by CyArk.

Feel free to share if you know any other interesting data sources aimed at preserving cultural heritage.

#opendata #armenia #history #architecture
[EN] Main international and national data sources on Armenia 🇦🇲

We recall the well-known international data sources where one can find the main indicators and data sets about Armenia and enlarge the list:

— World Bank Statistics. Published data on the main economic and social indicators of the country: https://data.worldbank.org/country/AM

— Key Indicators of the Economy of Armenia, published at Asian Development Bank portal: https://kidb.adb.org/economies/armenia

— UN Statistics. Data are aggregated from various international databases and survey results by thematic cross-sections: economy, demography, agriculture and products, climate, unemployment and employment, telecommunication, information technology, etc. Go to search: https://data.un.org/Explorer.aspx

— Key health and mortality indicators for Armenia at the World Health Organisations portal: https://data.who.int/countries/051

— Climate Change Indicators by IMF by country, including Armenia: https://climatedata.imf.org/pages/country-data

— Biodiversity datasets from Global Core Biodata Resource: https://www.gbif.org/country/AM/about

— There are 93 datasets related to Armenia published on the Humanitarian Data Exchange portal. Also, there are geospatial datasets: https://data.humdata.org/group/arm

There is a lot of overlap and duplication but the data can form an excellent basis for enriching and creating new, high-quality, and useful datasets.

If you know of other sources, please let us know about them in the chat: https://t.iss.one/opendataamchat.
Please open Telegram to view this post
VIEW IN TELEGRAM
Natural Language Processing can enhance not only our communication and language knowledge, but also strengthen the historical studies.

Marcella Tambuscio and Tara Lee Andrews in their Geolocation and Named Entity Recognition in Ancient Texts: A Case Study about Ghewond’s Armenian History apply Named Entity Recognition (NER) to Ghewond’s Armenian History. This facilitates drawing the ‘big picture’ of Armenian history in that period and matching historical toponyms with their contemporary counterparts. The outcomes and reproducible validated results of applying the model are published on GitHub. We also added them to our data catalog.

We believe that such studies are going to become more common, making ancient texts more available to a wider public and to the professional community. Tell us if you are aware of similar efforts in the field!

#opendata #armenia #history #language
You are probably going to be surprised, but Armenia holds one of the leading positions in the region of Eastern Europe and Central Asia, backing down only to Ukraine and slightly surpassing Kazakhstan and Russia, according to the Global Data Barometer 2022.

The Armenia’s assessment comprised by Georgia-based experts shows that the country’s relative strength affecting the relatively high index (44.6/100) is its public finance data. On the other hand, the weakest of Armenia’s capabilities is its situation with the open data. We will spare no effort to boost this dimension of Armenia’s culture of dealing with the data, which will result in deeper societal changes, increasing consciousness and self-reflexion, as well as in policy responsiveness and effectiveness.
We are glad to announce that we uploaded a lot of new datasets to the Open Data Armenia data catalog.
Datasets were aggregated from the following sources:
- WorldPop - global population geodata catalog
- Global Forest Watch Open data portal of Armenia - forest-related geodata collected by REC Caucasus
- World Bank data catalog - world statistics and surveys
- The Armenian Soil Information System (ArmSIS) - soil geodata from Armenian National Agrarian University
- Institute of Geological sciences geoportal - geology- related geodata
Total number of datasets on the portal is 702.

We will do our best to collect and upload more Armenian and Armenian-related datasets into our open data catalog from international and local Armenian data sources.

Source code and raw data from these data sources are also available at the code repository https://github.com/opendataam/opendataam-bulk

#opendata #opensource #datasets
More Armenian open geodata available. This time 85 datasets from Scientific Network for the Caucasus Mountain Regions (https://data.opendata.am/organization/sustcaucasus)

These datasets are map layers related to Armenia and neighbor countries and whole Caucasus.

#opendata #geodata #datasets
Բաց տվյալները մեր անցյալի մասին գիտելիքի խոստւմնալից աղբյուր են: Օրինակ, Հանրային ռադիոյի ջանքերի շնորհիվ մենք կարող ենք վերապրել մեր ծնողների ու պապերի առօրյան ու ավելի լավ հասկանալ նրանց:
«Հանրայինը» հրապարակել է իր բոլոր թողարկումները 1920-ականներից ու վեր: Կայքում կարելի է գտնել երգեր, ինչպես նաև ծրագրեր ըստ ժանրերի: Նաև հասանելի են արխիվային լուսանկարներ, երաժիշտների ու երգիչների կենսագրությունն ու գործերը:

Այդ տվյալները ոչ միայն հետաքրքրաշարժ են, այլ նաև օգտակար լեզվական խնդիրներ լուծելու հարցում, քանի որ թույլ են տալիս համատեղել առկա տեքստերն ու անթերի ընթերցանությունը (օրինակ, գրական թողարկումների պարագայում):

Արդյո՞ք գիտեք նման արխիվների մասին ու ի՞նչ եք կարծում դրանց պրակտիկ կիրառելիության մասին:
We are always looking for more Armenian textual data: Collections of free to use texts, especially under open licence. We already collected more than 200k texts from ARLIS database of Armenian laws 23Gb uncompressed. But laws are very specific texts, so more data is needed for the use of any advanced applications that could be created in the planned open data competitions.

If you are aware of any other source of Armenian texts, please drop us a note in the chat https://t.iss.one/opendataamchat

#texts #datasets #helpneeded
Բաց տվյալներ հետազոտող ու ստեղծող համայնք կերտելու համար մենք նաև հայալեզու կրթական ծրագրեր ենք նախատեսում: Ուրախ ենք, որ մինչ այդ հնարավորություն ունենք կիսվել գործընկերների կողմից պատրաստված ճանաչողական նյութերով,օրինակ` Բուն TV-ի այս փոդքաստով:

ՀՌԿԿ Հայաստան հիմնադրամի գործադիր տնօրեն Սոնա Բալասանյանը և Վիճակագրական կոմիտեի աշխատանքի վիճակագրության բաժնի պետ Լուսինե Քալանթարյանը զրուցեցին բաց տվյալների, դրանց կիրառելիության, շահառուների, պետության և հետազոտողների կապի, ինչպես նաև ոլորտի խնդիրների մասին:

Youtube. https://www.youtube.com/watch?v=Xu7I51_MlzY:

Spotify. https://open.spotify.com/show/0kebHzx0Gzsx3m8vYgdzEZ:
We are waiting for the geodata on Armenia.

In the year 2021, the Asian Development Bank (ADB) launched the project "Armenia: Supporting the Establishment of National Standardised Spatial Data Infrastructure". Its aim is to support the Armenian Cadastre Committee in the creation of a National Standardised Spatial Data Infrastructure by the end of 2023 [1].

According to the latest tender documentation, this portal will be built using Open Geospatial Standards (CSW, WFS, WMS and geospatial data formats GML, GeoPackage, SHP, GeoJSON). This portal will be created using Open Source products, we don't know which ones, but most likely it will be a combination of Geonetwork, Geonode and Geoserver software from Open Geospatial Consortium. Or other similar open source geoportal software.

New portal should be at maparmenia.am, it's not available yet, but we are eagerly waiting for it and we hope that not only open source but also open data will be one of the priorities of the Cadastre Committee and spatial data will be available under permissive licences like Creative Commons CC-BY 4.0.

[1] https://www.adb.org/projects/54388-001/main
#opendata #geodata #spatial