Open Data Armenia
289 subscribers
53 photos
1 video
2 files
89 links
Open Data Armenia news channel. English/Armenian/Russian

Join chat at https://t.iss.one/opendataamchat
Download Telegram
Есть ли в Армении медведи? Конечно есть! А как их найти?

На портале GBIF (Global Biodiversity Information Facility) [1] публикуются многочисленные наборы данных по биоразнообразию. Деревьях, животных и иных живых существ.

Сейчас на портале более 108 тысяч наборов данных о 7.7 миллионах видах и чуть менее 3 миллиардах упоминаний о случаях встречи с ними (occurrences). Помимо информации о видах и датасетах там есть профили стран и можно найти данные даже по очень экзотическим территориям или по известным странам с большой подробностью.

Вот профиль с датасетами и животными Армении [2] и, например, если Вы интересовались есть ли в Армении медведи. Да, есть и есть фотографии с ними;) [3], а также лисы, волки, другие многочисленные живые существа.

Почти все материалы в GBIF опубликованы под лицензиями CC-BY и CC0, все они машиночитаемы, все они открытые данные.

Это бесценный источник ресурсов для обучения распознавания изображений животных и их следов и знать о том как устроена природа страны.

Ссылки:
[1] https://www.gbif.org
[2] https://www.gbif.org/country/AM/summary
[3] https://www.gbif.org/occurrence/4436343743

#opendata #biodiversity #openaccess
Находка в нашем каталоге. Своими данными по различным категориям сделок делится Армянская фондовая биржа, хоть и только в xlsx и с подписью "все права защищены". Данные доступны для скачивания на английском и армянском, но во многих случаях только за последний год, а то и меньше.

Не забывайте делиться с нами интересными данными, связанными с Арменией!
Друзья нашего проекта пытаются переводить сканированные книги на армянском языке в текст, причём у книг не всегда есть текстовый слой и часто нестандартные (несовременные) шрифты.

Например, такая книга "Очерк по истории русских" Гавриила Айвазовского [1] издана в Венеции в 1836 году.

Попытки распознать её с помощью ABBYY Finereader успехом не увенчались. Может быть кто-то из читателей канала и нашего сообщества знает инструменты с помощью которого можно было бы такой текст распознать?

А мы бы в Open Data Armenia очень хотели бы собрать большой набор данных армянских текстов, чтобы в будущем разработчики могли бы делать на их основе исследования и создавать интересные инструменты и продукты.

Ссылки:
[1] https://greenstone.flib.sci.am/gsdl/collect/armbook/books/hamarot_patmutivn_rusac1836.pdf

#questions #texts #publicdomain
Для тех кто ищет данные об Армении в мире, обновился поисковый индекс проекта Dateno [1] и теперь он включает более 25 тысяч наборов данных о стране, большая часть данных это статистические индикаторы Всемирного банка, ВТО, Банка международных расчётов и других. А также иные статистические показатели и геоданные.

Ещё можно найти немало датасетов с упоминанием Еревана [2] как крупнейшего города страны

А также тысячи наборов данных доступны при поиске по слову Armenia [3], но иногда возникают пересечения с одноимённым городом в Колумбии [4]🇨🇴

Dateno доступен через веб интерфейс и через API, получить ключ можно после регистрации и проверить его с помощью утилиты командной строки [5].

P.S. Основатели Open Data Armenia также являются основателями Dateno, данные по Армении можно будет использовать на хакатонах по открытым данным, а самые интересные датасеты мы будем копировать на портал открытых данных Open Data Armenia.

Ссылки:
[1] https://dateno.io/search?refinementList%5Bsource.countries.name%5D%5B0%5D=Armenia
[2] https://dateno.io/search?query=Yerevan
[3] https://dateno.io/search?query=Armenia
[4] https://en.wikipedia.org/wiki/Armenia,_Colombia
[5] https://github.com/datenoio/datenocmd

#opendata #data #armenia #datasearch
📎 Ереванский центр международного образования ведет набор на профильные курсы по программированию и аналитике данных для студентов социальных и гуманитарных специальностей и исследователей. Подробности в следующем посте ⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Events and texts
Ереванский центр международного образования объявил три полезных курса по программированию и аналитике данных для студентов социальных и гуманитарных специальностей, исследователей и журналистов:

В конце ноября стартует курс "Intro to Scraping and Parsing of the Websites" (информация и запись тут).

В феврале 2025 года стартует курс Statistics: Data Visualization and Analysis with R (информация и запись здесь).

В марте начнется третий курс трека: Intro to Quantitative Text Analysis in R (информация и запись тут).

Ведет курсы Юрий Агафонов, предварительных знаний программирования и статистики не требуется.
Forwarded from Ivan Begtin (Ivan Begtin)
Foursquare вот буквально только что выложили огромный набор данных в 100 миллионов точек интереса (POI) [1] [2], скачать его можно через Amazon S3 хранилище [3] в виде множества parquet файлов.

Данные охватывают 247 стран и территорий [4], например, по Армении 7425 точек (очень мало!), по Польше 3,553,098 (❗️), по России меньше чем по Польше, всего 3,125,954. А более всего, ожидаемо, по США - 22 миллиона точек. Это на апрель 2023 года и по всей базе Places, а конкретно этот набор надо изучить, что там внутри.

Всё оформлено как полноценный дата продукт, с документацией, примерами SQL запросов, API, ответами на вопросы. Необычна лицензия, Apache 2.0, она в целом для кода, а не для данных.

Ссылки:
[1] https://location.foursquare.com/resources/blog/products/foursquare-open-source-places-a-new-foundational-dataset-for-the-geospatial-community/
[2] https://opensource.foursquare.com/os-places/
[3] https://docs.foursquare.com/data-products/docs/access-fsq-os-places
[4] https://docs.foursquare.com/data-products/docs/supported-countries

#opendata #datasets #foursquare #geodata #spatial #poi
[EN] Armenian Points of interests (POI) data from Foursquare OS Places [1] is a new dataset in the Open Data Armenia data catalogue. This data is extracted from the huge OS Places dataset previously published by Foursquare [2].

The dataset contains just under 16 thousand locations across the country, most of the place names are in English, Russian and Armenian. The most places are marked in Yerevan, but not only.

Data in Parquet format is a special format for data popular in Data Science, it is most convenient to work with it using such tools as DuckDB, Pandas and Polars.

If someone needs this data in other formats, please write, we will add it.

[RU] Armenian Points of interests (POI) data from Foursquare OS Places [1] новый набор данных в каталоге данных Open Data Armenia. Эти данные извлечены из огромного датасета OS Places ранее опубликованного Foursquare [2].

Датасет содержит чуть менее 16 тысяч точек по стране, большая часть названий мест на английском, русском и армянском языках. Более всего мест отмечено в Ереване, но не только.

Данные в формате Parquet, это специальный формат для данных популярный в Data Science, с ним удобнее всего работать с помощью таких инструментов как DuckDB, Pandas и Polars.

Если кому-то понадобятся эти данные в других форматах, напишите, добавим.

Ссылки:
[1] https://data.opendata.am/dataset/am-os-places
[2] https://t.iss.one/opendataam/131

#opendata #datasets #geodata #armenia #foursquare
Наши друзья и партнеры проводят хакатон ConnectBridge. Он будет проходить офлайн в Брюсселе 24-26 января 2025 года. Командам, успешно прошедшим отбор, будет оплачена дорога и проживание.

На хакатоне предлагают много идей для разработки для свободного интернета, такие как, инструменты для фактчекинга контента или обход цензуры.

Возможно, цензура не самая актуальная проблема для Армении, но факт чекинг актуален для всех. Не говоря уже об исследованиях кибератак, инструментах на основе ИИ и не только.

Призовой фонд — 5000 USDT и дополнительные призы от партнёров.

А подать заявку на участие можно до 10 декабря 2024 года.

Времени на подачу заявок ещё есть, но откладывать не стоит!
Open Data Armenia объявляет конкурс физических визуализаций на основе данных, касающихся Армении. В конкурсе могут участвовать все, кто заинтересован данными и визуализацией.

Для участия в конкурсе выполните следующие шаги:
1. выберите данные по Армении (на ваш вкус). Можете использовать датасеты из нашего каталога;
2.
Подключите фантазию и креатив;
3. визуализируйте данные с помощью физических объектов;
4. сфотографируйте и опубликуйте на своей странице в соцсети, можете отметить нас;
5. отправьте ссылку на страницу Open Data Armenia в Facebook или на электронную почту [email protected] до 15 января;
6. выиграйте ежемесячный приз!

Победителями станут авторы самых креативных визуализаций. Мы подарим им книги ведущих мировых специалистов по визуализации данных.
Под ёлочку анонсируем наш второй конкурс открытых данных (Open Data Armenia Contest)!

2 номинации: культурные (языковые, литературные) проекты и визуализации данных.

Общий призовой фонд – 3000 долл. США. Дедлайн подачи конкурсных проектов – 16 февраля.

Итоги конкурса подведем на Дне открытых данных в Армении в рамках международной Недели открытых данных в начале марта.

Все остальные подробности на сайте, доступном на 3-х языках.

Участвуйте и приглашайте друзей, интересующихся анализом данных, программированием, армянской культурой и историей, дизайнеров и всех, кто небезразличен к открытым данным и Армении. Можете поискать членов команды прямо в чате!
Forwarded from Gayane Ghazaryan
Hey everyone!
Excited to share that our paper, "SynDARin: Synthesising Datasets for Automated Reasoning in Low-Resource Languages," has been accepted to COLING 2025! 🎉

This work started as my Bachelor thesis at AUA, where we developed SynDARin, a method for creating QA datasets for low-resource languages. As a case study, we applied it to Armenian, building a 1.2K-sample dataset and benchmarking LLMs on QA in Armenian.

Huge thanks to @kire_kara for being a great supervisor and mentor!!!

Paper: https://arxiv.org/abs/2406.14425
Dataset: https://huggingface.co/datasets/gayaneghazaryan/SynDARin
Для любителей альтернативных визуализаций у нас продолжается ещё один конкурс! Рассказали подробнее о физических визуализациях и показали вдохновляющие примеры на нашем сайте.
Open Data Armenia
Участвуешь в конкурсе открытых данных об Армении?
Собиравшиеся сдать в последний момент друзья и особенно @kalipsik, наше жюри согласилось продлить прием заявок до конца дня 28 февраля! 🎉

Если вы хотели бы обновить уже заполненную заявку, можете спокойно загрузить новую – мы рассмотрим более поздний вариант. По всем смежным вопросам пишите @vvbabayan.