Open Data Armenia
289 subscribers
56 photos
1 video
2 files
91 links
Open Data Armenia news channel. English/Armenian/Russian

Join chat at https://t.iss.one/opendataamchat
Download Telegram
Forwarded from Ivan Begtin (Ivan Begtin)
Foursquare вот буквально только что выложили огромный набор данных в 100 миллионов точек интереса (POI) [1] [2], скачать его можно через Amazon S3 хранилище [3] в виде множества parquet файлов.

Данные охватывают 247 стран и территорий [4], например, по Армении 7425 точек (очень мало!), по Польше 3,553,098 (❗️), по России меньше чем по Польше, всего 3,125,954. А более всего, ожидаемо, по США - 22 миллиона точек. Это на апрель 2023 года и по всей базе Places, а конкретно этот набор надо изучить, что там внутри.

Всё оформлено как полноценный дата продукт, с документацией, примерами SQL запросов, API, ответами на вопросы. Необычна лицензия, Apache 2.0, она в целом для кода, а не для данных.

Ссылки:
[1] https://location.foursquare.com/resources/blog/products/foursquare-open-source-places-a-new-foundational-dataset-for-the-geospatial-community/
[2] https://opensource.foursquare.com/os-places/
[3] https://docs.foursquare.com/data-products/docs/access-fsq-os-places
[4] https://docs.foursquare.com/data-products/docs/supported-countries

#opendata #datasets #foursquare #geodata #spatial #poi
[EN] Armenian Points of interests (POI) data from Foursquare OS Places [1] is a new dataset in the Open Data Armenia data catalogue. This data is extracted from the huge OS Places dataset previously published by Foursquare [2].

The dataset contains just under 16 thousand locations across the country, most of the place names are in English, Russian and Armenian. The most places are marked in Yerevan, but not only.

Data in Parquet format is a special format for data popular in Data Science, it is most convenient to work with it using such tools as DuckDB, Pandas and Polars.

If someone needs this data in other formats, please write, we will add it.

[RU] Armenian Points of interests (POI) data from Foursquare OS Places [1] новый набор данных в каталоге данных Open Data Armenia. Эти данные извлечены из огромного датасета OS Places ранее опубликованного Foursquare [2].

Датасет содержит чуть менее 16 тысяч точек по стране, большая часть названий мест на английском, русском и армянском языках. Более всего мест отмечено в Ереване, но не только.

Данные в формате Parquet, это специальный формат для данных популярный в Data Science, с ним удобнее всего работать с помощью таких инструментов как DuckDB, Pandas и Polars.

Если кому-то понадобятся эти данные в других форматах, напишите, добавим.

Ссылки:
[1] https://data.opendata.am/dataset/am-os-places
[2] https://t.iss.one/opendataam/131

#opendata #datasets #geodata #armenia #foursquare
Наши друзья и партнеры проводят хакатон ConnectBridge. Он будет проходить офлайн в Брюсселе 24-26 января 2025 года. Командам, успешно прошедшим отбор, будет оплачена дорога и проживание.

На хакатоне предлагают много идей для разработки для свободного интернета, такие как, инструменты для фактчекинга контента или обход цензуры.

Возможно, цензура не самая актуальная проблема для Армении, но факт чекинг актуален для всех. Не говоря уже об исследованиях кибератак, инструментах на основе ИИ и не только.

Призовой фонд — 5000 USDT и дополнительные призы от партнёров.

А подать заявку на участие можно до 10 декабря 2024 года.

Времени на подачу заявок ещё есть, но откладывать не стоит!
Open Data Armenia объявляет конкурс физических визуализаций на основе данных, касающихся Армении. В конкурсе могут участвовать все, кто заинтересован данными и визуализацией.

Для участия в конкурсе выполните следующие шаги:
1. выберите данные по Армении (на ваш вкус). Можете использовать датасеты из нашего каталога;
2.
Подключите фантазию и креатив;
3. визуализируйте данные с помощью физических объектов;
4. сфотографируйте и опубликуйте на своей странице в соцсети, можете отметить нас;
5. отправьте ссылку на страницу Open Data Armenia в Facebook или на электронную почту [email protected] до 15 января;
6. выиграйте ежемесячный приз!

Победителями станут авторы самых креативных визуализаций. Мы подарим им книги ведущих мировых специалистов по визуализации данных.
Под ёлочку анонсируем наш второй конкурс открытых данных (Open Data Armenia Contest)!

2 номинации: культурные (языковые, литературные) проекты и визуализации данных.

Общий призовой фонд – 3000 долл. США. Дедлайн подачи конкурсных проектов – 16 февраля.

Итоги конкурса подведем на Дне открытых данных в Армении в рамках международной Недели открытых данных в начале марта.

Все остальные подробности на сайте, доступном на 3-х языках.

Участвуйте и приглашайте друзей, интересующихся анализом данных, программированием, армянской культурой и историей, дизайнеров и всех, кто небезразличен к открытым данным и Армении. Можете поискать членов команды прямо в чате!
Forwarded from Gayane Ghazaryan
Hey everyone!
Excited to share that our paper, "SynDARin: Synthesising Datasets for Automated Reasoning in Low-Resource Languages," has been accepted to COLING 2025! 🎉

This work started as my Bachelor thesis at AUA, where we developed SynDARin, a method for creating QA datasets for low-resource languages. As a case study, we applied it to Armenian, building a 1.2K-sample dataset and benchmarking LLMs on QA in Armenian.

Huge thanks to @kire_kara for being a great supervisor and mentor!!!

Paper: https://arxiv.org/abs/2406.14425
Dataset: https://huggingface.co/datasets/gayaneghazaryan/SynDARin
Для любителей альтернативных визуализаций у нас продолжается ещё один конкурс! Рассказали подробнее о физических визуализациях и показали вдохновляющие примеры на нашем сайте.
Open Data Armenia
Участвуешь в конкурсе открытых данных об Армении?
Собиравшиеся сдать в последний момент друзья и особенно @kalipsik, наше жюри согласилось продлить прием заявок до конца дня 28 февраля! 🎉

Если вы хотели бы обновить уже заполненную заявку, можете спокойно загрузить новую – мы рассмотрим более поздний вариант. По всем смежным вопросам пишите @vvbabayan.
Для тех кто изучает данные по криптовалютам и Web3 мы запустили новый каталог открытых данных Crypto Data Hub [1] где можно найти много разных данных по криптовалютам из самых разных источников. Основным источником являются данные сервиса Blockchair [2] которые мы перегруппировали в виде помесячных датасетов, но кроме них есть и другие датасеты и общее их число будет постепенно расти.

Также портал проиндексирован в Dateno благодаря чему в Dateno теперь можно найти данные по криптовалютам [3].

CryptoData Hub - это глобальный некоммерческий проект созданный от лица НКО Open Data Armenia (@opendataam), мы продолжим наполнять его интересными датасетами. Если Вы знаете интересные криптоданные, можете поделиться ими или знаете где их взять, напишите мне в личку или на [email protected] и мы будем только рады их добавить в этот каталог.

P.S. Мы специально сделали именно отдельный каталог данных поскольку тема криптовалют большая, потребности исследователей в данных растут, а доступных данных не так много, вернее много, но коммерческих. Наша цель в том чтобы проекты из Армении звучали глобально и CryptoData Hub был бы одним из таких проектов.

Ссылки:
[1] https://cryptodata.center
[2] https://blockchair.com/dumps
[3] https://dateno.io/search?query=Zcash

#opendata #datasets #opendataam #cryptocurrency #data #datacatalogs
Мы знаем, что вы ждали этот день!

Второй Международный День Открытых Данных в Армении состоится уже 5-6 марта.

Программа очень насыщенная: подведем итоги Конкурса Открытых Данных (сегодня последний день подачи заявок!), обсудим последние тренды в развитии открытых данных, научимся некоторым техникам сбора и обработки открытых данных и вместе поразмышляем, как сделать открытые данные более полезными для Армении и глобального армянского наследия.

📅 Дата: 5-6 марта, 14:00-18:00
📍 Место: Центр ISTC (Ереван, ул. Алека Манукяна 1/7, 7-й этаж)
🔗 Программа и регистрация: https://odd.opendata.am/am

Регистрируйтесь, приходите и приводите неравнодушных друзей – аналитиков, исследователей, журналистов, культурологов, филологов, активистов, чиновников.