Open Data Armenia
274 subscribers
48 photos
1 video
2 files
81 links
Open Data Armenia news channel. English/Armenian/Russian

Join chat at https://t.iss.one/opendataamchat
Download Telegram
[EN] Awesome list: a toolkit for text analyzis Armenian language

- Eastern Armenian National Corpus Electronic Library provides a full view of works by classical authors (these books are in the public domain because their authors died more than 70 years ago). The corpus contains 4547379 words from 104 books by 12 authors. 

- Named entity recognition. pioNer — trained data for Armenian NER using Wikipedia. This corpus provides the gold standard for automatically generated annotated datasets using GloVe models for Armenian. Along with the datasets, 50-, 100-, 200-, and 300-dimensional GloVe word embeddings trained on a collection of Armenian texts from Wikipedia, news, blogs, and encyclopedias have been released.

- The Polyglot library for Python supports language detection, named entity extraction (using Wikipedia data), morphological analysis, transliteration, and sentiment analysis for Armenian.

- Kevin Bougé Stopword Lists Page includes th Armenian language.

- Ranks NL Stopword Lists Page includes the Armenian language.

If you know of new usefull tools and guides, please share that knowledge with us!

Image author Aparna Melaput

#opendata #armenia #language #tools #digitalhumanities
[ru] Для тех кто ещё ищет инструменты для визуализации данных или ещё не определился с проектом, но думает о том как визуализировать данные какого-то исторического события или эпохи, подборка инструментов для построения таймлайнов (timeline) специальных графиков для визуализации событий привязанных к историческим датам.

Timeline Knightslab опубликовано с открытым кодом и используется во множестве проектов, например, в визуализации истории вина.

Для работы не требуется опыт программирования, результат можно вставить в готовый сайт. А, при желании, можно использовать открытый код продукта и подключать к более сложному техническому проекту.

TimeGraphics ещё один инструмент, онлайн сервис для визуализации. В нём многие энтузиасты уже сделали много визуализаций истории Армении и геноцида. Использовать такой инструмент очень просто, важно постараться придать таймлайну насыщенность и не только использовать текст, но и изображения.

React-chrono - этот инструмент уже для разработчиков и он представлен в виде компонента для JS фреймворка React. Он также позволяет создавать сложные таймлайны, вертикальные, горизонтальные, простые и сложные. Но его использование требует навыков разработки.

Для всех проектов с таймлайнами нужны данные, но их нужно не так много. Важно чтобы эти данные включали:
- дату, заголовок, описание и, желательно, изображение и ссылку, если это внешний контент.

А если этот таймлайн посвящен культуре и истории Армении и армян, то его можно подавать и на номинацию культурных прижений нашего конкурса.

#opensource #tools #dataviz #timeline