Цифровой филолог👩‍💻
443 subscribers
57 photos
9 videos
14 files
151 links
Канал об электронных филологических ресурсах:
- электронных словарях,
- текстовых корпусах,
- базах данных,
- лингвистических программах.

Автор канала: @Elena_Rechnaya (открыта для диалога)

Чат: t.iss.one/digital_philologist_chat
Download Telegram
Пост-знакомство и навигация по каналу

Приветствую всех на канале "Цифровой филолог". Я Елена Рогожина. На протяжении нескольких лет я преподаю дисциплины на стыке филологии и информатики:

🖋Информационные ресурсы в филологической деятельности;

🖋Технологии корпусной лингвистики;

🖋Технологии обработки текста и звучащей речи;

🖋Общая и компьютерная лексикография.

У меня собралась большая коллекция материалов, которой мне хочется поделиться с другими.

В планах публикация учебных пособий и методических разработок, и, надеюсь, работа над каналом может мне в этом помочь.

Канал ориентирован преимущественно на филологов и всех, кто хочет узнать больше о филологических ресурсах (электронных словарях, текстовых корпусах, базах данных, лингвистических программах, полезных инструментах).


НАВИГАЦИЯ:

#словари@digital_philologist

#орфография@digital_philologist

#грамматика@digital_philologist

#справочники@digital_philologist

#энциклопедии@digital_philologist

#корпуса@digital_philologist

#базы@digital_philologist

#программы@digital_philologist

#расширения@digital_philologist

#библиотеки@digital_philologist

#литература@digital_philologist

#мифология@digital_philologist

#лекции@digital_philologist

#курсы@digital_philologist

#вебинары@digital_philologist

#конференции@digital_philologist

#школы@digital_philologist

#исследования@digital_philologist

#ии@digital_philologist

#рекомендации@digital_philologist

#перевод@digital_philologist

#поиск@digital_philologist

#НКРЯ@digital_philologist

#English_corpora@digital_philologist

#дайджест@digital_philologist
Please open Telegram to view this post
VIEW IN TELEGRAM
Поделюсь своим лингвистическим лайфхаком в поиске упоминаний Достоевского в кинематографе при помощи корпусов (English Corpora и НКРЯ)

Здесь много скриншотов, поэтому подробную инструкцию выложила на отдельном сайте.

https://teletype.in/@digital_philologist/dostoevsky_cinema

#корпуса@digital_philologist
#НКРЯ@digital_philologist
#English_corpora@digital_philologist
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Платформа лингвистических корпусов, словарей, баз данных и сервисов WEB-CORPORA.NET

Давно хотела рассказать об этом ресурсе, но последнее время были технические неполадки с сайтом. Наконец платформа заработала!

Здесь вы найдёте множество корпусов:

КОРПУСА ЯЗЫКОВ РОССИИ
👩‍💻Бурятский корпус

👩‍💻Калмыцкий корпус

👩‍💻Татарский национальный корпус «Туган тел»

👩‍💻Корпус удмуртского языка

👩‍💻Башкирский поэтический корпус

КОРПУСА РУССКОГО ЯЗЫКА

👩‍🏫Русский учебный корпус (RLC)

В Русском учебном корпусе содержатся образцы устной и письменной речи двух категорий нестандартных говорящих на русском языке: изучающих русский язык как иностранный и так называемых эритажных говорящих.

👩‍🏫Корпус русских учебных текстов (КРУТ)

Коллекция текстов на русском языке, написанных студентами разных вузов. Тексты сопровождаются несколькими типами разметки (метатекстовой, морфологической разметкой и разметкой по ошибкам), что позволяет осуществлять поиск по корпусу.

КОРПУСА ДРУГИХ ЯЗЫКОВ

🇦🇱Корпус албанского языка

🇬🇷Корпус новогреческого языка

🇮🇱Корпус языка идиш

📜Аннотированный корпус лувийских текстов

🇰🇿Алматинский корпус казахского языка

🇲🇳Корпус монгольского языка

🇪🇹Корпус амхарского языка (государственный язык Эфиопии)

🇹🇭Тайский корпус HSE

💃Корпус цыганского языка

СЛОВАРИ

📚Объединенный словарь синонимов

📚Объединенный словарь антонимов

📗Словарь русского языка XI–XVII веков

БАЗЫ ДАННЫХ

🇷🇺Языки России

Коллекции текстов на малых языках России со статистикой объемов собранного материала.

🐮База данных Звуки Му

Типологическая база данных по семантической зоне звуков, издаваемых животными. Представлены данные более 20 языков разных языковых семей.

и многое другое!


О каком корпусе, словаре или базе рассказать подробнее?

#корпуса@digital_philologist
#словари@digital_philologist
#базы@digital_philologist
Please open Telegram to view this post
VIEW IN TELEGRAM
Марк Дэвис - один из известнейших корпусных лингвистов в мире.

Пожалуй, каждый, кто хоть раз пользовался корпусом English Corpora, слышал об американском профессоре Марке Дэвисе.

На его персональной странице изложена его научная биография, дана ссылка на список, насчитывающий более 90 публикаций, причём все из них доступны для скачивания.

Исследования Марка Дэвиса посвящены корпусам и частотным словарям английского, испанского и португальского языков:

📈English Corpora

📈El corpus del español

📈O corpus do português

В этих корпусах представлен широкий функционал поисковых возможностей:

📍поиск с учетом морфологии
*POS (Part of Speech) - частеречный теггинг;

📍поиск по маске;

📍поиск коллокаций;

📍возможность создания собственного подкорпуса;

📍обзор наиболее частотных знаменательных слов (аналогичен портрету слова в НКРЯ), который синхронизирован с популярными сервисами
- Google Translate, Google Search, Google Images;
- YouGlish, PlayPhrase, Yarn;
- WordRef, Reverso, Linguee.

Все корпусы доступны и бесплатны, хотя имеют ограничения по запросам (из-за чего периодически появляется реклама, предлагающая приобрести расширенные подписки).

English Corpora включает 17 разных самостоятельных корпусов, которые отличаются охватываемым временным периодом, тематикой, жанром, источниками, а также типом текстов.

Пишите в комментариях, нужен ли видеообзор ресурса.

https://www.mark-davies.org/

#корпуса@digital_philologist