НКРЯ Национальный корпус русского языка
2.23K subscribers
88 photos
36 videos
188 links
Канал об обновлениях, пополнениях и советах по работе с НКРЯ не только для лингвистов, но и для всех интересующихся русским языком.
Сайт Корпуса https://ruscorpora.ru
Download Telegram
Старорусский корпус пополнен примерно на 700 тысяч слов. В корпус включены старорусские памятники разных жанров: летописи (тверские, Иоасафовская, Варшавский сборник), географическое описание Московского царства и сопредельных государств («Книга Большому чертежу»), документы хозяйственного и налогового учета разных территорий.
32👍13🔥3🏆1
Мы продолжаем развивать функционал корпуса для школьного преподавания русского языка. В Генератор примеров для упражнений добавлено еще шесть новых правил:

• Время глагола
• Вид глагола
• Буквы Ы и И после приставок на согласные
• Правописание пре- и при- в приставках и корнях слов
• Правописание суффиксов -чик- и -щик-
• Правописание -н- и -нн- в прилагательных

Количество правил продолжает расти, поэтому для удобства навигации правила в меню теперь расположены на нескольких тематических вкладках.
Напоминаем, что попасть на страницу генератора можно со страницы НКРЯ в школе, нажав на соответствующий баннер.
37🔥21👏5👍4
Поэтический корпус пополнен произведениями трех поэтов второй половины ХХ века с особым фокусом на бардовскую поэзию — Владимира Высоцкого, Новеллы Матвеевой и Владимира Уфлянда. Общий объем пополнения — 177 тыс. словоупотреблений или 36 тысяч стихотворных строк.

Тексты, доступные в корпусе ранее, снабжены автоматической нейросетевой морфологической разметкой (лемматизация и грамматика) с частичной ручной коррекцией, исправлено множество ошибок в разметке. По умолчанию эти разборы доступны в поиске наравне с разборами, основанными на грамматическом словаре.
25🔥11👍5
В Диалектном корпусе теперь доступны такие инструменты, как «Статистика», «Частотность», частотные словари, n-граммы, поиск с регулярными выражениями, парадигмы в Портрете слова. В частности, можно увидеть в таблице, в каком облике встретились падежные формы слова заяц и как коррелирует окончание типа за ягодам с разделением говоров на окающие и акающие.
🔥21🤩6👍5
В корпусах с автоматической синтаксической разметкой (Основной, Центральные и Региональные СМИ, «От 2 до 15» и Русская классика) теперь можно увидеть синтаксическое дерево предложения. Оно открывается по специальному значку для всех предложений в поисковой выдаче. Для каждого слова в предложении на картинке указана лемма и часть речи, а синтаксические связи между ними отображены в виде направленных стрелок с названием связи. Изображение дерева можно скачать в виде картинки.
🔥2513🥰7🙏7👍2
Разработчики корпуса Кирилл Корчагин и Борис Орехов в рамках Ежегодного междисциплинарного фестиваля «Гуманитариум» в Библиотеке иностранной литературы 23 ноября 2025 года прочли популярную лекцию на тему «Зачем нужен Поэтический корпус?».

Лекторы остановились на научном контексте появления Поэтического корпуса, его истории в составе НКРЯ, продемонстрировали возможности поиска и остановились на конкретных примерах того, что можно найти, пользуясь этими возможностями. Так, слушатели узнали, что самым поэтичным временем года оказалась весна, какова динамика использования в русской поэзии октавы и онегинской строфы, от чьего творчества отталкивался Ф. И. Тютчев, когда искал свой авторский голос, как корпус позволяет восстановить старые ударения в словах, какие слова больше подходят для поэзии, чем для прозы, и почему.

Видео выступления доступно по ссылке: https://vk.com/video-219147744_456239140
🔥2516👍8
В Синтаксическом корпусе произошел ряд изменений. Синтаксические отношения теперь доступны для выбора начиная с первого слова и показываются в форме лексико-грамматического поиска по умолчанию. Появилась возможность задавать синтаксическое отношение до любого слова. В некоторых текстах у предложений помимо синтаксической появилась семантическая структура, открывающаяся в отдельном окне по специальному значку. В карточке слова появилась информация о его модели управления. Дополнен ряд текстов, ранее представленных в корпусе; исправлены ошибки в разметке морфологии, синтаксиса и микросинтаксиса, обработаны все сообщения об ошибках от пользователей.
🔥239👍4
Русский Мультипарк пополнен до 375 тыс. словоформ. Добавлена пьеса А.П. Чехова «Три сестры» в постановках двух театров ― МХАТ им. Чехова и Молодежного театра на Фонтанке. В составе корпуса организован новый раздел ― чтение прозы в исполнении мастеров художественного слова. В коллекцию вошли разные исполнительские версии чтения повестей А.С. Пушкина, рассказов А.И. Куприна и М.М. Зощенко.
12👍3🔥2
Мы продолжаем развивать функционал корпуса для школьного преподавания русского языка. В Генератор примеров для упражнений добавлено еще пять новых правил:

• Буквы И, У, А, Ю после шипящих
• Буквы Ы и И после Ц
• Склонение имён существительных
• Род имён существительных
• Правописание -тся и -ться в глаголах

Попасть на страницу генератора примеров можно со страницы НКРЯ в школе, нажав на соответствующий баннер.
👍20🔥65
По традиции в последний рабочий день уходящего года команда НКРЯ подводит итоги и вспоминает о том, что нового появилось в Корпусе.

В 2025 году Корпус вырос более чем на 47 млн слов. Расширились возможности целого ряда корпусов – от исторических до Диалектного и Синтаксического. Существенно улучшена нейросетевая разметка лемм и морфологии в Основном, Газетных, Обучающем корпусах, корпусе «‎Русская классика»‎ и «‎От 2 до 15»‎. Исследователям, разработчикам и преподавателям доступен публичный API, который позволяет программно выполнять поисковые запросы.

Продолжалось развитие Корпуса и как инструмента для широкой аудитории – появился новый сервис «‎Генератор примеров для упражнений»‎, а также несколько новых виджетов в Портрете слова.

На картинке мы собрали нововведения и улучшения, появившиеся в уходящем году, которые сделают вашу работу с Корпусом ещё более продуктивной и приятной. Пусть Новый год принесёт вам множество интересных находок и открытий!

С наилучшими пожеланиями в Новом году,
Команда Национального корпуса русского языка
44🎉12🔥11
Поздравляем вас с наступающим Новым годом!

Желаем, чтобы 2026 год стал годом смелых гипотез, приятных открытий и блестящих результатов!
🥰42🎉2321🤔2