Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
В Корпусе берестяных грамот появились 19 берестяных грамот из Новгорода и Старой Руссы, найденные в прошлом, 2023 году. Их объем — более 300 слов. Кроме того, внесены поправки в тексты и переводы ранее найденных берестяных грамот. В корпус попали такие новые слова, как ѣздець (‘ездок’), шида (‘шелк’), немочи (‘хворать’), крута (‘приданое’). Такие обычные слова, как огородъ, капуста, боꙗринъ тоже встретились впервые в новых грамотах.
Значительно улучшен поиск по корпусу, в форме запроса можно задавать новые пометы, связанные с грамматикой и интерпретацией слова.
Сегодня на 78-ом году жизни скончался выдающийся российский лингвист, специалист по современному синтаксису и семантике, компьютерной лингвистике и машинному переводу, ведущий научный сотрудник Института проблем передачи информации РАН Леонид Лейбович Иомдин.
Леонид Лейбович был активным участником проекта «Национальный корпус русского языка» и одним из создателей Синтаксического корпуса в составе НКРЯ.
Приносим искренние соболезнования родным и близким Леонида Лейбовича.
На сайте Корпуса появился личный кабинет.
Его основная задача – сделать индивидуальную работу с сайтом удобнее. Теперь пользователи могут сохранять в личный кабинет интересующие их запросы (в любом корпусе) и сравнения запросов (в тех корпусах, где есть эта функция) и возвращаться к ним.
Чтобы сохранить запрос или сравнение, нужно нажать кнопку «Сохранить запрос» в выдаче или «Сохранить сравнение» на странице сравнения запросов. В личном кабинете в соответствующих вкладках можно просматривать сохраненные запросы и сравнения, давать им названия, копировать короткие ссылки, чтобы поделиться с другими, и удалять сохраненное. Количество запросов и сравнений, которые можно сохранить, не ограничено.
Вместе с появлением личного кабинета расширились и настройки профиля. Пользователи могут заполнить информацию о себе (эти данные сможет видеть только сам пользователь), изменить пароль или удалить аккаунт. В будущем с согласия пользователя некоторые его данные, такие как имя и место работы, будут видны другим.
Личный кабинет доступен на компьютере и в мобильной версии.
Древнерусский корпус пополнился новыми текстами и вырос на 43 тысячи слов. С одной стороны, в него вошли поздние тексты XIV в. (например, украинские и московские деловые грамоты, псковская «Повесть о Довмонте»), с другой – расширена разметка ранних текстов (Повести временных лет по Лаврентьевскому списку или житий). В словарь корпуса теперь входят предки таких привычных слов, как напрасно, перемолвиться, шапка или разногласие.
В древнерусском корпусе теперь можно отбирать подкорпус и получать статистику по стандартным критериям (включая дату текста и списка, жанр текста, объем текста) и узнать, насколько персонажи летописей ходят чаще, чем фигуранты грамот и повестей. Появилась возможность поиска по греческим леммам и словоформам для переводных произведений. Греческие слова можно ввести на виртуальной клавиатуре. Например, слово δόγμα (догма) передавалось славянскими переводчиками не только через заимствование догмат, но и как повеление, учение или устав.
В Портрете слова доступен новый функционал – «Формы слова». Для древнерусских существительных даны все формы чисел и падежей в разных орфографиях, встретившиеся в корпусе. Можно узнать частотность этих форм и перейти по ссылкам на примеры в поиске. Например, можно узнать, какие формы в текстах имело слово друг. Некоторые формы редко употребляющегося двойственного числа пока в корпусе не встретились (такие формы можно найти в грамматиках, где даны полные стандартные таблицы – парадигмы).