Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







ЗАЧЕМ НУЖЕН НАЦИОНАЛЬНЫЙ КОРПУС РУССКОГО ЯЗЫКА?





НЕФОРМАЛЬНОЕ ВВЕДЕНИЕ

С недавнего времени в языкознании, по мнению автора, фундаментальные проблемы (русский язык, его отличие от других языков, его прошлое и настоящее, будущее) обсуждаются в основном с помощью такого инструмента, как корпус языка.

Далее исследователь поясняет, что такое корпус вообще и Национальный корпус в частности. По мнению автора корпус некоторого языка — это собрание текстов на данном языке, представленное в электронной форме и снабженное научным аппаратом (т.н. «разметкой», или «аннотацией»). Чем полнее и совершеннее его аннотация, тем лучше корпус. По сути «корпусная лингвистика» — это прежде всего наука о том, как сделать хорошую разметку.

Хорошая разметка, как отмечает автор, позволяет быстро и эффективно найти в корпусе те слова, формы и конструкции, которые требуются исследователю. Для этого программа поиска должна понимать как минимум то, какие формы в тексте относятся к одному и тому же слову (например, ржи и рожью, но не ржал и Ржев), то есть хотя бы частично «понимать» грамматическую структуру данного языка. Тем более это понимание необходимо, если необходимо искать не слова, а формы. Для того чтобы их можно было автоматически найти в тексте, этот текст как раз и необходимо предварительно разметить.

Благодаря размеченному корпусу поиск материала для исследования существенно ускоряется. То, на что у исследователей предшествующих поколений уходили недели, а то и месяцы напряженного труда, с помощью корпуса можно будет сделать за минуты.

Далее автор, развивая свою мысль, поясняет, что такое Национальный корпус. По образцу британцев (как создателей эталона в данном вопросе) Национальным корпусом стали называть просто самый большой и представительный корпус, характеризующий язык данной страны в целом. НК определяется, прежде всего, объемом: сотнями миллионов словоупотреблений. Также, что не менее важно, он должен быть представительным (содержать все типы текстов, представленные в данном языке в данный исторический период в правильной пропорции). Сюда относятся произведениями художественной литературы XIX и XX века, газетные, и журнальные статьи разной тематики, и специальные тексты (научные, научно-популярные и учебные по разным отраслям знания), и реклама, и частная переписка, и дневники.



Для полного и адекватного представления о том, что происходит в современном русском языке необходимо, по мнению автора, включить в него записи устной речи, т.к. она более динамична, менее скованна нормой, содержит структуры живого русского языка, а значит, отчасти позволяет заглянуть в будущее языка.

К источникам устных текстов автор относит: записи радиопередач, интервью, круглых столов и т. п., бытовых разговоров (диалогов и монологов), тексты бесед социологов или маркетологов с целевыми группами респондентов на определенную тему. В отдельный вопрос Плунгян выделяет включение в Корпус образцов настоящей диалектной речи.

Особый интерес у исследователей вызывают тексты т. н. «электронной коммуникации» (переписка по электронной почте, всевозможные чаты, форумы, «блоги» и т. п. ). Такие тексты представляют собой некий гибрид устной и письменной речи. Подобные образцы электронной коммуникации наиболее сложны для обработки и разметки, потому что пишущие в сетевой среде чувствуют себя более свободно не только в отношении языка, но в от-ношении норм общепринятой орфографии.

Не менее интересны электронные тексты в качестве источников для изучения современного сленга.

Если посмотреть на пропорции разных типов текстов в Корпусе, то окажется, что доля собственно художественных текстов составляет около 40%. Это во многом продиктовано традицией отечественной филологии (ставившей знак равенства между изучением русского языка и изучением русского литературного языка, т. е. языка художественной литературы). Сам термин «литературный» язык (обозначающий на самом деле скорее не литературный в прямом смысле, а просто общенациональный нормативный, т. е. стандартный язык) отчасти предполагает, что наиболее престижная и «правильная» часть текстов, создаваемых на данном языке — это тексты художественной прозы. Однако, данная точка зрения, по мнению большинства исследователей, уже со 2-й половины XX не соответствует действительности. Ведь язык писателей (в том числе выдающихся писателей) и общенациональный язык — это не одно и тоже. Особенно в контексте изменений социального значения художественной литературы (и, как следствие, идейно-стилистических установок современных постмодернистов). Поэтому в Национальном корпусе русского языка художественные тексты представлены в большом количестве, но они не доминируют. В корпусах европейских языков, как правило, не превышает 20%, так что Национальный корпус русского языка всё равно остается одним из самых «литературоцентричных».

Плунгян отмечает, что в НКРЯ возможен поиск искать любых слов и грамматических форм слов, а также словосочетаний. Поиск возможен не только по всему корпусу, но и по определенному множеству текстов, выбранному пользователем: например, тексты определенного автора, определенного периода, определенного жанра и т. п.

Как ранее отметил автор, корпус необходим профессиональным лингвистам. Во-первых, в качестве инструмента, сокращающий затраты времени на техническую работу. Во-вторых, как справочно-информационная система по современному русскому языку, позволяющая получать ответы на самые неожиданные вопросы — более того, позволяющая ставить новые проблемы, которых лингвистика прошлого почти не касалась.

В настоящий момент, как справедливо отмечает Плунгян, с использованием материалов корпуса пишутся научные доклады, студенческие работы, защищаются диссертации.

Не менее удобен НК, по мнению автора, программистам, работающим в области автоматической обработки текстов. Т.к. программы такого рода имеют дело с естественным языком, они должны в той или иной степени «понимать» структуру текстов живых, реальных, написанных на этом языке. Так, технические специалисты «Яндекса» активно сотрудничали с разработчиками НКРЯ и создали для них специальный сайт.

Важен НК для тех, кто так или иначе имеет дело с преподаванием современного русского языка, причем не только — и, может быть, даже не столько — в качестве родного, сколько в качестве иностранного.

В качестве отступления автор отмечает, что первые электронные корпуса русского языка, не в России, а в Европе (Уппсальский корпус РЯ, разработки финских лингвистов). Это не удивительно, если учесть какое подспорье в изучении русского языка иностранцами представляет собой НКРЯ.

Еще одна группа людей, для которых, по словам Плунгян, Корпус может представлять бесспорный интерес, — люди в своей повседневной деятельности связанные со словом, пишущие (редакторы газет, журналов).

В заключении, автор делится своими оценками тех результатов, которые Корпус дает для изучения русского языка и понимания закономерностей его развития.

А именно — это наблюдение за динамикой развития языка. Поскольку тексты, входящие в корпус, датированы, то нетрудно проследить за хронологией постепенных языковых изменений («микролингвистика»).

Если говорить о современном состоянии РЯ, Плунгян приходит к следующим выводам. С точки зрения истории русского языка, нынешний период — период языкового сдвига, возможно даже слома. Весьма велика вероятность больших изменений в его структуре в уже в ближайшем будущем.

Об этом косвенно свидетельствует то, что предыдущие столетия в целом можно охарактеризовать как относительно стабильные. Последний «неспокойный» период для русского языка — это XVII- XVIII в. Нынешнюю историческую эпоху часто сравнивают именно с этим временем.

Лексический состав русского языка сейчас меняется стремительно как никогда: иноязычные заимствования, сленг, внутренние изменения значений слов (вспомним, что теперь на самом деле значат такие слова, как напрягать или грузить). Меняется и произношение: значительно ускорился темп речи, проглатываются интервокальные согласные («хоит» вместо ходит, «бу- иш» вместо будешь — и даже «поинл» с особым «гнусавым» призвуком вместо понял). Почти не слышны безударные гласные на конце слова.

Грамматика пока держится. Плугнян считает, что наиболее уязвимо в русском языке склонение. Тексты Корпуса показывают заметный рост — особенно в устной речи — именительного падежа во всех позициях.

 

Задание № 2

 

Тема «Особенности психологизма в творчестве А.А.Лиханова на примере произведений «Девочка, которой все равно», «Мальчик, которому не больно», «Обман»»

Начиная работу над диссертацией, мы обратимся к поисковой системе Яндекс, чтобы выяснить, как, в каких аспектах и на каком материале проблема психологизма уже изучена другими исследователями, чьи работы размещены по следующим электронным адресам:

I. http://enc-dic.com/enc_lermontov/Psihologizm-146.html









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2020 zdamsam.ru Размещенные материалы защищены законодательством РФ.