Система «Лексикограф», база данных «Русский глагол»

 

Введение. Система «Лексикограф», база данных «Русский глагол»

Современные представления о семантике глагола  и База данных

Параметры лексического значения и парадигма многозначности глагольного слова 

Формат словарной статьи в БАЗЕ ДАННЫХ

Строение и содержание словарной статьи

 

Vved

Введение

Система «Лексикограф» – это семантический словарь, представленный в виде базы данных.

Современная лингвистическая семантика исходит из того, что лексика (как и другие уровни – грамматика, фонетика языка) устроена как система. В основе лексической системы языка лежат повторяющиеся смысловые компоненты (такие как ‘знать’, ‘видеть’, ‘двигаться’, ‘начаться’, ‘причина’, ‘предмет’) и параметры лексического значения – такие как таксономическая категория, тематический класс, Диатеза (связанная с участниками обозначаемой ситуации и способами их синтаксического выражения), таксономический класс участника.

Ни одно слово в языке не равно другому – ни по смыслу, ни по сочетаемости или каким-либо другим признакам. Тем не менее можно найти большие группы слов, которые обнаруживают значительное сходство. Это сходство определяется смысловыми компонентами и параметрами, которые повторяются – одни в десятках, другие в сотнях и тысячах слов. Т.е. параметры и компоненты задают классы слов, сходных в своем языковом поведении.

Языковое поведение слова – возможные сочетания с другими словами, наличие тех или иных грамматических форм и значение этих форм, ударность /безударность во фразе – в существенной степени предопределено его значением. Скажем, у несов. вида глагола тереть есть актуально-длительное значение, а у терять – нет; грамматическая форма повелительного наклонения трите! от тереть имеет нормальное значение побуждения к действию, а теряйте! от терять – нет. И это объясняется различием в Т-категории: тереть  действие, а потерял – это то, что с человеком случилось, т.е. происшествие.

Осознав зависимость языкового поведения слова от значения, лингвист сталкивается, однако, с тем, что у слова, как правило, бывает не одно значение, а несколько: многозначность в природе языка. Причем именно параметры и повторяющиеся компоненты являются теми аспектами значения, которые в наибольшей степени подвержены изменению. Поэтому разные значения одного и того же слова часто различаются одним параметром (или компонентом). Так, застилать стол скатертью – действие, а слезы застилают глаза – состояние; меняется категория; глагол требовать, который относится к речевым, в контексте Машина требует ремонта переходит в класс модальных, т.е. меняет тематический класс.

Эта двоякая роль параметров закономерна. Дело в том, что многозначность (имеется в виду регулярная многозначность по Ю.Д.Апресяну, т.е. полисемия) представляет собой (или может быть представлена как) сдвиг [см. 3] значения; и сдвиги значения тоже происходят системно: слова с одинаковым значением тех или иных параметров подвержены одинаковым сдвигам. Поэтому параметры различают не только разные слова, но и разные значения одного слова. А значения слова, в таком случае, связаны одно с другим.

Традиционные словари указывают для слова список отдельных значений. Современная семантика тоже работает, в основном, с отдельными значениями, пренебрегая семантическим единством слова. Возникает задача воссоздать это единство. Исходя из этого, система «Лексикограф» ставит перед собой две связанные между собой задачи:

– представить каждое данное значение слова так, чтобы получили объяснение особенности языкового поведения слова в данном его значении;

– показать, как значения слова связаны друг с другом, т.е. построить иерархию значений слова или даже парадигму значений, общую у определенного класса слов.

Отметим еще третью задачу. «Лексикограф» – не просто словарь, а база данных. Это соответствует исходной установке на формализацию представления значения. Параметры и смысловые компоненты – это основные инструменты формализации.

Система «Лексикограф» имеет экспериментальную направленность. Словник ни в коей мере не претендует на полноту. Система предлагает форматы  представления основных типов значений слов, и пользователь может, имея базу в своем распоряжении, пополнять ее новыми словами, опираясь на имеющиеся форматы как образцы. Мы предлагаем не только данные, но и инструменты, предназначенные для использования на новом материале.

Готовая версия системы посвящена русскому глаголу.

 

Sovremen

Современные представления о семантике глагола и База данных "Лексикограф"

В современной семантике относительно общепринятыми являются следующие представления.

Значение семантически неэлементарного слова не просто членится на компоненты, как считалось на предыдущем этапе развития семантики, но эти компоненты образуют определенную структуру.

У структуры есть разные аспекты: собственно семантический (семантический тип значения и его соотношение с внеязыковой сущностью), синтаксический (валентности, актанты и способы их синтаксического выражения) и коммуникативный.

С семантической точки зрения значение глагола отображает структуру ситуации (события) и соответствует одному из нескольких акциональных классов (таксономических категорий): действие, процесс, состояние, происшествие. У каждого акционального класса свой набор компонентов, своя структура толкования, свой набор участников (семантических актантов), Т-категория.

Диатеза – это характеристика глагольной лексемы, которая имеет и семантический, и синтаксический, и коммуникативный аспекты.

Диатезой принято называть соотношение семантических и синтаксических актантов. Два значения глагола могут обозначать одну и ту же ситуацию с одними и теми же участниками и отличаться только диатезой – способом синтаксического представления участников, ср:  очистить грязь с ботинок  очистить ботинки от грязи. С коммуникативной точки зрения диатеза может рассматриваться как механизм продвижения периферийных участников ситуации в более престижные синтаксические (а значит, и коммуникативные) позиции в предложении.

С коммуникативной точки зрения в толковании выделяются пресуппозиция (иначе – презумпция), ассерция и импликативная зона, см. Толкование.

Пресуппозиция – это часть значения, которая не подвергается отрицанию, т.е. компонент значения, который остается неизменным как в утвердительном, так и в отрицательном предложении с данным предикатом:

Он вылил воду из стакана → ‘в стакане была вода’

Он не вылил воду из стакана → ‘в стакане была вода’

Ассерция – это основная часть значения, которая подвергается отрицанию:

Х вылил воду из стакана = ‘Х воздействовал на воду определенным способом и она переместилась’

(ср. отрицание: ‘неверно, что Х воздействовал на воду и она переместилась’)

К импликативной зоне относятся следствия (импликации) и импликатуры.

Следствие (импликация) – это смысловой компонент, который следует из утверждения (из отрицания следует противоположный смысл):

Он вылил воду из стакана → ‘в стакане нет воды’

Он не вылил воду из стакана → ‘в стакане есть вода’

Импликатура – это необязательное следствие, т.е. выводимый смысл, который может быть важен для понимания связей данной лексемы с другими или ее положения в семантической системе. Так, глагол наклеить игрушек является глаголом создания (субъект в результате деятельности создает некоторое количество объектов). Создание физического объекта – это разновидность физического действия. Данный глагол не относится к глаголам обладания. Тем не менее в реальной ситуации создания субъект (или другое лицо) становится обладателем созданного объекта и может использовать его в своих интересах. И это обстоятельство может находить синтаксическое выражение в таких, например, конструкциях: Он наклеил игрушек детям. Поэтому вполне уместно записать соответствующий семантический компонент в статусе импликатуры:

импл.: ‘заинтересованное лицо может использовать R [созданный объект]’.

 

Таким образом, общая структура толкования для глагола действия будет выглядеть так:

Он вылил воду из стакана

Презумптивная часть:  В момент t-1 в стакане была вода

Ассертивная часть:      В момент t-2 агенс действовал

                                       воздействовал на стакан и тем самым на воду

                                       этим каузировал процесс перемещения воды

                                       в результате вода переместилась из стакана 

Импликативная часть: В момент t-3 в стакане нет воды = стакан пустой

 

Parametry

Параметры лексического значения и парадигма многозначности глагольного слова

Основными параметрами (характеристиками) лексического значения глагола являются:

-        таксономическая категория глагола (в базе – Т-категория);

-        диатеза;

-        тематический класс глагола;

-        таксономические категории актантов (Участники).

Эти параметры задают не только описание отдельной лексемы (отдельного значения глагольного слова), но также определяют основные механизмы образования производных значений и парадигму многозначности глагола.

Изменение значения любого параметра может приводить к семантическому сдвигу (образованию производного значения глагола).

 

Изменение таксономической категории:

разбить 1.1  –  разбили копилку и достали деньги  –  действие,

разбить 1.2  –  нечаянно разбил свою любимую чашку  –  происшествие;

украшать 1   –  дети украшают елку  –   действие,

украшать 2   –  игрушки украшают елку  –   состояние.

 

Изменение диатезы:

выбрать II.1.1 старостой Кузьму – выбрать II.1.2 старосту;

набить 1.1 сена в матрас  набить 1.2 матрас сеном

 

Изменение тематического класса глагола:

мести 1.1. опилки – удаление объекта с поверхности

мести 1.2. улицу – обработка объекта

 

Изменение таксономического класса актанта.

Изменение значения данного параметра обычно затрагивает и другие параметры. Например, изменение физического объекта на абстрактный приводит не просто к изменению значения – обычно меняется еще и таксономическая категория глагола, и тематический класс глагола:

перерезать 1 (провод ножом)

Т-категория: действие обычное

тематический класс: деформация

перерезать 2 (путь к отступлению)

Т-категория: действие с акцентом на результате,  

тематический класс: преграда

разорвать 1.1 (лист бумаги)

Т-категория: действие обычное,

тематический класс: деформация (физического объекта)

разорвать 2 (отношения)

Т-категория: действие моментальное,

тематический класс: ликвидация (абстрактного объекта)

Для системы «Лексикограф» принципиально важной задачей является выявление закономерностей формирования парадигмы многозначности глагола. Тип исходного значения и содержание отдельных параметров исходного значения предсказывают определенные типы семантических сдвигов, т.е. производных значений, хотя у конкретного глагола может и не быть всех возможных (ожидаемых) значений.

Например, многие глаголы категории «действие обычное» имеют производное значение категории «происшествие каузативное», если к получению того же результата может приводить не только деятельность Агенса, но и неконтролируемая ситуация:

действие

 

происшествие

Офицер разбудил денщика  – Шум разбудил детей
Дама закрыла лицо веером  – Тучи закрыли солнце.

Другой пример. Глаголы тематического класса «деформация» закономерно имеют производные значения класса «ущерб» и класса «уничтожение» (иногда – и то и другое), т.к. деформация – это нарушение целостности, а оно может приводить и к ущербу, и к уничтожению объекта, ср.

           Сломал замок и вошел (деформация)

           Вертел в руках карандаш и нечаянно сломал его (ущерб)

           Сломали старый сарай и на его месте посадили дерево (уничтожение)

 

Format

Формат словарной статьи в БАЗЕ ДАННЫХ

Словарная статья содержит информацию об основных параметрах глагольной лексемы и схему толкования. Способ представления этой информации ориентирован на основную задачу Базы данных - продемонстрировать сходство глаголов одной ТК (глаголы одной ТК имеют одинаковую схему толкования).

Единообразное представление семантических структур и компонентов позволяет также наглядно продемонстрировать связи между значениями (лексемами) одного глагольного слова (см. Параметры лексического значения и парадигма многозначности глагольного слова).

ЗАГОРОДИТЬ 1.1

ЗАГОРОДИТЬ 1.2

Рабочие загородили подступы к зданию мешками с песком

Мешки загородили проход; Борона сразу загородила весь вход в нору. [Василь Быков. Знак беды]

ТК: действие: обычное; с локативным Объектом

ТК: происшествие: каузативное; с локативным Объектом

Тема: преграда

Тема: преграда

Участники:

Участники:

X (рабочие) = Сб = Агенс = лицо

Z (мешки) = Сб = Пациенс фон.Каузации = масса/физич.предмет

Y (проход) = Об = Место-Пациенс = проход

Y (проход) = Об = Место-Пациенс = проход

Z (мешки) = Сущ Твор = Средство-Пациенс = масса/физич.предмет

(W) = З/кдр = Заинтересованное лицо

(W) = З/кдр = Заинтересованное лицо

X = З/кдр = фон.Агенс/фон.Каузатор = ситуация/лицо 

К0 экспозиция|  до t<МН Z не находился в поперечнике Y-а *презумпция

K0 исх. состояние|  до t<МН Z не находился в поперечнике Y-а *презумпция

K1 Y функционировал: был свободен {=существовал}   11111

K1 Y функционировал: был свободен {=существовал}   

K4 деятельность| в t<МН X действовал с целью

K4 каузатор| в t<МН произошло нечто

K5 : воздействовал на Z

К5

K6 каузация| К4 вызвало К7   *ассерция

K6 каузация| К4 вызвало К8   *ассерция

K7 шел процесс с Z-ом: синхр.: Z перемещался в Y: кол-во Z-а в  поперечнике Y-а увеличивалось; тем самым шел процесс с Y-ом: имеет предел: поперечник Y-а  заполнялся

К7

K8.1 результат = итог

K8.1 эффект = новое состояние

K8.2 началось и в МН имеет место  состояние: Z находится в поперечнике Y-а в некотором количестве

K8.2 началось и в МН имеет место состояние: Z переместился и находится в поперечнике Y-а; является преградой для движения через Y / помехой для функционирования Y-а

K9   таком, что имеется преграда для прохождения через Y:  Y не функционирует: не свободен {=не существует}

K9  тем самым Y не функционирует: не свободен {не существует} 

K10  импликатура: заинтересованное лицо не может пользоваться Y-ом

K10  импликатура: заинтересованное лицо не может пользоваться Y-ом

 

Stroen

Строение и содержание словарной статьи

Словарная статья имеет разделы (поля):

ЛЕКСЕМА

ПРИМЕРЫ УПОТРЕБЛЕНИЯ

ЛЕГЕНДА

ТАКСОНОМИЧЕСКАЯ КАТЕГОРИЯ

ТЕМАТИЧЕСКИЙ КЛАСС

АСПЕКТУАЛЬНАЯ ХАРАКТЕРИСТИКА

ПРОТИВОПОЛОЖНЫЙ ВИД

КОММЕНТАРИЙ

УЧАСТНИКИ

ТОЛКОВАНИЕ