В.З. Демьянков

Основы теории интерпретации

и ее приложения в вычислительной лингвистике

УДК 801.541.2

Демьянков В.З. Основы теории интерпретации и ее приложения в вычислительной лингвистике. – М.: Изд-во Моск. ун-та, 1985. – 76 с.

Электронная версия монографии, вышедшей в 1985 г. малым тиражом.

Оглавление:

Аннотация.

ПРЕДИСЛОВИЕ ........................ 3

1. ВВЕДЕНИЕ:

ИНТЕРПРЕТАЦИЯ, ВЫЧИСЛИТЕЛЬНАЯ ЛИНГВИСТИКА И ЛИНГВИСТИЧЕСКОЕ ВЫЧИСЛЕНИЕ
........ 4

2. ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА (ОЕЯ).......... 10

2.1. Вводные замечания.................. 10

2.2. Из истории ОЕЯ....................13

2.3. Система, «понимающая» естественный язык.......17

2.4. Автоматический анализатор .............. 18

2.5. Стратегия анализа.................. 22

3. ЗНАНИЕ КАК ОСНОВА ИНТЕРПРЕТАЦИИ ............ 24

3.1. Вводные замечания.................. 24

3.2. Интерпретация неоднозначности ............ 25

3.3. Принципы интерпретирования............. 28

3.4. Концепция «гипотетической интерпретации»....... 31

3.5. Базы данных: синтаксис, семантика, прагматика и «интерпретирующий зигзаг»........... 33

3.6. Базы данных как модель информационного запаса: логика и принципы интерпретации....... 38

4. ИНТЕРПРЕТАЦИЯ НА ОСНОВЕ ЯЗЫКОВОГО ЗНАНИЯ:

МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ

И ПРИНЦИПЫ МОРФОЛОГИЧЕСКОГО АНАЛИЗА
................42

4.1. Вводные замечания.................. 42

4.2. Основные принципы морфологической интерпретации... 44

4.3. Формальный аппарат системы МИ ............45

4.4. О специальных функциях ................50

4.5. Иллюстрация МИ для русского языка..........51

4.6. О составлении рабочего списка морфов.........53

4.7. Три уровня морфемного анализа............ 57

5. ОБ ОПРЕДЕЛЕНИИ ПОНИМАНИЯ................. 62

5.1. Модули понимания...................62

5.2. Понимание как единый процесс .............65

6. ЗАКЛЮЧЕНИЕ.......................65

Литература........................ 70

./bars/image002.gif

-2-

Аннотация

Учебно-практическое пособие посвящено изложению принципов интерпретации и применению интерпретирующего подхода в вычислительной лингвистике. В основе предлагаемой лингвистической концепции понятие «интерпретация» рассматривается как выполнение действий, задаваемых читаемым текстом и протекающих параллельно процессу чтения. Вводится понятие «лингвистическое вычисление», устанавливаются направления обработки естественного языка и структура баз данных в языковом процессоре; формулируются принципы «гипотетической интерпретации», приводящей к расширению баз данных (знаний) в результате активного понимании текста. На примере морфологической интерпретации показывается, как строится формальный аппарат. Намечаются перспективы развития теории и ее приложений.

Работа предназначена для использования при подготовке спецкурсов по теоретическому и прикладному языкознанию и адресована студентам и аспирантам соответствующих специальностей, а также широкому кругу специалистов в области обработки языковых данных с помощью ЭВМ.

Библиогр. 78 назв. Ил. 6.

Рецензенты: доктор техн. наук проф. Р.Г. Котов,

доктор филол. наук проф. Б.Ю. Городецкий

./bars/image002.gif

-3-

ПРЕДИСЛОВИЕ

Настоящая работа посвящена проблемам общего и прикладного языкознания, решение которых может быть дано в рамках так называемого «интерпретирующего подхода», развивающегося под влиянием идей теоретического программирования. А именно, под интерпретацией понимается один из режимов «восприятия», при котором происходит обращение к базам данных попутно со сканированием («чтением») текущего воспринимаемого выражения и с выполнением тех действий, которые явно иди скрыто описываются читаемым текстом. Интерпретация противопоставлена «трансляции», т.е. такому режиму «прочтения», когда перед тем как выполнить действия, описываемые в читаемом тексте (скажем, в тексте программы на алгоритмическом языка), сначала полностью перекодируют этот текст на язык машинных команд и только после этого выполняют полученное предписание.

Оба режима – интерпретирование и трансляция, – как представляется, используются и человеком при построении и понимании текстов на естественном языке, но в различных сферах человеческой деятельности их использование эффективно в различной степени. Трансляция наиболее эффективна, когда читаемый текст дан полностью, т.е. не находится в процессе становления, корректировки, параллельной самому прочтению. Неэффективен же этот режим при моделировании человеческой речевой деятельности, в особенности тогда, когда в самом читаемом тексте вводятся понятия, обозначения, и в общем случае, знания, которые в дальнейшем оказываются важными для дальнейшего понимания этого же самого текста. В таком случае приходится предполагать, что понимание связано скорее с интерпретированием, чем с трансляцией.

В данной работе демонстрируются возможности «интерпретирующего» взгляда на понимание и продуцирование речи на естественном языке, а также показываются пути применения понятия и принципов интерпретации в вычислительной лингвистике.

./bars/image002.gif

-4-

ВВЕДЕНИЕ

ИНТЕРПРЕТАЦИЯ, ВЫЧИСЛИТЕЛЬНАЯ ЛИНГВИСТИКА

И ЛИНГВИСТИЧЕСКОЕ ВЫЧИСЛЕНИЕ

Исследование того, как человек интерпретирует и понимает языковые выражения, имеет как теоретический, так и прикладной интерес. Работы в области автоматического анализа текста и автоматического решения задач, сформулированных на естественном языке (или на языке, близком к естественному), показали актуальность построения интерпретирующей теории языка.

Понятие «интерпретация» лежало с самого начала в основе общелингвистических теорий, а также в основе логических исследований (вспомним классическую работу Аристотеля «Об истолковании»). В последние годы в общем и прикладном языкознании выработался такой взгляд на язык, который можно было бы назвать «интерпретационизмом» в широком смысле слова. Этот взгляд представлен как в разнообразных областях чисто лингвистического анализа (в теориях формальных грамматик, в описании дискурсивной деятельности, в «теории речевых актов», в социолингвистике, в истории языка), так и в исследованиях по «искусственному интеллекту». Интерпретационизм – весьма разнородное течение, к определению его основных положений можно прийти только в результате сопоставления различных современных концепций интерпретации и вычленения общего для них теоретического ядра. Это тот взгляд, согласно которому в основе владения языком и использования его лежит один и тот же интерпретирующий механизм, обслуживающий различные сферы языковой деятельности и при этом использующий различные виды знаний. Среди этих сфер – говорение, понимание, редактирование, комментирование, перифразирование, рассуждение, аргументация, обучение, перевод и др. Сама же интерпретация, через которую и определяются указанию сферы, представляет собой получение на основе одного исходного объекта (называемого интерпретируемым объектом) другого, отличного объекта, предлагаемого интерпретатором в качестве равносильного исходному на конкретном фоне ситуации, набора презумпций, знаний.

В интерпретационизме владение языком и знания рассматриваются как различные понятия. Так, хотя специальные виды знаний (химические, физические, математические и т.п.) вовлечены в понимание речи, они, тем не менее, к ведению лингвистической

-5-

теории не относятся. Например, мы понимаем предложение Камень просвистел у Петра над головой в том смысле, что можем дать ему следующую интерпретацию: Камень пролетел над головой Петра; камень был тяжелым в той степени, какая необходима для того, чтобы предмет издавал соответствующий свистящий звук, и Петр услышал этот звук, оценив его как свист. Однако это толкование вовсе не обязывает нас среди словарных толкований глагола свистеть помещать (как одно из потенциальных значений) такое: «свистеть – о предметах средней тяжести: издавать характерный звук при полете».

Если остаться на той позиции, что знания о свойствах тяжелых предметов не обязаны входить в компетенцию языка, то отпадет необходимость в бесконечно дробных толкованиях для языковых единиц (обрекающих составителя словаря на бесконечную работу: ведь с расширением кругозора у добросовестного лексикографа будет постоянно возникать необходимость в ревизии словаря). Для лингвиста-интерпретациониста проблема снимается с этой стороны (так как лингвист отвлекается от энциклопедической информации), не усложняется с другой: строя описание языка, он попутно (но отдельно от свою прямых лингвистических обязанностей) должен составлять компендий «схем знания» (а не компендий собственно знаний), совместимых с языковым описанием таким образом, чтобы на основе такого компендия – «информационного запаса» – можно было моделировать интерпретации высказываний.

В этом отношении интерпретационизм противопоставлен тому подходу, в котором описание языка включает в себя и описание «обыденного сознания», воплощенного в «наивной картине мира»: иитерпретационизм сознательно отвергает противопоставление наивной и ненаивной (например, научной) картин мира в рамках языка, перенося это различие к характеристикам единиц «информационного запаса», лежащего за пределами собственно лингвистического описания. Знания не входят в структуру языка непосредственно, а «привлекаются» к интерпретации, и только опосредованно определяют результат интерпретации языковых выражений.

С другой стороны, противопоставлен интерпретационизм и тем концепциям, в которых предполагается, что говорение и понимание сводятся соответственно к «перекодировке» значений

-6-

в поверхностные структуры и обратно. Действительно, построение реальных высказываний можно представить как «обогащение» замысла говорящего за счет его информационного запаса (постоянно изменяющегося даже по ходу такого обогащения); а переход от самого выражения к тому или иному виду его интерпретации – это не столько «расшифровка» (трансляция) замысла или реконструкция «исходного значения», сколько один из видов интерпретации высказывания, опирающейся на знания интерпретатора. Действительно, трудно представить себе, вне рамок интерпретационизма, как может быть объяснено то обстоятельство, что прочитываемый (и попутно интерпретируемый) текст может сам поставлять данные для своего дальнейшего понимания. Интересно, что последнее наблюдение, теперь уже кажущееся по меньшей мере очевидным, не сразу было взято на вооружение разработчиками систем искусственного интеллекта: на первых этапах прочитывание текста и извлечение из него информации представлялись как установление того, что соответствующие «атомарные пропозиции» уже хранятся в базе знаний (базе данных) системы (обзор этих работ см. [Демьянков 1980а]). Антиинтерпретационизм бессилен против таких текстовых приемов, позволяющих нужным для автора образом направлять понимание текста, как дефиниции и фразы типа в дальнейшем под А будет пониматься В, обозначим А через В, см. предыдущее предложение и т.п.

Итак, построить процессор естественного языка – значит, воплотить принципы интерпретации языковых выражений, заложенные в человеческой деятельности.

Построение процессора естественного языка – одна из наиболее актуальных проблем современной вычислительной лингвистики. Эта проблема порождена информационным взрывом, переживаемым человечеством в настоящее время: зачастую легче бывает выяснить какой-либо факт (доказать теорему, решить уравнение и т.п.) или сконструировать какое-либо приспособление непосредственно самому, чем извлечь нужный рецепт из существующей литературы. Не помогает в таком поиске информации даже то, что довольно многие издания одновременно с публикацией заносятся на машинные носители: даже тогда извлечь непосредственно нужные сведения фундаментально трудно именно потому, что текст на естественном языке с трудом пока что поддается информационной обработке. В частности, на сегодняшний день не существует

-7-

пока еще даже такой системы, которая для произвольного текста на данном (скажем, русском) языке давала бы полный его морфологический анализ (для произвольно большого, а не ограниченного словаря) или полный его словарь. А ведь задача морфологического распознавания, или «лемматизации», является предпосылкой для решения многих других информационных задач.

К информационным задачам вычислительной лингвистики относятся:

1. Автоматическое установление по конкретному тексту тех правил и единиц данного языка, которые участвовали в построении этого текста (при этом соответствующая система использует свою базу данных о грамматике и единицах языка). В расширенной формулировке речь здесь идет о том, чтобы установить по конкретному образцу речи (тексту) все те законы логического вывода (в широком смысле) и все те аксиомы («элементарные пропозиции»), которые придают речи осмысленность и делают ее правильным текстом на данном языке.

2. Установление информационных связей, которые имеются между двумя образцами текстов (например, между запросом к информационной системе и информацией, хранимой в системе, или информацией, заданной в виде текста). Так, в запросе может содержаться задание выяснить, описывается ли в тексте искомое приспособление для выполнения конкретных работ.

В обоих случаях требуется установить связи между различными образцами речи. Решение этой задачи связано с представлением и использованием знаний при оперировании речью. За последние годы достигнут прогресс в этой области, в рамках сравнительно молодой дисциплины, называемой «искусственным интеллектом». Каково же место вычислительной лингвистики в «искусственном интеллекте»?

Р.Шенк указывает, что вычислительная лингвистика – это «проблема наделения машин способностью общаться с человеком на естественном языке. Наш метод состоит в том, чтобы попытаться понять, как люди общаются друг с другом, и исследовать эти процессы» [Р.Шенк 1975, с.10]. Н.Черконе пишет: «Вычислительная лингвистика должна построить общую теорию понимания естественного языка в качестве основы для таких программ ЭВМ, которые понимают естественный язык» [N.Cercone ed. 1983, с.IX].

-8-

{Рис. 1 в данной версии мы опускаем.}

По мнению Томпсона (см. [Sparck_Jones, Wilks ed. 1983, с.23]), теоретическая вычислительная лингвистика представляет собой попытку охарактеризовать природу языка с точки зрения «лингвистических вычислений» – процедур над речью, аналогичных тем, которые выполняются по ходу собственно вычислительных работ. В американской вычислительной лингвистике на сегодняшний день было предложено несколько концепций теоретической вычислительной лингвистики: «функциональная грамматика» М.Кея [M.Kay 1979], «когнитивная грамматика» [Lakoff, Thompson 1975], [Lakoff, Thompson 1975a]. «лексическая функциональная грамматика» [J.Bresnan ed. 1982] и др. (о них подробнее см. [Демьянков 1979]; [Демьянков 1982б]).

От теоретической вычислительной лингвистики следует отличать «ЭВМ на службе лингвистики». Задача этой дисциплины – двоякая: 1) построение по текстам словарей, указателей различного рода, статистическая обработка текста, вычислительная лексикография и т.п.; 2) оснащение вычислительной техникой и программное обеспечение различных лабораторий распознавания устной речи, проверка с помощью ЭВМ грамматик естественного языка в рамках той или иной формальной модели. Работа последнего вида проделана для трансформационой порождающей

-9-

грамматики (см. [S.R.Petrick 1965]; [Демьянков 1980а], для грамматики Монтегю [Friedman, Warren 1978], для «порождающей грамматики без трансформационного компонента» [G.Gazdar 1981]. Большая часть задач направления «ЭВМ на службе лингвистики» входит в фундаментальный комплекс проблем – «Машинный фонд» конкретного языка.

Предметом «прикладной вычислительной лингвистики» является разработка и применение систем обработки естественного языка в качестве части более крупных систем, например, промышленных информационно-поисковых систем. Задача таких систем – поиск информации в базе данных и автоматическое пополнение базы данных. Другое, смежное направление – построение систем, решающих задачи, сформулированные на естественном языке.

Так, в одной из систем [Демьянков 1980а]; [Демьянков 1978] предлагалось «лингвистическое обеспечение» для автоматической экономической информационной системы, где задача ставилась так: по наименованию экономического показателя на естественном языке автоматически установить алгоритм вычисления этого показателя и выполнить предписания этого алгоритма. Имеем при этом два случая. Случай первый – когда дается наименование элементарного показателя (числовое значение которого хранится в базе данных). Тогда задача состоит в том, чтобы наименование на естественном языке (типа Численность рабочих в цехе N A на участке B на такое-то число) перевести в «канонический» вид (такой перевод необходим, поскольку на формулировку показателей не накладывается практически никаких ограничений), затем определить его поисковый порядковый номер (с помощью встроенной порождающей грамматики) и выдать требуемые данные. Случай второй, когда дается в качестве запроса наименование не хранимого, а вычисляемого показателя (например, Процент выполнения плана по C, Отношение K к P и т.п.), множество таких показателей практически бесконечно, и иметь ответ на них заранее нереально. Тогда совершенно автоматически устанавливается арифметическая формула вычисления показателя после подстановки в нее соответствующих хранимых данных (также автоматически осуществляемой), вычисляется значение этой формулы. Итак, весь такой комплекс задач и множество других относятся к ведению «прикладной вычислительной лингвистики».

-10-

Что же такое «теория лингвистических вычислений»? Это дисциплина, занимающаяся коммуникативными процессами в наиболее абстрактном виде, В ее функции входит установление общего вида и общих принципов построения процессоров естественного языка, доказательство теорем относительно равносильности или неравносильности двух различных формальных грамматик одного и того же языка и т.п. Видимо, именно к теории лингвистических вычислений относится круг задач, традиционно относимый к ведению математической лингвистики, а также к моделированию общения с ЭВМ на естественном языке. Математическая лингвистика непосредственно пересекается с теоретическим программированием и включает в себя теорию формальных языков, в алгебраическом варианте и в рамках теории автоматов. Эта теория смыкается с теми разработками, которые направлены на построение языков программирования с заданными свойствами, а также на разработку компиляторов к ним. Другая же часть теории лингвистических вычислений связана с наиболее глубинными процессами обработки информации человеком и их моделированием на ЭВМ.

./bars/image002.gif

2. ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА (ОЕЯ)

2.1. Вводные замечания

Область построения систем, обрабатывающих (или «перерабатыващих») естественный язык, точнее было бы назвать переработкой речи (текстов) на естественных языках. Эта область, в том виде, какой она приобрела в последние годы, занята построением и проверкой концепций (и технических их воплощений) общения с ЭВМ на естественном языке. В частности, сюда относится задача построения таких программ для ЭВМ, которые позволяют организовать диалог с ЭВМ. В отличие от задачи «распознавания устной речи», где решается проблема акустического распознавания сигналов, ОЕЯ занимается операциями более абстрактного, более символического порядка: операциями над значениями и логическим выводом, необходимыми для распознавания речи [Lehnert, Ringle ed. 1982, с.XIII].

Объектом ОЕЯ обычно считается текст. В системе же, претендующей на перспективность, ставится задача не просто распознать этот текст, а выяснить те обычно скрытые движущие силы, которые его сформировали. Напомним, что текст в его становлении

-11-

называют дискурсом.

Система обработки текста, по [Friedman, Warren 1978, с.85], решает две проблемы: 1) выясняет истоки информации, из которой «композиционным» путем может быть выведена конкретная семантическая информация для каждого отдельного предложения текста (т.е. выявляет семантику предложения исходя из структуры целого текста), и 2) устанавливает роль и функции этой информации высокого порядка в рамках целого дискурса.

Вообще говоря, система ОЕЯ должна: а) планировать высказывания, необходимые для достижения конкретных коммуникативных целей, что находится в зависимости от знаний, мнений и намерений пользователей такой системы, и б) распознавать в высказываниях пользователя те планы, которые могут быть сообщены в результате нескольких высказываний или которые, по замыслу пользователя, могут быть логически выведены из презумпций общающихся сторон (человека и ЭВМ), см. [Lehnert, Ringle ed. 1982, с.263-264]. Один из возможных путей достижения этого – следующий цикл:

1. Рассмотреть текущее высказывание (предложение).

2. Основываясь на наклонении этого предложения (повествовательное, вопросительное, повелительное), приписать эффект высказывания намерению пользователя.

3. Используя алгоритмы распознавания, а также базу общих презумпций, вывести, если это возможно, каким образом наблюдаемые действия укладываются в план достижения цели, которую, как ожидается, преследует пользователь. Если этот план не может быть однозначно выявлен, выработать цель системы, направленную на вскрытие цели пользователя.

4. Выработать задачи системы для тех целей, которые пользователь намеревался активизировать в системе.

5. Используя частные (т.е. не общие) презумпции, определить препятствия, которые могут помешать осуществлению планов пользователя, а также пункты, в которых пользователю потребуется помощь.

6. Принять отрицания для некоторых из препятствий в качестве целей системы.

7. Пользуясь частными презумпциями, построить план достижений целей системы, особенно целей для преодоления препятствий для пользователя. В зависимости от этих целей

-12-

план может включать в себя такие коммуникативные действия, как вопросы, проясняющие намерения пользователя.

8. Выполнить результирующую последовательность действий.

9. Перейти к пункту 1.

Разумеется, этот цикл не обладает статусом идеала: это скорее пример того, в каких терминах могут формулироваться общие планы построения системы ОЕЯ. Более узко ставится проблема в том направлении, которое связано с именем Р.Шенка [Р.Шенк 1975, с.7]: 1) отображение предложений в их смысловое представление; 2) хранение в памяти и осуществление умозаключений относительно полученного смысла; 3) перевод смыслового представления на естественный язык. Основные режимы работы в этом направлении – перифразирование и умозаключение.

Необходимо учитывать то, что ОЕЯ с помощью ЭВМ («искусственная ОЕЯ») отлична от ОЕЯ человеком (т.е. «естественной ОЕЯ») в следующих отношениях: а) последняя не может ограничиться анализом и синтезом вне контекста ситуации во всех ее деталях; б) последняя не только преодолевает неоднозначности естественного языка, не и эксплуатирует их в своих щелях [Sparck_Jones, Wilks ed. 1983, с.132]. Языковой процессор, разрабатываемый коллективом Р.Шенка [Р.Шенк 1975, с.24] (и сл.), функционируя в интерактивном режиме, должен находить наиболее вероятную для данного предложения интерпретацию, а не просто выявлять все возможные способы истолкования предложений: человек обычно не замечает тех неоднозначностей в тексте, которые чересчур скрупулезная система ОЕЯ способна, в принципе, выявить. Анализ происходит пословно, от начала к концу предложения, в результате однократного, а не многократного «прохода» по предложению: обычно же число проходов достигает пяти. Кроме того, система ОЕЯ обладает знаниями о мире в той мере, какая необходима для решения проблем анализа.

Система ОЕЯ, разумеется, – не самоцель. Ее задачи упорядочены и определяют «уровни ОЕЯ» (см. [N.Cercone ed. 1983, с.201]). Так, неязыковым целям подчинены процедуры («скрипты», в смысле работы [Schank, Abelson 1977]), направляющие любой вид ОЕЯ; этим процедурам, в свою очередь, подчинен уровень речевых актов (при интерпретации или порождении отдельных высказываний). Самый низкий уровень составляют процедуры собственно языковой обработки (языковой анализ).

-13-

Общими для предложенных систем ОЕЯ являются следующие компоненты [Schröder, Steger ed. 1981, с.182]: ЕЯ --> ФР --> ИНТ --> СОД --> БД. А именно, естественно-языковой вход (ЕЯ) переводится в форму репрезентации (ФР) знаний; интерпретатор (ИНТ) устанавливает связь между репрезентацией для положений дел в (ФР) и, посредством языка системы обработки данных (СОД), банком данных (БД). В рамках этих систем операции, связанные с обработкой текста («лингвистические вычисления» обладают различными свойствами; анализ проведенных на сегодняшний день разработок показывает скорее не то, в чем они состоят, а то, чем эти операции не являются: они работают не исключительно аддитивно, не исключительно одна за другой (последовательно), не исключительно на микроуровне и не статистическим образом.

2.2. Из истории ОЕЯ

Предыстория ОЕЯ определена многими факторами, из которых [Lehnert, Ringle ed. 1982, с.6] можно выделить в особенности два: 1) попытки моделирования нейронов в виде логического устройства, связанные с именами МакКаллоу и Питтса; 2) зарождение «информационной» парадигмы – взгляда на числа и на текст как на то, что представляет общее понятие «информации» (Шеннон), обладающее количественными характеристиками, со всеми вытекающими последствиями для математической теории информации. Понятие «информативность» принадлежит указанной парадигме.

Собственно же историю ОЕЯ иногда представляют как состоящую из трех этапов:

1. Начало 1950-х – начало 1960-х годов. Идея «информации» привела к концепции «машинного перевода» как установления той информации, которая скрыта за предложением на естественном языке, и выражения ее на другом – целевом языке. Язык информационного содержания был назван «языком-посредником». На этом этапе была введена и идея эвристического поиска [Newell, Simon 1956], а также языка программирования для решения задач ОЕЯ (наиболее популярным языком, начиная с этого времени, был ЛИСП, введенный и описанный впервые в работе [J.McCarthy 1960].

2. «Эпоха обработки семантической информации» (примерно 1962-1973 гг.). Ее основные идеи: а) необходимо использовать ограниченные содержательные области для моделирования ОЕЯ; б) следует построить как можно больше систем для обработки

-14-

ограниченных подъязыков, присвоив этим системам статус «экспертов» в таких областях, а затем объединить все эти системы в одну, в рамках «крупного эксперта», определяющего, какой из подчиненных должен начать работать на конкретном этапе обработки, при решении конкретной задачи – концепция «крупного переключения»; в) использование «ключевых слов», управляющих выбором конкретных действий по ходу обработки текста; г) перевод естественного языка на формальные языки (некоторые из формальных языков при этом обладают собственными исчислениями, типа исчисления предикатов формальной логики; имеются языки поиска в базе данных. Эту эпоху иногда называют эрой «инженерного подхода»: основной упор делался на решение конкретных (как правило, прикладных) задач, без попытки моделировать психологическую реальность.

Среди систем этого поколения, воплощающих идею ключевых слов, назовем следующие: ЭЛИЗА и ДОКТОР [И.Вейценбаум 1970], а также ПАРРИ (моделировавшую поведение параноика) [K.M.Colby 1975] и др.). Идею перевода на формальный язык особенно ясно иллюстрирует система СТУДЕНТ [M.Minsky ed. 1969], где алгебраические проблемы, сформулированные на естественном языке, переводились сначала на язык линейных уравнений, а затем решались.

Начало 1970-х годов ознаменовалось интересом к обработке семантической информации; появились даже первые ростки интереса ж «когнитивной науке» (названной в те же годы «когитологией»). Эти идеи воплощены были в таких системах ОЕЯ, как SHRDLU [Т.Виноград 1976], LUNAR [Woods, Kaplan, Nash-Webber 1972], NLPQ [G.E.Heidorn 1974] (эта последняя использовала модель ситуации, взятой в ее полном охвате, для того, чтобы ответить на запросы пользователя даже тогда, когда информации для ответа недостаточно), МАРГИ (группа Р.Шенка и др.). В рамках теории общения, так или иначе повлиявшей на работы данного времени, на первый план выдвинулись исследования в области речевых актов, «разговорных подраэумеваний» и «анализа дискурса» [Brown, Yule 1983].

В результате исследований этой «эпохи» выяснилось: а) даже в очень простых ситуациях (использование языка гораздо более разнопланово, чем можно было бы ожидать; б) специализация той или иной системы ОЕЯ и перспектива расширения этой системы находятся в серьезном конфликте между собой; в) репрезентации для языковых выражений, используемые в рамках таких

-15-

систем (скажем, формальные языки), весьма неточны и неадекватны выразительным способностям естественного языка; г) приходится поступиться очень многими типами выражений, реально используемых на естественном языке (в частности, выражениями для физических событий и действий, описаниями сцен, карт, путей, предписаниями; реальными разговорами, спорами, дебатами, обсуждениями, эмоционально окрашенными высказываниями и высказываниями об эмоциональных состояниях; метаописаниями теорий; поэтическим языком, юмором, иронией, ложью и т.п. – т.е. всем, что требует гораздо более богатого метаязыка, чем тот, который могут на сегодняшний день предоставить в наше распоряжение существующие нотации логики).

3. Современная эпоха (1970-1965 гг.). В это время в центре внимания находятся следующие проблемы: а) соотнесенность речевых актов, фокусов внимания и общих (для ЭВМ и человека) презумпций; б) использование «новаторского» потенциала языка (в частности, интерпретация метафор); в) постройте прикладных систем, понимающих естественный язык (а не просто его обрабатывающих), г) обработка высказываний о пространственных событиях; д) введение факторов «здравого смысла» в состав логического вывода систем ОЕЯ, в частности, учет степени правдоподобности при интерпретировании высказываний (по [D.L.Waltz 1982]).

В его время сформировались проблемы, которые по-разному решаются в современных концепциях ОЕЯ. Одна из многих проблем [Lehnert, Ringle ed. 1982, с.37] (и след.): следует ли моделировать ОЕЯ как «последовательный» анализ (рис.2) или как «параллельный» анализ (рис.3)?


Вход à Синтаксический анализатор àСемантический анализатор à Значение

Рис.2. Последовательный анализ


Синтаксические знания

Анализатор

Семантические знания

Рис.3. Параллельный анализ

-16-

Так, в системе автоматического реферирования FRUMP [G.F.DeJong 1979] «скрипт» (концептуальная схема), вызываемый концептами, входящими в ведущее предложение реферируемой статьи, осуществляет контроль над анализом остальной части текста. Этот скрипт выискивает все те концепты, которые ому необходимы, а остальные попросту игнорирует. В системе «интегрированного анализа частей» IPP [Lehnert, Ringle ed. 1982, с.455-493] пакеты организации памяти (MOP),выявляющие соотносительную информативную ценность тех или иных понятий, называемых в анализируемом предложении, интегрируют в единую схему содержание всего предложения. В этих системах, в принципе, можно было бы воплотить оба вида анализа: и последовательный, и параллельный. Однако параллельный анализ психологически более правдоподобен.

Другой вид проблем: отношение между синтаксисом и семантикой в рамках анализа предложения. Имеем здесь, как минимум, три возможности [M.King ed. 1983, с.199]: 1) при переходе от предложения к представлению его значения сначала полностью восстанавливается синтаксическая структура предложения; на втором же этапе эта структура переводится в семантическое представление (например, см. [Woods, Kaplan, Nash-Webber 1972]; [Т.Виноград 1976]; 2) между синтаксисом и семантикой нет никаких барьеров, семантическая структура получается прямо, исходя из текстового вида предложения [Y.Wilks 1975]; [Р.Шенк 1975]; [Jayez 1982] и др.; 3) построение частичных синтаксических репрезентаций перемежается установлением частичных же семантических репрезентаций (т.е. синтаксис и семантика различаются, не в анализа взаимодействуют не прямолинейным образом). Третье решение является компромиссным между первыми двумя; в особенности оно удовлетворяет противников последовательного анализа, которые считают, что при ОЕЯ необходимо допускать возможность той ситуации, когда различные типы информации и процедур вызываются более одного раза на различных этапах обработки входного выражения [Sparck_Jones, Wilks ed. 1983, с.167]; этот подход реализован, например, в системе Ю.Чарняка [M.King ed. 1983, с.117-149].

В обобщенном виде компромиссный подход может быть охарактеризован как «модульная концепция ОЕЯ». Одно из достоинств этого подхода – организационное упрощение: можно разделить всю задачу на несколько подзадач, которые поручаются разным исследователям или группам исследователей; получаемые же в результате «модули» работают во взаимодействии друг с другом,

-17-

но не «вмешиваясь» во внутреннюю технику операций друг друга [Sparck_Jones, Wilks ed. 1983, с.149].

2.3. Система, «понимающая» естественный язык

Смоделировать понимание и обработку естественного языка – это не одно и то же. Так, мы можем (не понимая полностью или частично) манипулировать символами, повторить сказанное на чужом (и непонятном нам) языке и т.п. Все это, пусть огрубление, соответствует ситуации ОЕЯ без понимания. С другой стороны, сам факт того, что мы нечто понимаем, равносилен тому, что мы над выражением производим определенные лингвистические операции. Таким образом, понимание естественного языка – специальный случай ОЕЯ. Многие из построенных систем ОЕЯ не понимают естественного языка в том смысле, который разумно вкладывать в термин «понимание».

Прежде всего, не все такие системы обладают целенаправленностью [R.Power 1979, с.109]: выработка собственных целей, планирование, воплощение стратегий в виде тех или иных тактических приемов, «прослеживание» результатов этих приемов и предсказание (предвидение) дальнейших результатов – все это пока еще не более чем проект хорошей системы ОЕЯ. Так, система SHRDLU [Т.Виноград 1976] обладает системой планирования, не цели в ней достигаются не посредством высказываний; а кроме того, эта система не в состоянии распознавать цели человека: в диалоге с ЭВМ именно человек обладает инициативой. Несколько более замаскировано отсутствие целенаправленности в системах ЭЛИЗА и ДОКТОР [И.Вейценбаум 1970]. Только сравнительно недавно целенаправленность и моделирование намерений вошли в круг интересов разработчиков ОЕЯ.

Другое временное упущение: понять новое высказывание в диалоге или в тексте – значит, кроме прочего, связать его с тем, что было сказано раньше [Lehnert, Ringle ed. 1982, с.437]. В системах «искусственного интеллекта» эта задача решается, в основном, опосредованно, в два шага: 1) сначала, на основании протокола анализа предшествующего диалога или текста, активируются «фреймы», или «скрипты» (т.е., неформально говоря, те схемы из базы знаний, в которые можно уложить поступившую новую информацию), а затем 2) новое, текущее сообщение сопоставляется с этими схемами (но не с предшествующими предложениями непосредственно).

-18-

В результате, в частности, упускается такая возможность, реально используемая на самом деле в общении между людьми, как «ловля на слове», непоследовательность в употреблении терминов и т.п.

Третье отличие состоит в слабой реализованности влияния контекста непосредственно на направление работы анализатора. Так, в большинство систем ОЕЯ имеется две отдельные подсистемы (как в концепциях [Р.Шенк 1975]; [Y.Wilks 1975]; [В.А.Вудс 1976] и др.): а) анализатор («парзер») перерабатывает входной текст в некоторую промежуточную форму (на язык синтаксических деревьев – как в системах типа [M.P.Marcus 1980], на упрощенный естественный язык – как в работе [K.M.Colby 1975] или на язык понятийных примитивов – как у Шенка), а затем б) подсистема логического вывода строит репрезентацию для значения входного текста (посредством заполнения недостающих деталей в репрезентации, полученной на выходе из анализатора); тогда включаются те неупомянутые события, которые связывают в единое целое факты, упоминаемые в тексте. Часто представленные другие компоненты (система ответа на вопросы и система построения аннотации к статье) скорее демонстрируют достигнутость понимания, чем являются частью процесса понимания [Lehnert, Ringle ed. 1982, с.155]. Назначение промежуточного представления для значения текста всегда одно и то же: защитить систему логического вывода от «капризов» естественного языка. Однако эта направленность не выдержана последовательно: логический вывод всегда бывает при этом связан с дополнительным анализом – на основе теперь уже промежуточной репрезентации. не на работе анализатора никак не сказывается (в названных системах) то, к каким выводам придет система логическом вывода. Попытка восполнить это упущение сделана разработчиками системы FRUMP, где знания о мире отделены от чисто языковых сведений, не где, тем не менее, контекстная информация влияет на процесс анализа, В этой системе содержатся, среди прочего, два модуля: Предсказыватель (предсказывает ограничения на то, что может дальше появиться в тексте) и Выяснитель (верифицирует эти гипотезы Предсказывателя) (см. подробнее [Lehnert, Ringle ed. 1982]). Однако эта система находится в стадии проектирования.

2.4. Автоматический анализатор

В общем понимании задача автоматического анализатора («парзера») такова:

-19-

используя базу лингвистических знаний, распознать текст и получить синтаксический и семантический разбор его. Поскольку в различных направлениях современного синтаксиса и семантики по-разному представляют синтаксическую и семантическую структуру, парзер должен давать требуемый анализ в рамках той или иной концепции. Например, в терминах непосредственно составляющих (НС), отношений зависимости, логических отношений и т.п. Иначе говоря, хотя вход для парзеров может быть один и тот же (текст), выход, в рамках конкретных видов репрезентации, – разный и зависит от «теоретических привязанностей» разработчика.

Задача автоматического анализа по-разному формулируется для разных типов ОЕЯ: для одних типов анализ минимален (например, когда требуется простая перекодировка), для других – фундаментально сложен. Проекты и концепции автоматического анализа в последние 30 лет оказывают сильное влияние на развитие теоретических разработок в лингвистике; имеет место и обратное влияние. В частности [Sparck_Jones, Wilks ed. 1983, с.12], в рамках автоматического анализа, некоторые из идей развиваются заведомо «в пику» популярным общелингвистическим концепциям. Например, семантические парзеры Ризбека [Р.Шенк 1975] и Й.Уилкса [Y.Wilks 1975] должны, по замыслу их авторов, опровергнуть «доминирующую теоретическую ортодоксию».

Общепринятым является тот взгляд, что парзинг – это процесс «лингвистического вычисления», в результате которого (в соответствии с обязательными правилами анализа) выражения на естественном языке переводятся в некоторую «репрезентационную структуру», используемую в дальнейшей ОЕЯ: например, при автоматическом переводе или при ответе на запрос. Поэтому чисто синтаксические операции не всегда полностью исчерпывают парзинг: в анализ включены бывают и семантические операции; например, логический вывод (а точнее, «прагматический» вывод, основанный на ситуационном контекста) вполне может, в принципе, сказываться на синтаксическом анализе как у реальных носителей языка – людей, так и в системе ОЕЯ. Проникновение внесинтаксических характеристик в анализ связывают с понятием «глубины анализа»: удаленность получаемой репрезентации от исходного текста, характер понятий, входящих в такую репрезентацию, степень восстановленности подразумеваемого и т.п. [Sparck_Jones, Wilks ed. 1983, с.12]. Углубление анализа, в этом смысле, – это увеличение

-20-

внесинтаксических моментов в анализе. Под обратимостью же анализа можно понимать ту степень, в которой по полученной репрезентации можно восстановить исходные выражения.

Когда парзинг определяют как прямой перевод текста в семантические структуры [Sparck_Jones, Wilks ed. 1983, с.182], речь идет на самом деле об «идеально глубоком» анализе, а не об отсутствии синтаксических операций: действительно, даже простое отождествление лексической единицы в тексте с единицей словаря, буквально или небуквально с нею совпадающей, является разновидностью синтаксической операции. В еще большей степени это справедливо для идентификации синтаксических структур. Один из возможных подходов к связи компонентов грамматики в рамках автоматического анализа – следующий [Sparck_Jones, Wilks ed. 1983, с.156] (и сл.) {Рис.4 (Компоненты анализатора) в электронной версии мы не приводим}

В этой концепции выдвигаются следующие принципы:

1. Синтаксическая и семантическая переработки происходят параллельно и связаны между собой.

2. «Композиционная семантика» работает после синтаксиса и представляет собой установление логической формы предложения: глаголы переводятся при этом как семантические предикаты «логического языка», а именные словосочетания – как аргументы при этих предикатах.

3. Логический вывод уже требует наличия полученной ранее «логической формы» предложений; поэтому семантика с логическим выводом начинает работать только после того, как установлены роли именных словосочетаний (т.е. установлено, является

-21-

ли каждое данное сочетание прямым дополнением, субъектом, обстоятельством и т.п.).

4. Синтаксические правила выделяются из числа остальных правил (в противоположность концепции Й.Уилкса, см. [Sparck_Jones, Wilks ed. 1983]).

5. Процедуры снятия омонимии в самой грамматике не заложены, а входят в задачу остальных компонент ОЕЯ (базы знаний).

6. Синтаксис должен быть совместим с семантикой (у них набор «рабочих» категорий должен перекрываться).

7. Вычленение групп слов должно происходить только тогда, когда оно будет реально использоваться при работе остальных компонент парзера.

Каждый шаг работы анализатора полезно бывает представлять как ответ на тот или иной «элементарный заказ», который может состоять, в частности, в выяснении того, какой из двух способов репрезентирования предпочтителен [Sparck_Jones, Wilks ed. 1983, с.141]. Это выяснение параллельно сканированию выражения от начала к концу («слева направо»); каждый шаг можно условно назвать «построением микротеории», в которой содержатся следующие виды информации: а) концептуальная структура групп слов, до сих пор уже просканированных и распознанных; б) множество «заказов» на установление ожидаемых в дальнейшем составляющих распознаваемого предложения, вместе с операциями, которые необходимо произвести, если эти ожидания подтвердятся; в) числовая оценка степени совместимости с предсказаниями, уже сделанными ранее; г) части предложения, уже просканированные, не ожидающие пока что своей микротеории. Таким образом, парзинг происходит как постепенное расширение и сужение набора микротеорий. Имеются, кроме того: а) класс возможных заказов, в котором указывается порядок выполнения заказов; в частности, когда некоторая «микротеория» расширяется, с помощью названного класса выявляются те заказы, которые должны выполняться далее; б) квалификатор заказа («предикат хранения»), эксплуатируемый в случае, если заказ данного класса не использован при расширении микротеории (даже когда последняя выполняла этот класс заказов): если этот квалификатор к данной теории не подходит, заказ снимается.

К важным характеристикам парзеров относятся «реальное время» их работы и реальное количество и сложность «лингвистических вычислений». Было показано [D.H.Younger 1967]; [J.Earley 1970], что время

-22-

анализа предложения в рамках контекстно-свободной грамматики пропорционально кубу длины этого предложения (или меньше этого времени). Любое введение рекурсий и трансформаций увеличивает это время или делает его непредсказуемым [G.Gazdar 1981, с.155].

Однако контекстно-свободный анализатор вовсе не предполагает отвлеченность от контекстных характеристик высказывания: одно дело – анализ высказывания в контексте как задача для ОЕЯ, а другое – тот формальный аппарат (скажем, контекстно-свободная грамматика), с помощью которого эта задача решается. В частности, в рамках диалоговых систем ОЕЯ анализатор должен решать следующие проблемы [Sparck_Jones, Wilks ed. 1983, с.46-47]: 1) распознавание прагматических категорий (например, распознавание типа речевого акта, в рамках которого производится анализируемое высказывание); 2) репрезентация последовательности и иерархии речевых актов; 3) отражение системы знаний и мнений, а также модификация их по ходу диалога; 4) использование и модификация, при необходимости, рамок общения; 5) возможность восстановить «суть» предшествующего общения, решения по поводу организации общения, которые были приняты на более ранних этапах общения с ЭВМ, и т.д.

2.5. Стратегия анализа

Огромное большинство существующих анализаторов и их проектов основано на предположении об автономии синтаксического анализа (отделенности от семантического и лексического компонентов).

Это выразилось, в частности, в том, что анализатор строится обычно как набор процедур, обращающихся к лексикону за информацией в случае необходимости. Сам же лексикон – набор лексических элементов, опознаваемых в тексте в результате непосредственного сопоставления с элементами распознаваемого текста, – обычно сравнительно невелик и рассчитан на дальнейшее (при необходимости) пополнение (исключения редки; см., например [J.P.Kimball 1975]; [M.P.Marcus 1980]). Кроме того, многое из той информации, которая непосредственно относится к конкретным лексическим единицам, закладывается часто не в лексические статьи, а в синтаксический и семантический анализаторы непосредственно.

Обычно при анализе предложения должно происходить следующее: а) выбирается подходящее значение очередной лексической единицы; б) информация о времени и глагольном виде рассматривается с точки зрения прагматической

-23-

вероятности; в) выявляется вероятность альтернативного анализа; г) учитывается как правый контекст (то, что следует в тексте после данного сканируемого выражения), так и левый (то, что было сказано в тексте ранее). Возможно, эти задачи разумнее решать в рамках не одного компонента, а нескольких [K.Hammer 1981, с.120]. Необходимо, кроме того, предусмотреть те случаи, когда текст построен неправильно (а такие случаи нередки, особенно когда анализатор ориентирован только на какой-либо узкий класс текстов, в которых вероятно появление непредусмотренных структур или лексем).

Память системы (например, «лексикон») хранит по меньшей мере пять видов информации [K.Hammer 1981, с.123]: 1) формальная (например, как образовать форму прошедшего времени от данного глагола); 2) грамматическая (например, возможные падежные отношения для глаголов или отнесенность к той или иной категории для слова); 3) структурная (например, может ли глагол подчинять себе инфинитивную конструкцию); 4) семантическая (например, такое толкование для лексемы жена, в котором указывается, что это замужняя женщина, обычно взрослая); 5) концептуальная (например, указание на то, что развод связан с судопроизводством, юриспруденцией и т.п.).

В некоторых концепциях ОЕЯ каждый отдельный модуль, занятый своей отдельной задачей, называется «экспертом»: имеются, таким образом, эксперты по синтаксическому анализу, по семантике, по концептуальному анализу и т.д. Кроме прочего, имеются «эксперты» и по анализу слова.

К ведению этого последнего эксперта относится, среди прочего, словоизменительный анализ (лемматизация). В рамках системы, разрабатываемой под руководством Ю.Кунце (ГДР), такой эксперт состоит из пяти компонентов [J.Kunze ed. 1983, с.17]: 1) парадигматический компонент, описывающий флективные особенности словоформ в рамках категорий рода, числа, падежа, лица, времени и залога; 2) селекционный («сочетаемостный») компонент, выявляющий отношения синтаксической сочетаемости между словоформами на основе логических выражений, приписываемых каждой из словоформ; 3) компонент связи (выявление связей синтаксической зависимости в предложении, заданных в терминах классов слов); 4) компонент зависимости, описывающий отношения синтаксической зависимости – между главным и зависимым членом

-24-

предложения; 5) компонент упорядочения (соотнесение порядка слов с морфологическим анализом).

Одна из построенных систем так и называется «эксперт по словам» [C.Rieger 1977]. В этой системе каждое слово языка рассматривается как источник сложного процедурного знания. Основные гипотезы авторов этой системы – следующие: а) человеческое знание языка организовано, в первую очередь, как знание о словах, а не как знание о правилах; б) понимание языка – это координирование обмена информацией между различными «экспертами по словам», при котором каждый участник общения устанавливает собственную роль в речевом и концептуальном окружении; в) главный упор при конструировании анализатора должен быть на учете отклонений от правил, а не на отражении закономерностей [Lehnert, Ringle ed. 1982, с.89-90].

Далее будет показано, в чем должны состоять стратегии анализа, если принять интерпретационную концепцию вычислительной лингвистики.

./bars/image002.gif

3. ЗНАНИЕ КАК ОСНОВА ИНТЕРПРЕТАЦИИ

3.1. Вводные замечания

Как указывалось выше, в данной работе принимается, что интерпретация охватывает как понимание, так и произведение («продуцирование») высказывания. Нейтрально это понятие также и по отношению к осознанию буквального смысла и расширенного, дополнительного смысла. Последний вид смысла вовлекает знание, основанное на логическом выводе. Существенно привлечение внеязыковых знаний и при интерпретации неоднозначных высказываний.

Понятие интерпретации издавна неформально используется в качестве термина для обозначения того, что можно извлечь из какого-либо рассматриваемого объекта и не совпадает с этим объектом буквально, т.е. не тождественно ему либо по форме (случай буквального перифразирования, с сохранением смысла), либо по содержанию (случай интерпретации, связанной с вовлечением «побочных», т.е. индивидуальных, не чисто языковых знаний интерпретатора). При конкретной интерпретации объект рассматривается на определенном фоне: например, в привязанности к конкретной ситуации появления объекта, в контексте более крупного высказывания, предшествующих высказываний того же

-25-

автора и т.п. Характеристики этого фона отражаются в рамках и получаемой интерпретации. Абстрактная интерпретация, т.е. та, которая осуществляется вне такого фона, как бы в пустоте, – случай довольно редкий; приблизительное представление об этом случае могут дать, пожалуй, только предложения-примеры в грамматических пособиях (типа Мама мыла Машу. Дети пошли в сад. Наступила весна, – в сборнике упражнений по русскому языку для начальной школы).

В основе понятия модели как объекта математической логики (теории моделей) интерпретация связана с тем углом зрения, под которым объект рассматривается {Note1}. Там термин модель является синонимом термина интерпретация. Однако такое понимание не единственно. Столь же широко, если не более распространенно, понимание интерпретации как процесса: в последние годы в лингвистике все большую популярность получает взгляд на интерпретацию как на то, что определяет природу речевой деятельности вообще (о концепции «интерпретационизма» см. [Демьянков 1979а]).

{Note 1. Ср.: «...обоснованность процессов анализа зависит не от интерпретации используемых символов, а только от законов их комбинирования. Каждая интерпретация, сохраняющая предложенные отношения, равно допустима, и подобный процесс анализа может, таким образом, при одной интерпретации представлять решение вопроса, связанного со свойствами чисел, при другой – решение геометрической задачи и при третьей – речение проблемы динамики или оптики»; это высказывание Дж.Буля, создателя алгебры логики, см. [Кузичева 1978, с.22]; и далее: «процессы формального рассуждения зависят от законов, которым подчинены символы, а не от природы их интерпретации» [Кузичева 1978, с.25].}

3.2. Интерпретация неоднозначности

Решение проблемы «устранения неоднозначности», т.е. установления того, в каком из своих нескольких значений выступает высказывание в конкретно) контексте (если это высказывание потенциально может обладать несколькими «значениями», как предложение Мать любит дочь или Член Ученого совета бросил два черных шара), отличает интерпретационизм от «антиинтерпретационизма».

Так, при анализе неоднозначных выражений интерпретационисты говорят не столько о разных источниках трансформационной деривации предложения (т.е. не о том, что одно предложение-объект совпало с другим, полученным в результате совершенно иных синтаксических и семантических процессов продуцирования его), сколько о различных синтаксических, семантических и прагматических интерпретациях, получаемых на основе одной и той же

-26-

текстовой структуры предложения. Иначе говоря, центр тяжести перенесен на точку зрения человека, интерпретирующего и понимающего высказывание. Устранение неоднозначности в конкретном контексте объяснимо при этом по-разному.

Например, если одна интерпретация, гипотетически выдвигаемая для данного неоднозначного выражения, т.е. гипотетическая интерпретация этого выражения, совместима с данным контекстом употребления, а другая не совместима, то в результате «дисамбигуации» (устранения неоднозначности) первая становится доминирующей, а вторая резервируется: если в дальнейшем выяснится неадекватность гипотетической оценки самого контекста, то вторая интерпретация может стать актуальной вновь. С другой стороны, выражения типа Жизнь есть жизнь, Иванов – это Иванов, Бегемот – это гиппопотам, интерпретируемые как трюизм или как тавтология, будучи употреблены в реальном контексте, могут указывать интерпретатору на то, что говорящий имеет в виду более широкий контекст, чем до этого предполагалось, что контекст нестандартен, что необходимо переоценить всю ситуацию высказывания и т.д.

По Р.Столнейкеру [P.Cole ed. 1978], возможны три вида реакции интерпретатора на неоднозначность выражения: а) заключить, что контекст «не таков, каким кажется на первый взгляд»; 2) сделать вывод, что сказано или имеется в виду не то, что подсказывает доминирующая интерпретация – ближайший способ истолкования, и 3) констатировать нарушение правил ведения разговора. Последний вид реакции наименее обычен, не вполне возможен.

Само же общение может интерпретироваться как ограничение говорящим выбора из множества тех альтернативных «возможных миров», которыми может обладать адресат, для того чтобы поместить ситуацию, «моделируемую» каждым произносимым предложением, в рамки таких миров [Хинтикка 1980], [Cresswell 1973]. При этом случай, когда сам говорящий, а не только адресат-интерпретатор неадекватно оценивает ситуацию, естествен: так, если на обычном месте в гостиной вместо портрета бабушки кто-то незаметно повесил портрет дедушки, а говорящий этого не заметил, он может сказать сыну: Смотри, какая твоя бабушка была красивая в молодости, – и сын вполне поймет это высказывание правильно (поймет, что отец не заметил подмены, т.е. что отец неадекватно

-27-

оценивает ситуацию, не поймет, чтò тот хотел сказать; а может случиться, что и сам сын не посмотрит внимательно на портрет и не заметит ошибки отца, – тогда сын правильно проинтерпретирует слова отца, правильно проинтерпретирует его «внутренний мир», не неправильно оценит объективную ситуацию). В рамках антиинтерпретационизма этот случай трактовался бы как «неоднозначное» указание: т.е. как тот случай, когда исходная семантическая структура предложения содержит и адекватный, и неадекватный способы приписывания референта (т.е. обозначаемого предмета) существительному портрет, бабушка и т.п.

Как показывает Д.Каплан [P.Cole ed. 1978], – и это видно из приведенного примера, – речь обладает тем свойством, что можно сообщить то, что мы намереваемся сказать, даже если нам и не удается, с точки зрения адресата (на самом деле понявшего нас), сказать именно то, что мы хотели. А кроме того, прямое указание, даже не обязательно будучи вполне корректным, тем не менее может служить устранению побочных гипотетических интерпретаций. При этом всегда существенно наличие определенных «житейских» – внеязыковых – знаний.

На основании каких же видов знания и с помощью каких «процедур» осуществляется дисамбигуация? Ч.Ли и С.Томпсон [F.Wenzel 1973] считают, что для устранения неоднозначности используются четыре типа знаний: 1) знание конкретного языка, 2) знание прагматических факторов; 3) принципы, вообще не имеющие к языку никакого отношения; 4) универсальные языковые принципы. Однако в таких терминах остается нерешенным, например, такой вопрос: к ведению какого из указанных видов знания следует отнести референтную квалификацию ситуации общения как допускающей или не допускающей конкретный класс толкований предложения? Этот вопрос находится в центре внимания «координатной семантики» Д.Льюиза [Д.Льюиз 1983], а также М.Крессуэлла [Cresswell 1973, с.25].

Другие предположения: а) мы приходим к той или иной интерпретации, отталкиваясь от собственных представлений о том, как «создается значение» [Bennett, Hartmann 1979]; б) интерпретация разговора является результатом умозаключения, «перерабатывающего» синтаксическое, лексическое и просодическое «знание» (так – в рамках теории «импликатур» П.Грайса [P.Grice 1978]; в) мы интерпретируем чужие высказывания в терминах собственных идиолектных концептуальных структур [Quine 1969]; так, согласно «принципу ясности»

-28-

[N.L.Wilson 1959, с.532], мы рассматриваем чужие слова таким образом, чтобы интерпретируемое выражение казалось минимально абсурдным; г) мы стремимся к согласованности частей интерпретации; так, если при одной из гипотетических интерпретаций элемент A высказывания толкуется дважды (например, в случае интерпретации предложения с эллипсисом одного из повторяющихся элементов), то имеет место «параллельная интерпретация» [D.Lightfoot 1979], т.е. этот элемент получает по меньшей мере сходное толкование в обоих случаях. Например, в предложении Петр должен быть дома и делать уроки элемент должен может интерпретироваться как деонтический модальный предикат (обязан) и как эпистемический (должно быть, возможно). Однако запрещено такое толкование предложения, при котором, например, имеем: Петр обязан быть дома и он, должно быть, делает уроки.

3.3. Принципы интерпретирования

Каковы же принципы, которыми пользуется человек, интерпретируя высказывания? В поисках ответа было предложено довольно большое число кандидатов на звание «ведущего» принципа. Вот только некоторые из них.

Наиболее почтенное место занимает «принцип Фреге» (принцип композиционности). В обобщенном виде он формулируется так: значение целого предложения есть функция от значений его частей [Cresswell 1973, с.19]. Для поверхностной структуры предложения этот принцип, взятый буквально, не совсем справедлив: достаточно проследить его действие в случае синтаксической неоднозначности. В концепции «компонентного анализа» предложения [Katz, Fodor 1963] этот принцип действителен только для «исходной синтаксической структуры» предложения; именно на этом принципе и основана работа «правил семантической проекции» в такой концепции семантики [Katz, Fodor 1963]. Даже при такой трактовка, тем не менее, указанный принцип наталкивается на трудность, связанную с интерпретацией цитат [Cresswell 1973, с.105].

В одном из вариантов грамматики Монтегю [D.R.Dowty 1979, с.15] принцип Фреге принимается в следующей трактовке: каждой синтаксической операции (в смысле [R.Montague 1974]) в языке соответствует единственная семантическая операция; значение целому выражению приписывается в виде функции от значений частой целого и от синтаксического правила, формирующего это целое из его частей.

-29-

«Ослабленный» принцип Фреге, относящийся к определению референции целого исходя из референции частей выражения [G.Frege 1962, с.35], нашел свое продолжение в виде «функционального принципа» Э.Кинана [E.L.Keenan 1974, с.298-302]. Если рассматривать семантические представления предложений естественного языка как выражения вида «функция + аргументы» (с возможными усложнениями, типа логических операций и вложений целых пропозиций в позиции аргументов), то в соответствии с указанным принципом референция аргументного выражения должна быть определима вне зависимости от значения или референции функциональной части; однако при этом сами функциональные части могут варьировать в зависимости от выбора вида для аргументов (т.е. могут зависеть от аргументов). Иначе говоря, референция целого выражения предполагает нахождение референции для аргументных его частей, вне зависимости от того, какую именно функцию от этих аргументов мы берем. Модификация этого принципа [E.L.Keenan 1980, с.186] формулируется так: семантическая интерпретация выражения есть функция интерпретации тех выражений, из которых целое выражение получено (в результате семантической деривации), не с точностью до определенного уровня идиоматичности и неоднозначности конструкции целого.

Предложены были и другие принципы, один из них – принцип когнитивного диссонанса [W.Lehmann ed. 1978, с.309]: язык является когнитивно диссонантным в той степени, в какой принципы семантической интерпретации, приложимые к базисным предложениям этого языка, должны быть модифицированы для того, чтобы давать правильную интерпретацию для сложных предложений. Иначе говоря, этот принцип характеризует степень последовательности конкретного языка в отношении семантической интерпретации. Еще один принцип, сформулированный там же, относится к субъектно-предикатной структуре предложения [W.Lehmann ed. 1978, с.304]: референция субъектной составляющей предложения частично определяет релевантность того, что в предложении говорится. Иначе говоря, если из всего предложения нам известно подлежащее, то мы выдвигаем некоторые экспектации -гипотезы о том, насколько нам существенно все остальное, что в предложении будет сказано далее; а это зависит, в свою очередь, от того, насколько существенны для нас объекты или индивиды, описываемые субъектной составляющей.

-30-

Принцип минимальной интерпретации [Th.R.Hofmann 1979, с.60-61] относится к другой стороне вопроса: каждое предложение интерпретируется таким образом, чтобы добавить по возможности меньший объем новой информации, т.е. чтобы максимальным было ее пересечение с предыдущим контекстом (речь не идет о тех случаях, когда вводится новый сюжет, фокус контраста и т.п.). Этот принцип справедлив для прямого толкования предложения, а не для вытекающих из предложения следствий.

Другой количественный принцип – «модифицированная бритва Оккама» [P.Grice 1978, с.118]: при интерпретации смыслы выражения не должны множиться больше необходимости. В частности, множество контекстнообусловленных значений («суппозиций») слов в предложении должно быть ровно в той степени широким, какая определяется необходимостью интерпретации; выход за пределы минимума допускается только тогда, когда предложению трудно иначе приписать осмысленную интерпретацию.

Принцип идентифицируемости [K.Stenning 1980, с.629] может рассматриваться как связанный с предыдущими двумя; он формулируется так: к интерпретации целого, по мере поступления новых языковых выражений, необходимо добавлять такой минимум, который логически не противоречит самому высказыванию. Аналогичен этому принципу, не обращен на контекст, «принцип локальной интерпретации» [Brown, Yule 1983, с.58] (и сл.): интерпретатор не должен конструировать (а точнее, оценивать) контекст более крупный, чем тот, который ему необходим для получения какой-либо интерпретации. Так, если Джону говорят: Закрой дверь, – то он поймет, что речь идет о ближайшей двери, а не о той, которая находится в соседнем доме на третьем этаже. Такой принцип можно в райках ОЕЯ связать с требованием о минимальной работе анализатора.

Принцип аналогии [Ö.Dahl 1976, с.46], взятый с точки зрения интерпретатора [Brown, Yule 1983, с.64], может быть сформулирован так: имей в виду, что говорящий стремится упоминать только те вещи, которые изменились, а о тех, которые остаюсь без изменения, обычно умалчивает.

Наконец, «принцип обычности» можно сформулировать так [L.Lauzière 1982, с.41] (и сл.): если нет никаких для этого оснований, не подозревай, что у интерпретируемых слов имеется какой-либо еще дополнительный, скрытый смысл.

-31-

3.4. Концепция «гипотетической интерпретации»

Предшествующее рассмотрение позволяет нам сформулировать следующие восемь принципов интерпретации в рамках одной из концепций интерпретационизма (концепции гипотетической интерпретации).

(1) ПРИНЦИП ГИПОТЕТИЧЕСКОЙ ИНТЕРПРЕТАЦИИ. Интерпретация как процесс – это постепенное расширение и/или сужение текущего набора гипотез относительно искомой результирующей интерпретации. Каждая из промежуточных гипотетических интерпретаций, входящих в такой набор, содержит переменные, смысл которых выявляется на последующих этапах интерпретации. Если заполнение переменных в рамках конкретной гипотезы корректным образом невозможно, гипотеза, стирается (набор гипотетических интерпретаций, соответственно, сужается). Расщепление какой-либо промежуточной гипотезы на две или более приводит к расширению набора промежуточных гипотетических интерпретаций. Например, когда речь идет о морфологической интерпретации словоформы (т.е. об установлении того, формой какой лексемы она является), то процесс интерпретации можно представить как переход по цепочке слева направо, при обращении к словарю морфов и выяснении того, какие морфы могут следовать за данным (отождествимым с началом текущего остатка), и могут ли они вообще быть заданы в словаре.

(2) ПРИНЦИП КОМПОЗИЦИОННОСТИ. Результирующая интерпретация основана на интерпретации частей целого, а ход интерпретации определяется конструкцией целого (ср. «принцип Фреге» выше).

(3) ПРИНЦИП МНОЖЕСТВЕННОСТИ И УПОРЯДОЧЕННОСТИ ВИДОВ ИНТЕРПРЕТАЦИИ. Множество видов интерпретации одного и того же выражения бесконечно и упорядочено в том смысле, что одни виды могут явиться исходными для других видов. Этот принцип противоположен тому, когда пытаются в рамках одного и того же лингвистического представления (репрезентации) дать все сведения о свойствах, существенных для конкретного уровня; например, когда семантическую репрезентацию предложения представляют в виде такого дерева непосредственно составляющих (НС) или дерева зависимостей, в котором одновременно отражены: отношения зависимости (или составления), кореференция различных именных составляющих, отношения между модусом и диктумом, между фокусом и пресуппозицией, иллокуционные

-32-

свойства предложений и даже энциклопедические сведения об употреблении тех или иных единиц (например, когда слово сирота в семантическом представлении дается в виде «лицо, лишенное родителей»). Антиинтерпретируюций подход не учитывает того, что различные «оси» представления для предложения могут входить в логические противоречия между собой.

(4) ПРИНЦИП МИНИМАЛЬНОСТИ ОГРАНИЧЕНИЙ. Интерпретацию получают и грамматически правильные, и не вполне правильные выражения. Так, интерпретируемы предложения типа Петя дает книгу другу, и Петя дает книге другу, и Петя дает книгу друга и т.п. В зависимости от знаний интерпретатора и от вида интерпретации выражение может быть понято тем или иным образом и, возможно, оценено как «отклоняющееся», «безукоризненное», «странное» и т.п. Знаменитые Зеленые идеи яростно спят также интерпретируемы: они могут так или иначе быть оценены с грамматической или иной точки зрения, не при этом к интерпретации привлекается не представление об «обыденной» (актуальном) возможном мире, а некоторый иной класс возможных миров (ср. актуальные – реальные – нереальные – противоречивые и т.п. разновидности возможных миров).

(5) ПРИНЦИП ПРЕДПОЧТЕНИЯ. Относительно конкретного возможного мира различные интерпретации одного и того же вида по степени предпочтительности неравноправны: предпочтительны те толкования, которые минимально изменяют внутренний мир интерпретатора. По ходу интерпретации иерархия предпочтения может изменяться.

(6) ПРИНЦИП «СЛЕВА НАРАВО». Более ранние по времени появления в поле зрения интерпретатора элементы выражений и обстоятельства общения вовлекаются в интерпретацию также раньше остальных. Этот принцип определяет понятие интерпретации в теоретическом программировании; в системах автоматической обработки текста им зачастую пренебрегают (скажем, строят систему морфологического анализа для русского языка как сначала распознающую окончание и только потом выясняющую, имеется ли остаток в инвентаре основ). Данный принцип имеет в виду не систему письменности (слева направо), а именно время. Случай, когда читатель возвращается к предшествующему куску текста, – это преобразование текста.

(7) ПРИНЦИП ОПТИМАЛЬНОСТИ. Процесс интерпретации организован

-33-

так, что количество посторонних гипотез (отвергаемых на каком-либо этапе интерпретации) минимально (хотя и не всегда пусто), не набор результирующих интерпретаций полностью отражает степень неоднозначности высказывания, обстоятельств говорения и т.п., существенные для конкретного вида интерпретации.

(8) ПРИНЦИП ПАРАЛЛЕЛЬНОСТИ. Интерпретацию одного вида, получаемую на основании интерпретации другого вида, не обязательно представлять как один процесс, начинающийся только после завершения другого: если интерпретирование в рамках «исходного» вида представим как протекающее «по квантам» (как в случае морфологической интерпретации, когда квантами являются морфы), то «зависимый» вид интерпретации также может протекать поквантно, на каждом последующем этапе вовлекая очередную порцию выражения, проработанную в рамках «исходного» вида интерпретации (например, семантическая интерпретация результата морфологической интерпретации может вовлекать на каждом последующем этапе очередной просканированный морф, в рамках конкретной гипотетической интерпретации).

Перечисленные принципы интерпретации могут быть использованы в нескольких направлениях, в частности: 1) при построении систем, моделирующих ОЕЯ, например, моделирующих понимание текста на естественном языке, и 2) при типологическом сопоставлении и оценке построенных систем ОЕЯ.

3.5. Базы данных: синтаксис, семантика, прагматика и «интерпретирующий зигзаг»

В данном разделе речь пойдет о следующем положении «интерпретирующего подхода»: знание и владение языком могут быть определены и описаны с помощью формального аппарата, отдаленно напоминающего распознающую грамматику. Однако в отличие от последней, в интерпретирующем подходе предполагается также, что, помимо чисто грамматических языковых средств, к интерпретации языковых выражений, т.е. к говорению и к пониманию, привлекаются и внеязыковые знания, не «встроенные» в грамматику. Иначе говоря, в интерпретирующем подходе речь, при всех ее целеполагающих характеристиках (достижение коммуникативного эффекта, экспрессивная функция и т.п.), реализует потенции языка в контексте знаний, т.е. в рамках внутреннего мира интерпретатора, вооруженного

-34-

такими знаниями.

Говорение, или шире, продуцирование речи – это воплощение замысла автора речи при параллельном интерпретировании получаемых промежуточных выражений, по ходу их появления; при этом и в результате этого возможны исправления, отклонения от намеченной магистральной линии, отказ от первоначального замысла, колебания и коренная перестройка внутреннего мира говорящего (даже при отсутствии соответствующего комментария со стороны аудитории).

В принципах гипотетической интерпретации, приведенных выше, охарактеризована, по существу, та операция, которую в соответствии с многовековой традицией можно назвать «интерпретацией». А именно, интерпретация-процесс – это пульсирование гипотез, т.е. постепенное расширение и/или сужение текущего набора гипотез, в результате чего получается более или менее устойчивый набор толкований (возможно, этот набор состоит и из одного толкования, когда выражение интерпретируется «однозначно», без колебаний гипотез, т.е. без «осцилляции» значений). Интерпретация целого выражения основана на интерпретации его частей, а ход интерпретации определяется конструкцией целого, в частности, расположением этих частей друг относительно друга в пространстве и времени: так, более ранние по времени элементы выражений интерпретируются раньше остальных, множество видов интерпретации бесконечно; одни виды могут быть, в конкретной концептуальной схеме, определены как исходные для других. Интерпретируемы как безукоризненно правильные, так и отклоняющиеся от правильности выражения: первый случай имеем, когда достаточно рассматривать только актуальный логически возможный мир, второй – когда приходится расширить внутренний мир интерпретатора (что предполагает способность человека-интерпретатора не отвергать с порога чужие представления и мнения).

Интерпретируя выражения на конкретном фоне, люди, видимо, предпочитают те толкования, которые минимально изменяют их внутренний мир; возможность и количество других вариантов толкований связаны со степенью лабильности внутреннего мира интерпретатора, со степенью подвижности запаса презумпций. Количество гипотез, отвергаемых по ходу интерпретации, не может быть фантастически большим, а набор результирующих толкований полностью отражает ту степень неоднозначности высказывания

-35-

и обстоятельств их появления, которая релевантна для конкретного вида интерпретации и для конкретного типа внутреннего мира.

Интерпретацию одного вида, получаемую на основании интерпретации другого вида, не обязательно представлять как один процесс, начинающийся только после завершения другого: интерпретирование представимо как протекающее по «квантам», и зависимый вид интерпретации на каждом этапе вовлекает очередную порцию выражения, «проработанную» в рамках «исходного» вида интерпретации (а не целое выражение, таким образом «проработанное»). Кванты – это единицы, рассматриваемые как неделимые на составные части в рамках конкретного вида интерпретации; например, для морфологической интерпретации словоформы такими квантами являются морфы (см. [Демьянков 1982в]), а семантическая интерпретация результата морфологической интерпретации может вовлекать на каждом последующем этапе очередной просканированный (т.е. отождествленный с одной из единиц, хранимых в системе языковых знаний) морф, в рамках конкретной гипотетической интерпретации.

Отсюда вытекает, что если имеется два «смежных» вида интерпретации, когда один из них является непосредственно исходным для другого, – то интерпретирование в рамках последнего, зависимого вида происходит не после того, как все выражение целиком (текст, предложение, слово и т.п.) проинтерпретировано в рамках исходного вида, а с отставанием ровно на один квант, почти параллельно. Вот почему мы понимаем предложение (если оно в принципе может быть вами понято) уже начиная с первых по времени его сегментов, а не только тогда, когда оно нам дано целиком.

В такой концепции семантическое исследование можно определить как установление закономерностей интерпретирования, дающего «прямое значение», «буквальное значение» интерпретируемого объекта, его «внутреннюю форму» (в терминах В. фон Гумбольдта). Тогда синтаксис – это то, что связано с установлением структуры интерпретируемого объекта в терминах единиц данного уровня рассмотрения, т.е. опознание объекта как структуры, состоящей из квантов, данных в определенной конфигурации. Синтаксическая структура, в таком понимании, предоставляет исходный материал для семантической интерпретации объекта на данном уровне. Прагматика же оказывается связанной с

-36-

установлением «суппозиций», т.е. контекстно-обусловленных значений интерпретируемого выражения (что, в свою очередь, несомненно предполагает «деятельностный» аспект интерпретации). Все три дисциплины – синтаксис, семантика и прагматика – участвуют в получении интерпретации на различных уровнях: на уровне морфов, слова, словосочетания, предложения, речевого акта, речевого эпизода (стратегии, акции и т.п.), «речевой жизни».

Формализация описываемого подхода возможна в рамках такой модели владения языком, в которой все «интерпретирующее устройство» в целом – «интерпретатор» – состоит из двух основных взаимодействующих частей: из общего механизма интерпретации и из набора баз данных. Общий механизм интерпретации определяется сформулированными выше принципами, дополненными конкретными знаниями относительно направления сканирования (когда речь идет об интерпретации текста, выполненного в той или иной конкретной системе письменности), относительно соотнесенности различных уровней и т.п. Базы данных могут быть расклассифицированы по двум основаниям: 1) по статусу конкретного вида данных и 2) по уровню рассмотрения объекта интерпретации.

По первому основанию имеем три вида баз данных: а) единицы, отожествляемые с частью выражения, взятого в конкретном виде интерпретации (например, морфы, лексемы, семантические предикаты); б) регулярные правила (определяют расширение или сужение текущего набора гипотетических интерпретаций; множество объектов, подвергаемых преобразованиям с помощью таких правил, не ограничено) и в) уникальные правила (также определяют сужения или, реже, расширения текущих наборов гипотез: множество объектов, ими преобразуемых, ограничено конечным списком), привлекающие внеязыковые знания. Инвентаря единиц могут быть отнесены к ведению синтаксиса, регулярные правила представляют данные о семантике единиц (а именно, о конструкционной их семантике, позволяющей дать значение целого только исходя из семантики квантов и из конструкции), а уникальные – о прагматике.

По второму основанию различаются базы данных для морфов, слов, словосочетаний, предложений и т.п. (см. выше). Так, данные о предложениях дают сведения об устойчивых речениях типа поговорок: их синтаксис (на этом уровне) описывает возможность

-37-

соположения речений между собой в тексте, семантика определяет результат буквального прочтения текста, в котором такие речения сочетаются, а прагматика – все «продолженные» толкования таких сочетаний (например, прагматика определяет мораль притчи, составленной из поговорок). Аналогично этому рассматриваются и хранимые данные для речевых актов, для речевых акций и стратегий, а также для возможных миров, интерпретируемых как «речевая жизнь» (скажем, данные о соположимости анекдотов с конкретными обстоятельствами беседы).

Итак, базы данных предоставляют возможности для интерпретирования единиц различных видов сложности: списки единиц предоставляют материал, на основе которого работают регулярные правила, дающие буквальные значения выражений. Получение всех реальных значений выражения происходит в результате двух видов операций: уникальных правил и рассмотрения выражения в контексте. Первый представляет собой установление прагматики выражения, взятого изолированно (т.е. установление узуального значения лексической единицы, устойчивого словосочетания, речения и т.д. с закрепленными возможностями употребления и толкования), а второй – установление суппозиций выражения, т.е. такое сужение или расширение лексического значения, которое возникает вследствие рассмотрения и интерпретации более широкой части интерпретируемого объекта (скажем, текста), чем данное конкретное выражение-квант. Конечно, первое и второе не исключают друг друга; так, на выявлении суппозиций выражения могут оказываться те ожидания-экспектации, которые получены на основании предшествующего («левого») контекста по уникальным правилам интерпретации. И наоборот, условием для работы конкретных уникальных правил могут быть экспектации, вызванные тем квантом выражения, который находится в поле зрения интерпретатора в данный конкретный момент. Например, реификация лексем (т.е. переосмысление абстрактного имени как имени объекта) типа угощение, выражение, исследование представляет собой подтверждение той экспектации, что далее речь пойдет о некотором предмете-вещи: в выражении Гости с интересом рассматривали красиво сервированное угощение на столе левый контекст для единицы угощение вызывает экспектацию имени конкретного предмета, а не процесса.

Взаимодействие уникальных, или прагматических, правил

-38-

с результатом интерпретации предшествующего контекста, затем выдвижение новых экспектаций относительно последующего контекста и их подтверждение или отклонение, т.е. процесс гипотетического интерпретирования, и создает ту пеструю гамму переходов от буквального к контекстно обусловленному значению, которая реально присутствует в речи; именно здесь лежат всевозможные соотношения между экстенсионалом, интенсионалом и «предметным объемом» выражения.

Процедура перехода от одного вида интерпретации к другим представляет собой, таким образом, зигзаг (см. рис.6 на с.39): на нижнем уровне (например, на морфологическом) интерпретатор начинает со сканирования, прибегнув к помощи инвентаря единиц этого уровня, затем обращается к регулярным правилам для единиц этого же уровня, после чего – к уникальным правилам этого же уровня (при этом непременно соблюдается принцип параллельности, упомянутый выше); после этого происходит переход на другой уровень единиц (скажем, после уровня морфов – на уровень лексем), где интерпретация начинается опять-таки со сканирования и через промежуточный этап конструкционной семантики идет к прагматике, и т.д.

Такое зигзагообразное продвижение интерпретатора по уровням можно назвать «интерпретирующим зигзагом».

-39-

ИНТЕРПРЕТАТОР

Общий механизм интерпретации

База данных

инвентари единиц

регулярные правила

уникальные правила

Нижняя граница – часть словоформы, верхняя – словоформа

данные о синтаксисе морфов и словарь морфов

данные о семантике морфов

данные о прагматике морфов

Нижняя граница – лексема, верхняя – ?

данные о синтаксисе слова

данные о семантике слова

данные о прагматике слова

Нижняя граница – слово-составляющая, верхняя – квазипредложение

данные о синтаксисе словосочетания →

данные о семантике словосочетания →

данные о прагматике словосочетания →

Нижняя граница – предложение, верхняя – ?

данные о синтаксисе высказывания

данные о семантике высказывания

данные о прагматике высказывания

Нижняя граница – локуция, верхняя – ?

данные о синтаксисе речевого акта

данные о семантике речевого акта

данные о прагматике речевого акта

Нижняя граница – иллокуция, верхняя – интеракция (?)

данные о синтаксисе речевого действия

данные о семантике речевого действия

данные о прагматике речевого действия

Нижняя граница – эпизод, верхняя – «вся жизнь»

данные о синтаксисе «речевой жизни»

данные о семантике «речевой жизни»

данные о прагматике «речевой жизни»

Рис.6. Интерпретирующий зигзаг

(знак вопроса означает в данной схеме отсутствие подходящего термина)

-40-

3.6. Базы данных как модель информационного запаса:

логика и принципы интерпретации

Как отмечалось выше, интерпретация связана с рассмотрением конкретного объекта (в частности, языкового выражения) на основе постоянно меняющегося «информационного запаса» интерпретатора, и результат ее зависит от наполнения такого запаса. Изменения информационного запаса – результат включения в его состав новых единиц хранения, знаний. Информационный запас может быть сам подвергнут интерпретации на основе конкретного высказывания или группы высказываний; причем в группу может входить некоторое множество суждений из самого запаса. Результат такой интерпретации можно соотнести с логическим понятием «возможного мира». Некоторая часть запаса отражает «внутренний мир» интерпретатора. Итак, имеем следующие соотношения понятий: а) информационный запас – это интерпретация для универсума (множества возможных миров); б) отдельно взятый возможный мир – это интерпретация информационного запаса на основании группы высказываний; в) выделенное подмножество информационного запаса – это интерпретация для актуального, реального мира (т.е. для выделенного элемента универсума).

Из сказанного вытекает следующее:

1. Полный информационный запас может содержать то, что интерпретируемо как взаимоисключающие суждения; не это еще не означает противоречивости самого информационного запаса.

2. «Несостоятельность» связанной последовательности высказываний, основанной на конкретном информационном запасе, может быть следствием того, что минимальный информационный запас, на фоне которого этот дискурс интерпретируется, отражает несовместные (противоречащие друг другу) возможные миры.

3. Говорение и понимание не сводимы соответственно к «перекодировке» значений в поверхностные структуры и обратно: говорение сопровождается обогащением замысла (если таковой имеется) за счет текущего информационного запаса говорящего, а понимание связано с интерпретированием на основе такого запаса.

Информационный запас, кроме прочего, содержит знания о коммуникативных возможностях («иллокуционных потенциалах») языковых выражений, об уместности конкретных тактик употребления языка (ср. аристотелевские энтимемы) и стратегий общения; сюда же входят всевозможные специальные научные знания индивида. Все они, отражаясь интерпретацией, тем не менее остаются за пределами собственно грамматики языка. Таким образом, информационный запас – не часть семантического описания языка (или компонента грамматики): грамматика содержит только общие правила интерпретации, оперируя переменными, на место которых могут быть подставлены соответствующие единицы информационного запаса; на осознанном уровне сама грамматика может скорее входить в информационный запас (например, в виде редакторских сведений о том, какая форма более уместна в конкретном типовом окружении), однако при этом в ней указанные переменные уже могут быть заполнены соответствующими лексическими единицами. Именно с такой «заполненной» грамматикой и имеют дело грамматисты и лексикографы.

Один и тот же механизм интерпретация обслуживает как чисто абстрактное использование и понимание выражений естественного

-41-

языка, так и те конкретные вицы интерпретации, которые вовлекают конкретные же знания из информационного запаса. Первый случай обычно связывают с «семантическими свойствами», второй – с «энциклопедической информацией», различие же состоит в степени вовлеченности информационного запаса.

Под этим углом следует рассматривать в данной концепции и представления о том, что «допускается языком», а что «возможно в реальном мире». Так, выражение круглый стол с острыми углами часто считают семантически аномальным в силу того, что в рамках одного имени сочетаются противоположные эпитеты. В интерпретирующей концепции точнее сказать, что такие выражения допустимы языком (поскольку они интерпретируемы нормальным носителем русского языка при той или иной достройке внутреннего мира до какого-либо возможного, в рамках которого они непротиворечивы), однако противоречат обыденным презумпциям, т.е. интерпретации актуального мира. Та часть информационного запаса, которая отражает обыденные знания (в частности, и все те, которые представимы в виде пропозиций, главный предикат которых выражает пропозициональную установку по отношению к знаниям из других возможных миров), – это набор презумпций интерпретатора, т.е. потенциальных пресуппозиций тех предложений, которые интерпретатор в состоянии понять.

Итак, те виды интерпретации, которые связаны со знаниями и общепринятыми презумпциями, отражают обыденные представления; язык же допускает многие отклонения от таких представлений. Противное заставило бы принять, что с развитием наших личных знаний или знаний какой-то специальной дисциплины меняется язык даже тех, кто о таком развитии и не догадывается (и, возможно, не догадается никогда). Владение языком не равносильно владению всей той мудростью, которая на нем выразима.

В качестве «языка объяснений», т.е. интерпретации, обычно выбирается язык, дающий более прозрачное перифразирование; для него интерпретация целого выражения регулярным образом выводима из интерпретации частей выражения, т.е. связана только с работой «регулярных» правил (см. раздел 3.5).

Непротиворечивое говорение можно гипотетически объяснить с помощью метафоры «падения»: оно аналогично тому, как хождение

-42-

метафорически представимо в виде серии падений, не доведенных до своего полного завершения. Однако при говорении мы «падаем» не где угодно: мы выбираем место так, чтобы не «наступить» на заведомо ложные суждения. Этот выбор места опирается на наши знания при интерпретации собственных высказываний. Если какое-либо собственное высказывание интерпретируемо как слишком близкое к ложному, говорящий дальнейшими речевыми действиями «передвигает» его. При этом допускаются различные степени отхода от буквального употребления выражений языка, «подвижности» презумпций по ходу дискурса и т.п. В частности, сама метафоризация – это особый способ использования информационного запаса.

./bars/image002.gif

4. ИНТЕРПРЕТАЦИЯ НА ОСНОВЕ ЯЗЫКОВОГО ЗНАНИЯ:

МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ

И ПРИНЦИП МОРФОЛОГИЧЕСКОГО АНАЛИЗА

4.1. Вводные замечания

Под морфологической интерпретацией (далее – сокращенно МИ) понимается такой вид интерпретации текста, при котором устанавливается, какие грамматические формы каких лексем представляют словоформы, составляющие текст. При этом текстовая форма слова соотносится со словарной и устанавливаются грамматические пометы для словоформы. В составе процессора естественного языка такая система, воплощенная в виде алгоритмической процедуры, позволила бы, во-первых, использовать стандартные словари при автоматической или полуавтоматической обработке текста, во-вторых, определять морфный состав и семантику тех лексических единиц, которые в стандартных словарях либо никогда не отражаются последовательно (как в случае регулярно образуемых дериватов), либо пока еще не отражены (окказионализмы и неологизмы). В-третьих, построение такой системы МИ является предпосылкой для моделирования лексикографической работы в ее рутинной (не в творческой части): с помощью этой системы можно автоматически проверить составленный словарь на полноту множества дериватов, можно также алгоритмизировать построение толкования конкретной лексической единицы с «прозрачной» семантикой (скажем, многие из толкований для существительных на -ние). В-четвертых, система МИ позволила бы автоматически кодировать

-43-

текстовую информацию не побуквенно (как это пока что делается), а поморфно, и тем достичь экономии памяти ЭВМ, хранящей фонды образцовых текстов русского языка как часть Машинного фонда русского языка. Все это позволило бы автоматически составлять словники по цельному тексту, осуществлять различные работы в рамках систем автоматического перевода, при построении «читающих» автоматов, систем, распознающих устную речь и переводящих эту речь в письменную.

Таким образом, задачи МИ не сводятся к тому, что принято называть лемматизацией. При построении системы МИ необходимо, на наш взгляд, исходить из общих принципов языковой интерпретации, лежащих в основе владения языком и оперирующих на всех уровнях понимания: на уровне слова, словосочетания, предложения, абзаца, текста.

Представляется, что работу системы МИ целесообразно связывать с поморфным распознаванием словоформ, а не с опознаванием хранимых целых основ (в том числе и производных), по следующим причинам. Во-первых, хранилище основ было бы значительно менее экономно, чем хранилище морфов. Так, если при поморфной кодировке есть надежда поместить словарь в память микрокомпьютера, то при хранении целых основ возникнут проблемы не только с хранением, корректировкой, обновлением словаря, не и с поиском лексемы в словаре. Поиск, осуществляемый над множеством морфов, исчисляемым примерно десятью тысячами, во много раз эффективнее, чем поиск по списку в несколько сотен тысяч или миллионов единиц. Во-вторых, пооснóвный поиск позволил бы только лемматизировать текст, не гарантируя решение остальных из перечисленных задач, а это означало бы использование мощной техники для решения очень частной задачи, причем не самым эффективным образом.

Далее принципы гипотетической интерпретации, сформулированные выше, будут кратко охарактеризованы в применении к МИ, а затем будут обсуждены принципы составления того рабочего списка морфов, с помощью которого осуществляется МИ. О приложении описываемого подхода в типологическом исследовании языков и о частных приемах формализации см. [Демьянков 1982г]. Обзор литературы по проблеме МИ содержится в статье [Демьянков 1982в].

-44-

4.2. Основные принципы морфологической интерпретации

Система МИ основана на принципах гипотетической интерпретации (см. выше). В собственно морфологическом аспекте она опирается на следующие положения:

(1) МИ заключается в выяснении гипотетического морфного состава у анализируемой словоформы, идя от более ранних по времени появления в тексте единиц к более поздним. Попутно определяется гипотетическая основа словоформы (т.е. поисковый образ лексемы, в рамках конкретной лексикографической традиции; такие традиции различны, например, для русского и арабского языков) и ее морфологический класс. Морфологический класс основы характеризуется набором флексий, сочетающихся с данной основой. Каждая флексия из набора снабжена соответствующими грамматическими пометами (специальными пометами словоформы, отсутствующими у лексемы как единицы словаря). Каждая из полученных гипотез относительно морфного состава верифицируется по ходу появления в поле зрения последующих сегментов текста (в системах письменности слева направо – при введении в поле зрения все более правых сегментов, в системах справа налево – все более левых, и т.д.);

(2) инвентарь единиц – «лексикон» – представляет собой информационную систему морфов: он содержит не реальные основы, а сведения о «строительном материале» для них. И реальные, и потенциальные основы могут быть построены из морфов, входящих в такой инвентарь. Иногда целая основа представлена одним морфом – «корнем». Лексикон позволяет анализировать словоформы не путем «наложения» образцов, хранимых в словарях (т.е. не при сопоставлении реальных лексем, хранимых в словаре обычного типа, с выделяемой гипотетической основой у анализируемой словоформы), а конструированием таких образцов – промежуточных гипотетических МИ – по анализируемому объекту. Противоположная практика приводит к тому, что системы в лучшем случае оказываются в состоянии анализировать только зарегистрированные единицы, а сформулированные выше задачи решать не могут;

(3) чередования основ отражены как чередования соответствующих морфов: в описываемой системе по принципиальным соображениям отсутствует набор правил, переводящих «поверхностно-морфологическое»

-45-

представление в «глубинное». Это положение об интерпретации непосредственно поверхностно-морфологического вида словоформы связывается в рамках данной системы с тем, что каждое очередное преобразование промежуточного представления происходит только как результат введения в поле зрения очередного сегмента словоформы, при минимуме производимых при этом операций. Противоположный же подход связан с опасностями бесконечной рекурсии, если он прямолинейно воплощается;

(4) лексическое значение словоформы определяется как результат семантической интерпретации, основанной на окончательной или промежуточной МИ. Семантические правила оперируют морфами и их последовательностями и делятся на два класса: продуктивные и уникальные. Продуктивные семантические правила устанавливают буквальное значение лексемы, ее «внутреннюю форму», в терминах концепции В. фон Гумбольдта. Уникальные правила соотносят внутреннюю форму с небуквальными значениями лексемы, т.е. с теми реальными или потенциальными значениями, которыми лексема может обладать в силу своей внутренней формы и которые для единиц, реально фиксируемых в словарях, обязательно вносятся в словарное толкование. Так, дождевик, кроме соответствующей внутренней формы, имеет толкование «плащ от дождя».

4.3. Формальный аппарат системы МИ

Система МИ основана на формальном аппарате рекурсивных функций при древовидном упорядочении морфов внутри словаря. Словарь морфов, или (а соответствии с блумфилдовским употреблением термина) «лексикон», состоит из статей, в каждой из которых имеются указания на следующее:

(1) заглавный морф, являющийся входом в статью; статья вовлекается в очередной этап интерпретации, если в поле зрения «ведущей» функции попадает сегмент, начало которого совпадает с таким заглавием. Относительно сегмента, начало которого отождествимо с несколькими заглавиями и находится в поле зрения одной и той же ведущей функции (например, функции поиска корней, функции поиска префиксов, суффиксов, флексий и т.д.), формируется соответствующее число отдельных гипотез. Почти все преобразования (расширение и сужение набора текущие гипотез) происходят на основании обращения к лексикону;

(2) имя схемы преобразования; по такой схеме выражение, находящееся в поле зрения ведущей функции, преобразуется в соответствии с конкретными «наполнителями», указанными в самой статье лексикона;

(3) наполнители схемы, специфичные для конкретного морфа. К ним относится, например, тот альтернант конкретного морфа, который, заменив заглавный морф статьи, приводит к «словарной основе» лексемы. Например, для того чтобы получить форму ручка от текстовой формы ручек, необходимо ек заменить на к, а нулевую флексию – на а; поэтому в лексиконе в статье для морфа ек среди наполнителей указан в соответствующем месте и альтернант к. Альтернант флексии – это флексия «заглавного слова» (в рамках лексикографической традиции или, более широко, в формате того словаря, который должен быть, по замыслу, совместим с выходом из системы МИ), с указанием на те грамматические признаки, которые заменяемая флексия вносит в текстовую форму. Так, для флексии у среди множества альтернантов есть и морф а (ср. играигру; игру – это форма В.п. ед.ч. от лексемы игра), у которого указан признак «сущ. в форме В.п. ед.ч.».

Имеется и другой вид наполнителей – пометы, или признаки, наличие которых является условием для работы преобразований и которые сами вводятся в выражение на тех или иных этапах интерпретации. В используемой здесь нотации признаки имеют вид целых чисел в фигурных скобках типа: {3}, {5} и т.п. При каждом виде признаков (когда именно, станет ясно из последующего изложения) ставятся пометы для «сигнатуры» признака; так, имеем суффиксальные, корневые, флексионные признаки и т.п.; например, {с{3}{5}с} – набор суффиксальных признаков.

Символ функции «Ф» также имеет различные сигнатуры. Так, для русского языка ФI будем использовать как символ функции выделения предкорневого сегмента в подведомственном этой функции выражении (т.е. в начале выражения, находящегося в круглых скобках при таком символе); ФII – функция выделения корневого сегмента; ФIII – то же для суффиксального; ФIV – для флексий. Сигнатура имеет чисто различительное значение, ее вид связан только с выразительными возможностями используемого шрифта. При указании на вид искомого морфа – корневого, префиксального и т.п. – удобно пользоваться цифровой сигнатурой, поскольку множество таких классов может, в принципе, варьироваться и расширяться.

Пример формулы преобразования, полученной в результате вставления наполнителей в схему преобразования:

(Х1ФI(наХ2)) := (Х1наФI(Х2)) (Х1наФII(Х2)).

Здесь, как и всегда в рамках данной нотации, объектные выражения-морфы подчеркиваются, наличие пробела между выражениями, в частности, между объектными выражениями, значимо: различны выражения на оборот и наоборот. В то же время не релевантны неподчеркнутые пробелы, в частности, и между символами метаязыка; так, на оборот и наоборот тождественны друг другу. Символы X1, Х2 и т.д. – символ Х с сигнатурой в виде числа, написанного арабскими цифрами, – в формуле преобразования соответствуют «открытым переменным», значение которых выявляется только для конкретного выражения. Например, (выФI(нашивать)) может быть представлено с помощью формулы (Х1ФI(наХ2)), при значениях X1 = вы, Х2 = шивать. Такое выяснение происходит единственным образом, когда вид формулы задан корректно: круглые скобки – символы метаязыка – являются «жесткими» элементами при этом. Пример некорректной формулы: (Х1Х2ФI(наХ3)): подряд идущие (без жестких разделителей) символы открытых переменных X1 и Х2 не позволяют установить их значение единственным образом даже в самых простых случаях. Далее будут использоваться только корректно построенные формулы: противное приводит к избыточным гипотезам – к тем, которые на содержательном уровне неразличимы.

В указанной формуле символ ':=' читается «заменить на»; такая формула соответствует преобразованию, в результате которого любое выражение, содержащее в качестве терма {Note 1} то, что в формуле идет перед символом ':=', заменяется на то выражение, которое указывается в нем после этого символа. При этом

-48-

«указывается» – значит «может быть представлено в соответствующем виде». Так, выражение, содержащее открытые переменные, может «указывать» на другое выражение тогда и только тогда, когда для открытых переменных в отождествленном – «указываемом» – выражении найдется корректный набор значений. Например, (выФI(нашивать)) и (ФI(нашел)) преобразуются по приведенной выше формуле соответственно в следующие выражения:

(вынаФI(шивать)) (вынаФI(шивать));

(наФI(шел)) (наФII(шел)).

{Note 1. Терм – это правильная скобочная запись, входящая в целое выражение, которое также представляет собой правильно построенную скобочную запись.}

Выражение первой строки соответствует набору гипотез для словоформы вынашивать (в рамках уже полученной определенной гипотезы о морфе перед нашивать), согласно которому выражение шивать начинается либо с префикса (эта гипотеза обозначена первой парой скобок), либо с корня (вторая пара). Первая пара скобок в этой строке позже сотрется: префиксов, начинающихся на ш, в русском инвентаре нет. Вторая же даст анализ, при котором выделится правильный корень и суффиксы (несколько или один – в зависимости от того, каков конкретный инвентарь морфов), и мы получим МИ скрытого неологизма (ср. данные «Этимологического словаря», приводимого иногда в «Литературной газете»). Других гипотез при префиксе на в указанной формуле нет. Очевидно, что правильный, соответствующий реальному словарю русского языка анализ этой словоформы вынашивать – тот, при котором выделяется корень наш: такая МИ получается, но не в рамках гипотезы (выФI(нашивать)) (где предполагается, что на – префикс), а в рамках (выФII(нашивать)), причем обе указанные гипотезы задаются схемой преобразования, которая имеется в статье для префиксального морфа вы. Аналогичное можно сказать относительно второй строки (анализ словоформы нашел), где мы имеем случай отождествления открытой переменной с пустой цепочкой (что не равносильно невозможности отождествить целое выражение с формулой).

По текущему выражению в поле зрения ведущей функции без избыточных просмотров лексикона выявляются те морфы, которые могут считаться началом этого выражения. Лучше всего этой цели отвечает древесная структура лексикона, когда, например, два морфа, начинающиеся одинаковыми сегментами, в дереве упорядочения статей до определенного момента «склеены»; разветвление их происходит как раз в том месте дерева, где их тождество

-49-

кончается (это, кстати, и один из наиболее распространенных способов упорядочения информации в автоматической лексикографии). Благодаря такой организации быстро устанавливается отсутствие требуемого морфа в инвентаре; а это именно тот случай, когда стирается соответствующая гипотеза. Если же морфов, отождествляемых с началом текущего выражения в поле зрения функции несколько, то текущая гипотеза расщепляется на несколько новых и представляется как последовательность скобочных записей; просмотр гипотез в таком наборе слева направо, начиная с самой левой. Поскольку длина морфа редко превышает три-четыре фонемы, расщепление гипотез не приводит к нереалистично длинному набору. Не допускает этого и то обстоятельство, что к проработке остальных гипотез система переходит только после того, как доведет до логического конца самую левую из текущего набора. Поскольку в лексиконе одному морфу может быть приписано несколько схем преобразований с наполнителями (случай омонимии морфов), они так упорядочены между собой, чтобы более левые гипотезы были и наиболее вероятными. Тогда сначала получаются на выходе наиболее «легкие» («дешевые») гипотезы – подтвержденные варианты интерпретации, а затем (пока частичный результат выпечатывается или высвечивается на дисплее ЭВМ) и остальные не опровергнутые.

Определить степень вероятности гипотезы в рамках морфологической системы можно исходя из длины морфа. Действительно, гипотеза, когда начало анализируемого выражения отождествимо с более длинным морфом из лексикона, будет раньше подтверждена или опровергнута, чем в случае более короткого морфа-кандидата. Если при этом морф можно представить как последовательность более мелких морфов на чисто фонематической (но не морфологическом) уровне, то доказанность гипотезы о более длинном морфе может свидетельствовать о сомнительности остальных вариантов, – скажем, о скрытой нелогичности их, – как в случае вынашивать, где более естественная интерпретация – с корном наш, а не с префиксом на. С другой стороны, бóльшая частотность одних гипотез, связанных с некоторый морфом, по сравнению с другими, дает еще один критерий. Первый критерий связан с длиной морфа и может быть назван «инвентарным», второй же является статистическим. Первый характеризует языковую систему, второй – речь, разные виды текстов и т.д. Лингвостатистика, таким

-50-

образом, оказывается прямо связанной с установлением вероятности гипотез при языковой интерпретации.

4.4. О специальных функциях

Выше говорилось об общих свойствах аппарата функций в связи с функциями сигнатуры I, II, III и т.д. (римские числа). В дальнейшем оказывается полезным использовать некоторые специальные функции с иной сигнатурой.

Функция слияния Фсл позволяет сделать более обозримой схему преобразования, а главное, менее громоздким представление промежуточного набора гипотез. При расщеплении одной промежуточной гипотезы на несколько, как вытекает из сказанного, приходится обычно копировать то, что находится слева от символа ведущей функции, в более общем случае – то, что находится за пределами области ее распространения (см. пример преобразования выше: по нему копируется то из объектного выражения, что отождествимо с Х1). В тех случаях, когда для дальнейших преобразований безразлично, имеется ли за пределами поля зрения функции какие-либо еще выражения, такое дублирование выражения избыточно: если расщепление некоторой гипотезы произойдет на более позднем этапе и из всех гипотез «выживет» только одна, то окажется, что выполнены лишние операции – сначала копирование, а затем стирание. Поэтому вводится соглашение о «выносе за скобки». Так, для префикса от имеем следующее преобразование:

(Х1ФI(отХ2)) := (Х1отФсл(ФI(Х2) ФII(Х2))).

Например, выражение (ФI(отпил)) по этому преобразованию приобретет следующий вид: (отФсл(ФI(пил) ФII(пил)); далее гипотеза ФI(пил) сотрется (префиксов на пи нет), а после отождествления морфа л вторая из гипотез приобретет вид (отФсл((пить в форме прош.вр. муж.р. ед.ч.))).

В свою очередь, функция Фсл в таких результирующих выражениях «расшифровывается» с помощью следующих преобразований:

(Х1Фсл()Х2) := .

(Х1Фсл((Х2)Х3)Х4) := (Х1Х2Х4) (Х1Фсл(Х3)Х4)).

Смысл их таков. Те гипотезы, которые по ходу МИ не были стерты и были доведены до представления без символов функций, переоформляются в рамках того, что вынесено за скобки функции Фсл (т.е. вставляются в рамки контекста Х1__Х4). При этом сам

-51-

контекст повторяется столько раз, сколько гипотез подтвердилось (это гарантируется рекурсивным характером Фсл). Указанные преобразования работают в определенном порядке: второе действует только тогда, когда не может работать первое.

Полученное выше выражение для словоформы отпил по второму преобразованию (первое не может работать) получает следующий вид:

(отпить в форме прош.вр. муж.р. ед.ч.) (отФсл()).

По первому преобразованию вторая пара скобок в полученном выражении сотрется, тем самым будут элиминированы все вхождения символа Фсл.

Функция слияния далее будет часто использоваться; кроме нее можно вводить другие вспомогательные функции. Однако преобразования, связанные с их «расшифровкой» (типа приведенных выше), должны быть формулируемы все теми же нотационными средствами. Более того, можно потребовать, чтобы эти расшифровывающие преобразования работали после всех «лексических», связанных с обращением к лексикону. Вот почему Фсл в статье для префиксов типа на была бы неудачна: так, словоформа нашел, если представить анализ ее части шел как совершенно автономный, преобразовалась бы в выражение наидти, в то время как реальный вид лексемы – найти. Конечно, это требование не слишком жестко: при необходимости можно было бы прибегнуть к помощи дополнительных помет (например, префиксальных признаков). Однако соблюденность этого положения позволила бы рассматривать процесс МИ как главным образом «лексически ориентированный», т.е. управляемый исключительно выражением в поле зрения основных, а не специальных функций.

4.5. Иллюстрация МИ для русского языка

Приводимые ниже преобразования – не более чем примеры. Наша цель – проиллюстрировать взаимодействие преобразований в рамках системы МИ.

Предположим, что входная словоформа Х подается в виде Ф(Х) (где Ф – без сигнатуры, нейтрально). Имеем следующий набор преобразований (в соответствующих лексических статьях им соответствуют крайне редуцированные схемы при указании наполнителей – см. выше; здесь же они подаются условно как строки в грамматике типа порождающей):

-52-

(1) Ф(Х) := (ФI(Х)) (ФII(Х)).

(2) (Х1ФI(наХ2)) := (Х1наФI(Х2)) (Х1наФII(Х2)).

(3) (Х1ФI(надХ2)) := (Х1надФсл(ФI(Х2) (ФII(Х2))).

(4) (Х1ФII(денХ2)) := (Х1{ден} Фсл(ФIII({с{1}с}Х2) ФIV({ф{3}{4}{5}ф}Х2))).

(5) (Х1ФII(днХ2)) := (Х1{дн} Фсл(ФIII({с{3}с}Х2) ФIV({ф{1}{7}{8}ф}Х2))) (Х1{ден}ФIV({ф{2}{6}ф}Х2)).

(6) (Х1ФIII({с{3}с}евХ2)) := (Х1евФсл(ФIII({с{5}с}Х2) ФIV({ф{2}{4}{5}ф}Х2))).

(7) ФIФIII({с{4}с}екХ2)) := (Х1ькФсл(ФIII({с{10}с}Х2) (ФIV({ф{3}{6}ф}Х2))).

(8) (Х1ФIV({фХ2{2}Х3ф}я)) := (Х1ь в форме Р.п. ед.ч.).

Например, словоформа дня пройдет следующие этапы интерпретации:

ФI(дня).

(ФI(дня)) (ФII(дня));

(ФII(дня)) (первая гипотеза стерта: префикса на дн в лексиконе нет);

({дн}Фсл(ФIII({с{3}с}я) ФIV({ф{1}{7}{8}ф}я))) ({ден}ФIV ({ф{2}{6}ф}я)).

Далее, поскольку суффикса я с признаком {с{3}с} и флексии я с признаком {1}, {7} или {8} в лексиконе нет (выбор признаков должен быть именно таким, чтобы в случав словоформ типа дня этих помет при аффиксах типа я не оказалось), первая пара скобок будет редуцирована до функции Фсл с пустыми аргументами; имеем:

({дн}Фсл()) ({ден}ФIV({ф{2}{6}ф}я)).).

По первому из двух преобразований, «расшифровывающих» функцию слияния, первая пара скобок теперь сотрется; вторая же по преобразованию (8) приобретет вид:

({ден}ь в форме Р.п. ед.ч.).

В полученной интерпретации остались квадратные скобки, обозначающие границы корня. При желании можно эти знаки снимать уже при преобразованиях для корня (например, не указывать их в преобразованиях (4), (5)). Однако иногда, для специальных видов интерпретации, например, для семантической, указание границ морфов, с отнесением последних к классу префиксов, корней, суффиксов и т.д., бывает нужным.

-53-

Для работы семантических правил существен даже и не столько графический или фонематический вид интерпретируемых единиц, сколько наличие и последовательность соответствующих «инвентарных единиц» лексикона. Поэтому любое другое имя морфа, отличное от его графической репрезентации, было бы приемлемо для этих правил: скажем, номера морфов, вводимые правой частью преобразований в рамках лексикона, на место опознанного морфа или его альтернанта. Такой вход в семантический компонент был бы по духу очень близок к японской системе графики: каждый (или большинство) из морфов имеет имя в виде целого символа – иероглифа (последний, в свою очередь, также может быть представлен как набор дифференцирующих элементов, что соответствует цифрам 0, 1, 2, ..., 9). Однако в нашем случае каждое имя соответствует и единственному «прочтению» морфа, в отличие от иероглифической записи в японском, где это не всегда так (чаще, чем в китайском, где иероглиф обычно имеет, если отвлечься от редукции тона, одно прочтение).

4.6. О составлении рабочего списка морфов

Как видно из вышесказанного, морф как квант морфологической интерпретации обладает следующими основными (для системы МИ) свойствами. Во-первых, о наличии морфа выдвигаются – по ходу МИ – гипотезы, которые далее подтверждаются или опровергаются. Во-вторых, отождествление начала текущего остатка словоформы с хранимым морфом представляет собой одновременно и выдвижение гипотез относительно того, какие сегменты (другие морфы) допустимы после данного, а какие – нет. Поморфное распознавание эффективнее побуквенного перевода, кроме прочего, в следующих отношениях: а) при поморфном анализе набор гипотез «осмыслен» (в буквальном понимании этого термина); б) поскольку анализ слова протекает не как посимвольное отождествление, а гораздо быстрее, как наложение одной группы символов (т.е. одного «длинного символа») на начало другой, поморфное сканирование и в абсолютном измерении быстрее, чем побуквенное.

Выделение морфа в слове человеком-лингвистом при составлении словаря морфов – это исследовательская операция-эксперимент, равносильная гипотезе о том, что исследователю удастся, во-первых, остаток словоформ, идущий после гипотетически выдвигаемого морфа, полностью покрыть другими морфами, и, во-вторых,

-54-

сформулировать правило, указывающее зависимость значения словоформы от самого факта наличия данного морфа в конкретной позиции в слове. Иначе говоря, эта исследовательская операция связана с предположением о том, что удастся построить текст толкования целой лексемы или привести набор грамматических признаков, вытекающих из присутствия данного морфа. Сказанное означает, что принципы гипотетической интерпретации подчиняют себе и подготовку базы данных о морфах.

Так, из принципа оптимальности (см. раздел 3.4) вытекает, что если выделен в русском языке суффиксальный морф ат (как в словах пузатый, волосатый), суффиксальные морфы ел (ср. капель, качели, купель), ьн (ср. бальный, кабальный, обвальный, скальный), то нельзя считать – в рамках данной системы (но не вообще при описании русской морфология) – сегменты типа ельн(ый), ательн(ый) и т.п. отдельными неделимыми единицами хранения. Противное приведет к тому, что слова типа ругательный, трогательный, писательский регулярно будут анализироваться по меньшей мере двумя способами, содержательно равносильными друг другу с точки зрения того, какие последовательности флексий допустимы после них и как эти словоформы интерпретируются с семантической стороны: руг-ательн-ый, руг-ат-ел-ьн-ый и т.п. (по принципу предпочтения, первая гипотеза будет помечена как предпочтительная), что противоречит принципу оптимальности (в данном случае неоднозначность в разбиении не отражает степени неоднозначности).

Теперь попытаемся суммировать в виде эвристических принципов те требования к морфологическому, а точнее, к «морфному» анализу, которые были выработаны в рамках лингвистической традиции. Эти принципы, в их взаимосвязях, образуют ядро «морфики».

(1) Принцип синхронности: при подготовке списка морфов необходимо исходить из синхронных, а не из этимологических соотношений {Note 1}.

{Note 1. Так, Г.О. Винокур призывал не смешивать морфологию и этимологию, «не смешивать мертвые соотношения с живыми» [Г.О.Винокур 1959, с.423]: «Вопрос о том, есть ли в данном слове то отношение, которое характеризует производную основу в отличие от непроизводной, и, следовательно, выделяются в этой основе какие-нибудь аффиксы или нет, должен и может решаться исключительно установлением отношения между значениями слов в наличной языковой традиции, и только в этом смысле может идти речь о лингвистическом осознании данной среды» ([Н.Д.Арутюнова 1981, с.423]; см. также [Н.М.Шанский 1968, с.5].}

-55-

Этот принцип конкретизируется остальными, ниже приводимыми.

(2) Принцип исчерпывания: в результате поморфного членения основы каждый из членов должен обладать значением [Г.О.Винокур 1959, с.421]. Этот принцип не всегда воплощается прямолинейно; как указывает А.И.Смирницкий [А.И.Смирницкий 1956, с.64], имеющееся значение можно не заметить; кроме того, значение вычлененного элемента в слове «позиционно зависимо, вариативно и в частном случае может не добавлять ничего нового к имеющимся значимым элементам слова» [И.Г.Милославский 1980, с.30]: в пределах одного слова «могут находиться элементы с одинаковым, противоположным и взаимоисключающими значениями» [И.Г.Милославский 1980, с.124]. Поэтому примем следующую формулировку данного принципа: каждый морф – гипотетически вычленяемый элемент слова – должен иметь статус морфемы (это принцип «безостаточного разложения», см. [F.Wenzel 1973, с.17]).

(3) Принцип мотивации {Note 1}: каждая часть, выделимая в гипотетически членимой основе, должна мотивировать значение целой основы (случай прямого словообразования) или сама мотивироваться этим значением (при обратном словообразовании). В то же время морфный анализ не тождествен словообразовательному: для последнего играет решающую роль мотивированностъ деривата, для первого – принцип оптимальности.

{Note 1. Это переформулировка известного положения Г.О.Винокура [Г.О.Винокур 1959, с.422], согласно которому каждая часть, выделяемая в гипотетически членимой основе, должна мотивировать значение целой основы. Так, в слове конина морф кон выделяется, поскольку значение целой лексемы может быть дано так: «мясо коня»; в то же время, аналогичного членения лексемы буженина (как бужен-ина) нельзя допустить, оставаясь в рамках только этой версии данного принципа, поскольку невозможно аналогичное толкование типа «мясо бужена» (такое толкование, кстати, не соответствовало бы и истории слова буженина). А.И.Смирницкий [А.И.Смирницкий 1956, с.64], полемизируя с этим положением, на самом деле его уточняет: он указывает, что возможны и случаи обратного словообразования, когда более простое образование мотивируется более сложным. Между прочим, это довольно распространенный случай мотивированности сложносокращенных слов в русском языке. Тем не менее, если остаться в рамках принципа синхронности и данного принципа, придется согласиться с тем, что производная основа «существует лишь постольку и до тех пор, пока в языке имеется соответствующая ей непроизводная... Поэтому в составе слов с производной основой не могут быть одиночные непроизводные основы, но возможны и существуют единичные аффиксы» [Н.М.Шанский 1968, с. 74].}

(4) Принцип иерархичного составления (или «непосредственно составляющих»): «внутренняя зависимость между производящими и производными словами разных степеней обнаруживается в последовательном, а не одновременном присоединении морфем» [Г.О.Винокур 1959, с.440]. Так, обычно корень и суффиксы более тесно спаяны

-56-

между собой, чем префикс и основа [В.В.Лопатин 1977].

(5) Принцип лексикологичности: необходимо учитывать семантические связи слов, лексические соотношения разных словесных рядов, а не связанность одной только пары «мотивирующее – мотивируемое» [В.В.Виноградов 1975, с.199].

(6) Принцип взаимозаменимости, или вхождения в ряд [F.Wenzel 1973, с.17]: морф выделяется в основе, если он может быть заменен на другой морф или если он может появляться изолированно от левого или правого своего окружения, так, что получаемая в результате такой замены новая единица входит в своеобразную семантическую (словообразовательную) парадигму (в смысле [В.В.Лопатин 1974, с.58]; ср. [Г.С.Чинчлей 1980, с.331). Г.О.Винокур [Г.О.Винокур 1959] этот принцип сочетает с принципом мотивации (без учета обратного словообразования), А.И.Смирницкий [А.И.Смирницкий 1956], видимо, придавал ему самостоятельный статус.

(7) Принцип структурности: «Слово должно рассматриваться на фоне родственных и одноструктурных слов, а также в совокупности всех присущих ему грамматических форм... Словообразовательная структура слова должна анализироваться с учетом существования в языке омонимии слов и морфем и омонимии словообразовательной формы» [Н.М.Шанский 1968, с.74]. Необходимо также учитывать специфические особенности структуры слов в данном языке в целом [Н.М.Шанский 1968, с.74].

(8) Принцип допускаемой неоднозначности: одно и то же слово может члениться поморфно несколькими способами (случай структурной омонимии) [F.Wenzel 1973].

(9) Принцип двуглавости анализа: морфное членение слова – результат двух операций, одна из которых – рассечение слова на две или более части, а другая – опознание (или неопознание) хранимых морфов в получаемых частях, – соответственно отнесение этих частей к тем или иным классам морфов [F.Wenzel 1973, с.17].

(10) Принцип двуаспектности структуры: необходимо различать парадигматическую и синтагматическую соотнесенность морфа

-57-

в составе целой словоформы [Т.В.Булыгина 1977, с.174] {Note 1}.

{Note 1. Парадигматический аспект связан с рассмотрением внутреннего соотнесения словоформ одной лексемы, «которое определяет в высшей степени абстрактное содержание каждой словоформы (по типу так называемых «минимальных определений», т.е. при помощи признаков, необходимых и достаточных, чтобы отличить одну словоформу от другой)» [Т.В.Булыгина 1977, с.147]. Синтагматический аспект учитывает «сложное взаимодействие самых разнообразных факторов, действие которых проявляется только на уровне предложения» [Т.В.Булыгина 1977, с.174].}

(11) Принцип универсальности охвата: морфный анализ только тогда удовлетворителен, когда он охватывает все слова, разделимые на значимые элементы [И.Г.Милославский 1980, с.30].

(12) Принцип минимальности: «Вычленяемые значимые элементы должны быть минимальны по форме в том смысле, что любое последующее деление не создает новых равноправных значимых частей» [И.Г.Милославский 1980, с.30]. Это частный случай принципа оптимальности.

В том виде, в каком эти принципы сформулированы, они иногда кажутся противоречащими друг другу. Например, принцип минимальности и принцип мотивации ограничивают сферы приложимости друг для друга. Так, в словах типа малина и барышня, в соответствии с принципом мотивации, не выделимы корни мал и бар: толкование указанных лексем не опирается на значение корней мал и бар (в частности, барышня – не дочь барина, хотя исторически это было так). Однако эти же морфы выделимы по принципу минимальности. Итак, то, что с исторической точки зрения представляет собой сочетание морфов – мал+ ин(а), бар+ыш-н(я), – в синхронном отношении (скажем, при сопоставлении членов лексического ряда) может представлять собой один неделимый морф – малин(а), барышн(я).

Далее мы попытаемся продемонстрировать такой подход, при котором противоречие принципов имеет место только тогда, когда смешиваются различные уровни морфологического анализа.

4.7. Три уровня морфемного анализа

Предположим, что получен (полный или неполный) «рабочий список» морфов. Введем следующие дополнительные разграничения. Различаются три списка морфов: минимальный, фундаментальный и реальный.

Первый из них – список морфов первого уровня, или «миниморфов», устанавливается на основе выявления различительности.

-58-

Миниморфы гипотетически выделяются в соответствии с принципами универсальности охвата и минимальности. Так, в лексеме избирательные выделяется префиксальный морф первого уровня из, поскольку в этой же позиции может быть другой префиксальный морф вы, от и т.п. Выделяется, далее, корневой морф первого уровня – бир, поскольку вместо него может быть подставлен другой корневой морф типа ыск (ср. изыскательный). О причинах выделения ат, ел, ьн говорилось выше. Список миниморфов, кроме того, составляется на основании принципов интерпретации, взятых как дезидерат (т.е. в предположении, что мы уже построили систему МИ, которая интерпретирует данное слово), и дистрибутивных свойств гипотетических морфов. Незаменимым подспорьем в этом являются исторические и этимологические словари, сопоставляющие лексемы по отношению различительности (иногда эта различительность, впрочем, «разнесена» по времени). Такой список не претендует на оправданность с синхронной точки зрения; он обладает эвристической ценностью только постольку, поскольку в нем фиксированы звуковые оболочки морфов, в привязке ко всем тем реальным лексемам современного словаря, в которые эти морфы входят.

Минимальный список удобно представить как набор «пятиединств» – таких единиц («строк», которые состоят из следующих элементов: а) порядковый номер строки; б) миниморф; в) лексема (одна), разбитая на морфы, один из которых – данный миниморф; г) указание на грамматические свойства (класс склонения, спряжения, ударения и т.п.); д) класс морфа в составе данной лексемы (одна из следующих возможностей: префикс, корень, суффикс, «соединитель» типа о в лексеме пароход, флексия, постфикс – типа ся/сь возвратных глаголов, -таки и т.п., – и дефис). Две строки могут различаться, в частности, только позицией заглавного миниморфа в одной и той же лексеме. Так, если заглавный морф – о, – то лексема пароходостроение образует относительно него две различные строки (соответственно количеству соединительных гласных о).

Примеры строк минимального списка (символом @ помечается конец корня, = – суффикса, _ – префикса, # – окончания, / – соединительная гласная):

1028 пар пар@о/ход@ м1а корень 2058 пар о_пар@а# ж1а корень

2058 пар о_пар@а# ж1в корень

-59-

3085 о пар@о/ход@ м1а соед.гл. 3095 о о_пар@а# ж1а префикс

3095 о о_пар@а# ж1а префикс.

Список второго уровня – «фундаментальный» – получается в результате преобразования минимального списка и представляет собой набор шестерок: к каждой пятерке минимального списка добавляется шестой элемент, указывающий номер морфемы, к которой относится заглавный морф. Тем самым задается отношение идентичности между алломорфами одной морфемы. Итак, в фундаментальном списке миниморфы, входящие в разные лексемы, но относимые к одной и той же морфеме, имеют одинаковые морфемные номера (в шестой позиции), а миниморфы, в конкретной позиции в составе конкретной же лексемы относимые к различным морфемам, имеют различные морфемные номера. Так, миниморф иск в составе лексемы искатель имеет тот же морфемный номер, что и миниморф иск в составе лексем поиск и доискаться, а также тот же морфемный номер, что и ыск в составе лексемы разыскивать. С другой стороны, лук/луч в составе лексем луковый, луковица, лучок образуют шестерки с морфемным номером иным, чем лук/луч в составе лексемы лучник. Аналогичное верно и для пар миниморфов, один из которых – исконно русский, а другой – заимствованный. Фундаментальный список отражает панхронию (а не синхронию) и близок по составу этимологическому списку морфем. Примеры строк этого списка:

4235 иск при_иск@ат=ел=ь# мо2а 4235

4250 иск по_иск@ мЗа 4235

6925 ыск раз_ыск@ив=а=тъ# нсв1а 4235

Наконец, третий список – «реальный» – получается из фундаментального в результате автоматической операции «склеивания» (эта операция соответствует понятию «конглютинации» у Е. Куриловича [Курилович 1962а], однако имеет несколько иной смысл у нас). Назовем переходные списки, начиная с фундаментального и вплоть до окончательного – реального – промежуточными списками, а элементы этих переходных списков – промежуточными элементами. «Склеивание» состоит в следующем. Префиксальный морф, в промежуточном списке (в частности, в фундаментальном) сочетающийся только с одним единственным из всех возможных корневым морфом, «склеивается» с ним: этот префикс вычеркивается из списка морфов, при соответствующей корректировке информации

-60-

при склеиваемом с ним корне (сами лексемы, в состав которых эта склеиваемая пара префикс + корень входит, переанализируются таким образом), и новый промежуточный список морфов содержит новый, более длинный корневой морф, наследующий от прежнего фундаментального префикса все возможности словообразования. Другой вид склейки – в тех случаях, когда корень способен сочетаться ровно с одним конкретным суффиксом и не может появляться без суффиксов и префиксов вообще. Наследником, как и в предыдущем случав, является корневой морф (представляющий собой указанный промежуточный корень плюс суффикс): это соответствует традиции соотнесения этимологического и синхронного анализа (см., например [В.А.Богородицкий 1904-35]).

Во всех случаях склейка – операция рекурсивная: после того, как корень склеен с суффиксом, новый корень может быть и дальше склеен с другими суффиксами или префиксами. Еще один вид склеивания – аналогичный предыдущим – приводит к выявлению уникальной, т.е. неразличительной, сочетаемости суффиксов; в результате склеенными оказываются группы суффиксов, в новом промежуточном списке имеющие статус отдельного морфа («группового суффикса», в смысле [Курилович 1962а]).

Реальный список морфов – это такой «промежуточный», в котором далее невозможны никакие склейки: в нем все морфы позиционно противопоставлены друг другу в синхронии. Количество морфов, содержащихся в реальном списке, заведомо не больше количества морфов в фундаментальном списке, а средняя длина морфов (в морфофонемах или в буквах) у единиц реального списка заведомо не меньше, чем у единиц фундаментального списка. Это уменьшает необходимое количество шагов при такой МИ словоформ, которая опирается на этот реальный список (но, разумеется, информация в базе данных морфов для МИ имеет иной вид; см. раздел 4.3). Реальный список дает синхронную морфную структуру словаря, на нем основывается МИ; это промежуточная ступень между этимологическим и словообразовательным словарями.

Итак, из списка минимальных морфов получается фундаментальный список, из которого в результате чисто формальных процедур получается реальный список. Переходя от одного списка к другому, мы протоколируем те шаги морфологического анализа словаря, которые человек-морфолог обычно осуществляет в результате многократного обращения к современным и историческим

-61-

словарям, а также в результате многократных ревизий собственного промежуточного результата. Использование возможностей ЭВМ значительно облегчает решение этой задачи в ее процедурной (не содержательной) части, гарантируя аккуратность сортировки и внутреннюю непротиворечивость окончательного результата. Поэтому задача алгоритмизации в этом направлении состоит в том, чтобы выявить и воплотить в виде формальных процедур те операции, с помощью которых можно прийти к интуитивно приемлемому реальному списку, удовлетворительному также и для эксплуатации в рамках МИ.

Однако отношение «мотивации» реальным списком не отражается, а используется в самом процессе интерпретации словоформы. В результате МИ получается набор гипотез о морфном строении словоформы, продуктивные (семантические) преобразования позволяют одновременно с МИ (см. выше «принцип параллельности») получить для лексемы структуру непосредственно составлявших в терминах морфного анализа. С мотивированностью мы имеем дело тогда, когда для получения значения целого (представленного как набор непосредственно составляющих) достаточно обратиться к продуктивным правилам: единицы (морфы и уже проинтерпретированные части текста), непосредственно составляющие это целое, мотивируют значение целого, в смысле «принципа мотивации». Когда же продуктивных правил недостаточно, – а именно, когда соотнесенность между целым и входящими в него уже проинтерпретированными частями слова задается не в виде абстрактной формулы, а при прямом указании на входящие единицы (т.е. при прямом упоминании морфов), то речь вдет об уникальных правилах при получении интерпретации слова. Поэтому, получая реальный список морфов, вовсе не обязательно требовать, чтобы склейка учитывала и отношение мотивации. Например, в реальном словаре могут содержаться морфы мал, ин, а, буж, ен, ин, что не помешает соблюдению принципа мотивации в процессе самой МИ.

Итак, принцип мотивации соблюден и в описанном подходе, но на более глубоком – процедурном – уровне рассмотрения словообразования: на том уровне, на котором противопоставлены продуктивные и уникальные правила для всех видов баз данных, а не только для базы данных для морфов.

-62-

Проанализировав понятие морфологической интерпретации и следствия, вытекающие из представлений об интерпретации как процессе, а также из существующих концепций морфологического анализа, мы приходим к выводу, что принципы интерпретации и принципы морфологического членения не только не противоречат друг другу, но напротив, – при предлагаемом решении – дополняют друг друга и органично переплетаются.

./bars/image002.gif

5. ОБ ОПРЕДЕЛЕНИИ ПОНИМАНИЯ

5.1. Модули понимания

Слово «понимание» настолько привычно в обыденной речи, что ему иногда отказывают в праве на терминологичность. А ведь исследование языка и моделирование речевой деятельности – это выяснение того, какими языковыми и внеязыковыми средствами достигается понимание. Рассмотрим эту проблему с точки зрения интерпретирующего подхода {Note 1}. Понимание определяется в такой концепции через «модули понимания» – составные части единого процесса, каждая из которых образует относительно независимую подзадачу. Кратко опишем девять следующих модулей.

{Note 1. Обзор литературы по этой проблеме содержится в статье: [Демьянков 1983а] и здесь опускается.}

(1) Модуль использования языкового знания. Понимание – это то, что объединяет автора высказывания и его адресата, в этом смысле понимание и язык рядоположены (о факторе адресата см. [Н.Д.Арутюнова 1981]). В связи с этим имеем две характеристики: степень уверенности в знании языка высказывания (не всегда адекватная реальной компетентности в данном языке) и степень «языковой закрепленности». В последнем отношении противоположными полюсами являются: жестко установленный код, исключающий какие-либо новые знаки, в совершенно неизвестный интерпретатору язык. Реально же понимание происходит при одной из промежуточных степеней закрепленности.

(2) Модуль выдвижения и верификации гипотетических интерпретаций. Понимая речь, мы не ждем, пока предложение закончится, чтобы начать его анализировать: понимание параллельно

-63-

линейному развертыванию речи. В силу линейности речи, сложные отношения между членами структуры (высказывания, дискурса и т.п.) подаются в «сплющенном» линеаризованном виде. Адекватное понимание поэтому связано с распознаванием истинных иерархий в высказывании, с переосмыслением ранее сказанного и понятого, а также с выстраиванием интерпретаций по шкале правдоподобия. Очевидно также, что чем дольше мы общаемся с одним и тем же автором, тем легче понимание. Привычность – одна из характеристик данного модуля.

(3) Модуль «усвоения» сказанного. При понимании чужой речи «модельный мир» строится по конкретному высказыванию из внутренних ресурсов интерпретатора, а не берется поэлементно из чужого внутреннего мира (это переформулировка известного «закона Гумбольдта – Потебни»). Модальный мир может существовать параллельно внутреннему миру (моментальному срезу внутренней жизни интерпретатора), а иногда и полностью собой его замещать, например, когда мы с головой уходим в чтение. Те связи, которые в таком модельном мире устанавливаются, позволяют в различной степени легко и оперативно его резюмировать и достраивать, в результате чего над ним создается «поле напряжения», отражающее иерархию существенности его элементов. В этой связи можно говорить о степени реалистичности (или, наоборот, фантастичности) понимания, о правдоподобии, контрасте модельного мира и внутренней жизни интерпретатора, о «поле напряжения» интерпретации и об активности понимания.

(4) Модуль реконструкции намерений автора. Эта задача решается при обыденном понимании в двух направлениях: а) установление того, что имеется в виду в высказывании (и, возможно, выражено неадекватно, скажем, вследствие слабой компетентности в языке), и б) распознавание стратегического замысла говорящего. И в том и в другом случае понимание состоит в построении «микротеорий» интерпретатора о «намерениях (целях и мотивах) высказываний». Характеризовать понимание в рамках данного модуля можно с точки зрения степени «остраненности» [Ю.С.Степанов 1981а] (минимальная «остраненность» – в случае эмпатии, когда, понимая другого, мы пытаемся посмотреть на вещи его глазами) и степени теоретичности, или «глубины».

(5) Модуль осознания степени нетождественности внутреннего и модельного миров. Легкость понимания определяется не

-64-

только количеством средств, затраченных на достижение понимания, но и задачами общения: чисто количественная сторона, определяемая «расходами» языковых средств на достижение понятности, может быть названа рентабельностью понимания и определяет границы терпимости к неточностям выражения, а также к трудностям усвоить сказанное.

(6) Модуль осознания отношений внутри модельного и внутреннего миров. Это задача установления поля напряжения в рамках модельного и внутреннего миров (см. выше). Эти отношения по-разному осознаются и по-разному «высвечены» в конкретной интерпретации. В граничном случае связи могут оставаться вне основного фокуса внимания; противоположный же случай – когда именно эти связи и являются фокусом внимания. Соответственно различаются фокус понимания и фон понимания. Последний создается в результате вложения неосознанных презумпций интерпретатора в модельный мир.

(7) Модуль соотнесения модельного мира и информационного запаса знаний о действительности. В результате интерпретирования информационный запас обычно (а не изредка, как это предполагается в некоторых системах обработки естественного языка) меняется. Понимание без такого изменения – это такой крайний случай, который бывает, когда одно и то же повторяют в тысячный раз. Степень изменчивости информационного запаса, его лабильность, характеризует данный модуль.

(8) Модуль соотнесения интерпретации с линией поведения интерпретатора. Часто понимание приравнивают невысказанному ответу. Однако это только один из видов направленности понимания. Другие способы соотнесения с собственным поведением включают проявление (в собственной речи) знания обсуждаемого вопроса, способность запомнить смысл обращенных к понимающему реплик, способность задавать вопросы и т.п.

(9) Модуль выбора тональности. Поскольку понимание как взаимодействие модулей неоднородно, интерпретатор должен как-то соотносить их между собой. Делается это путем выбора тональности, обеспечивающей целостность понимания. Такая тональность определяет взаимодействие модулей на протяжении более или менее длительного эпизода понимания. Тональность может меняться, когда по одному из модулей, в рамках названных их характеристик, происходит передвижка. Так, на разных этапах

-65-

общения мы в различной степени проникаемся согласием и симпатией по отношению к точке зрения собеседника. Может меняться наше понимание и по степени активности. Итак, характеристикой данного модуля является степень постоянства тональности на протяжении конкретного временного отрезка.

5.2. Понимание как единый процесс

Рассмотрев модули, мы можем теперь понимание определить как процесс и результат взаимодействия «модулей». Такое взаимодействие допускает рекурсию и параллелизм операций. Кроме того, возможен диссонанс между модулями.

В общем же случае понимание представляется следующим образом. Интерпретируя выражение, мы обращаемся к нашим языковым знаниям, получаем модельный мир, включенный в рамки нашего внутреннего мира, с одной стороны, и в рамки реконструируемого внутреннего мира автора речи, с другой; примерно так же выглядит и выявление замысла высказывания. Модельный мир мы сопоставляем с собственным внутренним миром, в разной степени нами осознаваемый. Модельный мир, собственный внутренний мир и информационный запас (а точнее, «теорию действительности») мы корректируем в результате соотнесения их между собой. Результат этого ориентирует нас в собственных действиях, как речевых, так и неречевых. Интерпретация подчинена принципам интерпретации и протекает как построение и верификация гипотез-экспектаций (о принципе гипотетической интерпретации см. выше). Взаимодействие модулей и их настрой определяют различные тональности понимания, меняющиеся от одного эпизода к другому.

./bars/image002.gif

6. ЗАКЛЮЧЕНИЕ

Последние 20 лет в центре внимания вычислительной лингвистики находится вопрос о моделировании той деятельности человека, результатом которой является речь. Однако если в начале этого периода больший интерес, как правило, вызывали исследования, исходящие из точки зрения говорящего {Note 1}, то, начиная

-66-

с 1970-х годов и вплоть до настоящего времени все чаще и чаще делаются попытки построить модель понимания. Такое изменение интересов связано с тем, что подход к пониманию как к простой перекодировке поверхностных (наблюдаемых) структур в «смысловые репрезентации» стал представляться все менее и менее вероятным. Произошел постепенный переход от «лингвистики говорящего» к «лингвистике понимающего», что, в свою очередь, объясняет тенденцию к интерпретационистскому объяснению.

{Note 1. Тогда предполагалось, что если нам известны механизмы говорения, то тем самым можно автоматически объяснить и понимание – это подход «понимание через гипотетический синтез».}

При всем многообразии современных концепций общение стали характеризовать как то, что связывает двух иди большее число личностей, говорящих и одновременно интерпретирующих как чужую, так и собственную речь. Интерпретация – это процесс, в конечном итоге расцениваемый как понимание, недопонимание, недоразумение и т.д.; шкала такой оценки непрерывна и не ограничивается полярными точками. Причем процесс этот заключается не в «переводе» выражения-объекта в смысловую структуру, а в построении и проверке гипотез о такой структуре, о том, насколько одни структуры более вероятны по сравнению с другими, и даже о том, стоит ли дальше пытаться интерпретировать поступающие сообщения. В «перекодировочной» концепции обычно исходят из неизменности ключа к шифру, в интерпретирующем же подходе вполне допускается случай, когда по ходу понимания речи воспринимающая сторона постепенно меняет ту базу знаний, на которую она опирается.

Переход на рельсы интерпретационизма произошел, кроме того, под действием следующих факторов: 1) было установлено, что формальные грамматики «синтезирующего» типа гораздо менее мощны, чем аналогичные «анализирующие» грамматики (т.е. анализирующая грамматика в состоянии распознать множество предложений зачастую значительно более мощное, чем то, которое аналогичная синтезирующая порождающая грамматика может построить); 2) трансформационная грамматика оказалась устройством только для синтеза допустимых цепочек, но не для распознавания их; 3) мощность множества предложений любого реального человеческого языка значительно больше мощности любой конечной порождающей грамматики синтезирующего вида [Langendoen, Postal 1984]; 4) стало ясно, что понятие «правило грамматики» следует рядоположить с принципами, соглашениями, стратегиями продуцирования

-67-

и восприятия, с запретами (ограничениями) на структуры и т.п., т.е. с тем, что гарантирует «обратную связь» говорящего со своей речью.

Наконец, в рамках «синтезирующих» грамматик «намерение» приходится либо выносить за скобки языковой компетенции {Note 1}, либо определять как то, что дано целиком и сразу, коль скоро задана полная семантическая структура предложения (приравнять языковому значению). Тогда трудно разграничить значение предложения в замысле говорящего и реальное значение предложения (что реально удалось сказать говорящему, – в его собственной интерпретации или в интерпретации адресата). Так, пытаясь сделать комплимент, мы не всегда, но все же можем обнаружить неуместность, двусмысленность или нежелательность выводов из него.

{Note 1. Недаром столь прохладно отношение генеративистов к «теории речевых актов», опирающейся на понятие намерения, заключенного в коммуникативной – «воздействующей» – силе речи.}

Карикатурой, в значительной степени справедливой, на антиинтерпретирующий подход была бы сцена бесцельного общения двух глухих говорунов по телефону. Карикатура же на интерпретационизм выглядела бы тогда как случай, когда общаются два молчащих интерпретатора, внимательно следящих друг за другом и за малейшими изменениями в неменяющейся, в итоге, ситуации (ибо они оба не в состоянии ничего сказать). Действительно, владение языком без намерений что-либо сказать – столь же драматическая ситуация, как и отсутствие собеседника, способного тебя понять (ср.: есть чем сказать, но сказать нечего – и есть что сказать, но некому).

Впрочем, по отношению к интерпретационизму такая карикатура была бы не совсем справедливой потому, что в само понятие интерпретации-процесса уже включены элементы интенциональности; выработка гипотез-ожиданий, оценка, подтверждение или опровержение гипотез, обращение к базе собственных знаний (при возможном изменении этой базы), корректировка установок к сообщаемому, к собственным презумпциям, – все это предполагает активность воспринимающей стороны. Тем не менее, вопрос о движущих силах в продуцировании речи остается открытым.

-68-

Попытаемся очертить перспективы теории интерпретации в отношении к понятию намерения.

Коммуникация в рамках теории интерпретации обладает многими аспектами, среди которых – столкновение намерений и их интерпретация каждой из общающихся сторон. Намерение может быть связано как с мотивами поведения говорящего (при понимании намерений), так и с тональностью понимания. В первом случае интерпретация речевых действий направлена, например, на выяснение истинных намерений, на устранение неоднозначности в интерпретации намерений и т.п. Во втором же случае оказывается та ига иная степень симпатии, проявляемая к говорящему со стороны адресата, приводящая к готовности более или менее благожелательно и подробно истолковать смысл речи (в частности, оценить намерения говорящего). Собственные планы интерпретатора сказываются и на степени подробности понимания обращенных к нему речей, т.е. на заинтересованности в понимании.

Намерение в речевом поведении обладает следующими параметрами: а) степень преднамеренности в выполнении заранее запланированного действия (ср. намерение оскорбить, употребить конкретный термин, понравиться, сообщить и т.п. – в противоположность непреднамеренным оговоркам, ошибкам памяти, болтливости и т.п.); б) выбор действий (происходит либо в рамках принятых «соглашений» – конвенций данного социума, в той или иной мере уместных в конкретном случае, – либо же при заведомом отказе от следования этим соглашениям); в) психологическое состояние, интерпретируемое как «желание» или «воля» (намерение в таком случае противопоставлено «невольным» действиям, искренность – это соответствие психологического состояния говорящего его собственным высказываниям либо в собственной оценке говорящего, либо по мнению другого человека; при совпадении этих оценок имеем «кооперированную искренность»); г) предвидение результатов данного речевого действия; д) степень контролируемости действий, их привычность, главным образом, связанная с навыками речи, а не со знаниями (последние относятся к параметру выбора действий).

Стратегический комплекс (замысел) говорящего – это осознанный комплекс намерений, имеющийся еще до их реализации и используемый по ходу речевых действий. Это означает преднамеренность

-69-

в выборе вполне определенного набора действий, на фоне конкретного же и постоянно меняющегося набора психологических состояний, что сопровождается «просчитыванием» последствий будущих действий, при презумпции той или иной степени контролируемости постоянно меняющейся ситуации общения. Ясно, что стратегические комплексы не всегда лежат за речевыми действиями. Кроме того, можно уже до осуществления стратегического замысла оценить свои будущие действия как дурные или благие, запланировать требуемую дозу искренности (или, наоборот, наигранности) и даже отказаться от выполнения своих замыслов.

Осуществление же стратегий в реальном общении обладает двумя важными аспектами: а) стадиальность осуществления (начало, воплощение, завершение и т.д.; иногда уже в начале говорящему становится ясен провал его планов, – тогда обычно следующей стадией бывает «ретировка» – отступление с боем или без боя); б) соотнесенность «атакующих» и «оборонительных» действий. Стратегический комплекс взаимодействует, как минимум, с тремя другими – внестратегическими – комплексами при каждом конкретном акте общения: с комплексом конвенций данного социума, с комплексом личности говорящего и с комплексом личности партнеров по общению с данным говорящим в оценке последнего.

В различных эпизодах осуществления стратегического замысла в речи параметры намерения проявлены бывают в разной степени. Намерение, понимаемое в рамках теории интерпретации, позволяет выйти за пределы одного отдельно взятого высказывания и даже группы высказываний: то, что можно назвать «речевой жизнью» человека, может быть проинтерпретировано как смена стратегических и внестратегических комплексов, с их внутренней организацией. Моделирование модулей понимания и речевых намерений – это одна из ближайших задач теории интерпретации в рамках вычислительной лингвистики.

В данной работе речь шла только об основах общей теории интерпретации. Специальные теории интерпретации воплощают общие положения в виде конкретного понятийного и формального аппарата. Наконец, прикладная теория интерпретации решает принципиальные проблемы специальной теории в рамках систем, обрабатывающих и создающих тексты на естественном языке. Думается, именно такой прикладной теории принадлежит будущее в вычислительной лингвистике.

-70-

./bars/image002.gif

Литература

(с.70-74)

Арутюнова Н.Д.
1981
Фактор адресата //ИАНСЛЯ 1981, Т.40, № 4, 356-367.

Богородицкий В.А.
1904-35
Общий курс русской грамматики: (Из университетских чтений). – Изд-е 5-е, перераб. – М.-Л.: Соцэкгиз, 1935.

Булыгина Т.В.
1977
Проблемы теории морфологических моделей. – М.: Наука, 1977.

Вейценбаум И.
1970
Понимание связного текста вычислительной машиной //Распознавание образов: Исследование живых и автоматических распознающих систем / Пер. с англ. М.: Мир, 1970. С.214-245.

Виноград Т.
1976
Программа, понимающая естественный язык. – М.: Мир, 1976.

Виноградов В.В.
1975
Избранные труды: Исследования по русской грамматике. – М.: Наука, 1975.

Винокур Г.О.
1959
Избранные работы по русскому языку. – М.: Госучпедгиз, 1959.

Вудс В.
1976
Сетевые грамматики для анализа естественных языков / Пер. с англ. //Кибернетический сборник. Вып. 13. М.: Мир, 1976. С.120-158.

Демьянков В.З.
1978
Метод построения системы автоматического лингвистического анализа наименований экономических показателей в ИПС. использующей естественный язык. – М.: Изд-во Моск. ун-та, 1978.

Демьянков В.З.
1979
Англо-русские термины по прикладной лингвистике и автоматической переработке текста: Порождающая грамматика. – М.: Изд-во Всесоюзного центра переводов, 1979.

Демьянков В.З.
1979а
Формализация и интерпретация в семантике и синтаксисе (по материалам американской и английской лингвистики) //ИАНСЛЯ, 1979. Т.39. № 3. С.261-269.

Демьянков В.З.
1980а
Теория интерпретации в прикладной лингвистике //Проблемы вычислительной лингвистики и автоматической обработки текста на естественном языке. М.: Изд-во Моск. ун-та, 1980, с.125-158.

Демьянков В.З.
1982б
Англо-русские термины по прикладной лингвистике и автоматической переработке текста: Вып.2. Методы анализа текста. – М.: Всесоюзный центр переводов ГКНТ и АН СССР, 1982.

Демьянков В.З.
1982в
Морфологическая интерпретация текста и структура словаря //Вопросы кибернетики: Общение с ЭВМ на естественном языке. М.: Научный совет по комплексной проблеме "Кибернетика", 1982. С.75-91.

Демьянков В.З.
1982г
Понятие гипотетической интерпретации в морфологии //Вычислительная лингвистика: Теоретические аспекты, вопросы автоматизации лексикографических работ. М.: МГУ, 1982. С.31-73.

Демьянков В.З.
1983а
Понимание как интерпретирующая деятельность //ВЯ, 1983. № 6. С.58-67.

Кузичева З.А.
1978
Математическая логика //Математика XIX века. – М.: Наука, 1978. С.11-38.

Курилович Е.
1962а
Очерки по лингвистике: Сборник статей. – М.: ИЛ, 1962.

Лопатин В.В.
1974
Словообразование как объект грамматического описания //Грамматическое описание славянских языков. – М.: Наука, 1974..

Лопатин В.В.
1977
Русская словообразовательная морфемика: Проблемы и принципы описания. – М.: Наука, 1977.

Льюиз Д.
1983
Общая семантика // Ю.С. Степанов ed. Семиотика. – М.: Радуга, 1983. 253-284.

Милославский И.Г.
1980
Вопросы словообразовательного синтеза. – М.: Изд-во Моск. ун-та, 1980.

Смирницкий А.И.
1956
Лексикология английского языка. – М.: ИЛ, 1956.

Степанов Ю.С.
1981а
В поисках прагматики (Проблема субъекта) //ИАН СЛЯ 1981. Т. 40, № 4..

Хинтикка Я.
1980
Логико-эпистемологические исследования: Сборник избранных статей. – М.: Прогресс, 1980.

Чинчлей Г.С.
1980
Вопросы тождества морфемы и супплетивизм. – Кишинев: Штиница, 1980.

Шанский Н.М.
1968
Очерки по русскому словообразованию. – М.: Изд-во Моск. ун-та, 1968.

Шенк Р.
1975
Обработка концептуальной информации /Пер. с англ. – М.: Энергия, 1980.


Bennett A.T., Hartmann B.R.
1979
A linguistic phenomenology of therapy talk // BLS 1979, v.5, 525-538.

Bresnan J.
ed. 1982
The mental representation of grammatical relations. – Cambr. (Mass.); L.: MIT, 1982.

Brown G., Yule G.
1983
Discourse analysis. – Cambr. etc.: Cambr. UP, 1983.

Cercone N.
ed. 1983
Computational linguistics. – O. etc.: Pergamon, 1983.

Cole P.
ed. 1978
Pragmatics. – N.Y. etc.: Acad. Press, 1978.

Colby K.
1975
Artificial paranoia: A computer simulation of paranoid processes. – N.Y.: Pergamon, 1975.

Cresswell M.J.
1973
Logics and languages. – L.: Methuen, 1973.

Dahl Ö.
1976
What is new information? // N. Enkvist, V. Kohonen eds. Reports on text linguistics: Approaches to word order. – Åbo: Åbo Akademi, 1976. ..

DeJong G.F.
1979
Skimming stories in real time: An experiment in integrated understanding. Ph.D.d., New Haven, Yale U., 1979.

Dowty D.R.
1979
Word meaning and Montague grammar: The semantics of verbs and times in generative semantics and in Montague's PTQ. – D.etc.: Reidel, 1979.

Earley J.
1970
An efficient context-free parsing algorithm // CACM 1970, v.13, N 2, 94-102.

Frege G.
1962
Funktion, Begriff, Bedeutung: Fünf logische Studien /Hrsg. und einleitung von G.Patzig. – Göttingen: Vandenhoek & Ruprecht, 1962.

Friedman J., Warren D.S.
1978
A parsing method for Montague grammar // LaP 1978, v.2, N 3: 347-372.

Gazdar G.
1981
Unbounded dependencies and coordinate structure // LI 1981, v.12, N 2: 153-184.

Grice P.
1978
Further notes on logic and conversation // P. Cole ed. Pragmatics. – N.Y. etc.: Acad. Press, 1978.
113-127. (Also // P. Grice Grice P. Studies in the way of words. – Cambr. (Mass.); L.: Harvard UP, 1989. 41-57).

Hammer K.
1981
Rethinking our linear bias // C.S. Masek ed. Papers from the parasession on language and behavior. – Chicago (Ill.): U. of Chicago Press, 1981. 115-132.

Heidorn G.E.
1974
English as a very high level language for simulation programming // Sigplan_Notices 1974, N 9, p.91.

Hofmann T.R.
1979
What some semantic theories can't do // P. Clyne, W.H.C. Hanks eds. The elements: A parasession on linguistic units and levels: April 20-21, 1979: Including papers from the Conference on Non-Slavic languages of the USSR (April 18, 1979) – Chicago: CLS, 1979. 60-67.

Jayez J.-H.
1982
Compréhension automatique du langage naturel: Le cas du groupe nominal en français. – P. etc.: Masson, 1982.

Katz J.J., Fodor J.A.
1963
The structure of a semantic theory // Lg. 1963, v.39, N 2 (pt.1): 170-210. Repr. // J.A. Fodor, J.J. Katz eds. The structure of language: Readings in the philosophy of language. – Englewood Cliffs (N.J.): Prentice Hall, 1964. 479-518.

Kay M.
1979
Functional grammar // BLS 1979, v.5: 142-158.

Keenan E.L.
1974
The functional principle: Generalizing the notion of subject of // CLS 1974, v.10: 298-309. (also // E.L. Keenan Keenan E.L. Universal grammar: 15 essays. – L. etc.: Croom Helm, 1987. 361-374.)

Keenan E.L.
1980
Passive is phrasal (not sentential or lexical) // T. Hoekstra, H.v.d.M.M. Hulst eds. Lexical grammar. – D: Foris, 1980. 181-213.

Kimball J.P.
1975
Predictive analysis and over-the-top parsing // J.P. Kimball ed. Syntax and semantics. – N.Y.; L.: Acad.Press, 1975. Vol.4. 155-179.

King M.
ed. 1983
Parsing natural language. – L. etc.: Acad. Press, 1983.

Kunze J.
ed. 1983
Probleme und Methoden der automatischen Sprachverarbeitung. – B.: Akademie, 1983.

Lakoff G., Thompson H.
1975
Introducing cognitive grammar // BLS 1975, v.1, 295-313.

Lakoff G., Thompson H.
1975a
Dative questions in cognitive grammar // R.E. Grossman ed. Papers from the parasession on functionalism. – Chicago (Illinois): CLS, 1975. 337-350.

Langendoen D.T., Postal P.M.
1984
The vastness of natural language. – O.: Blackwell, 1984.

Lauzière L.
1982
Le sens ordinaire des termes du droit // J. Gémar ed. Langage du droit et traduction: The language of the law and translation: Essais de jurilinguistique: Essays on Jurilinguistics. – Québec: Éditeur officiel du Québec, 1982. 39-47.

Lehmann W.P.
ed. 1978
Syntactic typology: Studies in the phenomenology of language. – Austin; L.: U. of Texas, 1978.

Lehnert W.G., Ringle M.H.
ed. 1982
Strategies for natural language processing. – Hillsdale (N.J.); L.: Erlbaum, 1982.

Lightfoot D.
1979
Principles of diachronic syntax. – Cambr. etc.: Cambr. UP, 1979.

Marcus M.
1980
A theory of syntactic recognition for natural language. – Cambr. (Mass.): MIT, 1980.

McCarthy J.
1960
Recursive functions of symbolic expressions // CACM 1960, v.3, 184-195.

Minsky M.
ed. 1969
Semantic information processing. – Cambr. (Mass.): MIT, 1969.

Montague R.
1974
Formal philosophy: Selected papers / Ed. by R.H.Thomason. – N.H.; L.: Yale UP, 1974.

Newell A., Simon H.A.
1956
The logic theory machine // IRE Transactions on information theory IT, 1956, v.2, N 3, 61-79.

Petrick S.
1965
A recognition procedure for transformational grammars. – Ph.D.d. MIT, 1965.

Power R.J.
1979
The organization of purposeful dialogues // Linguistics 1979, v.17, 107-152.

Quine W.V.O.
1969
Ontological relativity and other essays. – N.Y.: Columbia UP, 1969.

Rieger C.
1977
Viewing parsing as a word sense discrimination // W. Dingwall ed. A survey of linguistic science. – Greylock: .., 1977.

Schank R.C., Abelson R.
1977
Scripts, plans, goals, and understanding: An inquiry into human knowledge structures. – Hillsdale (N.J.): Erlbaum, 1977.

Schröder P., Steger H.
ed. 1981
Dialogforschung. – Düsseldorf: Schwann, 1981.

Sparck_Jones K., Wilks Y.
ed. 1983
Automatic natural language parsing. – Chichester: Horwood; N.Y. etc.: Halsted, 1983.

Stenning K.
1980
On why making reference out of sense makes it so hard to make sense of reference // Linguistics 1980, v.18, N 7/8, 619-633.

Waltz D.L.
1982
The state of the art in natural-language understanding // W.G. Lehnert, M.H. Ringle eds. Strategies for natural language processing. – Hillsdale (N.J.); L.: Erlbaum, 1982. 3-32.

Wenzel F.
1973
SPLIT: Ein Verfahren zur maschinellen morphologischen Segmentierung russischer Wörter. – München: Sagner, 1973.

Wilks Y.A.
1975
An intelligent analyser and understander of English // CACM 1975, v.18, N 5, 264-274.

Wilson N.L.
1959
Substances without substrata // RMet 1959, v.12, N 4, 521-539.

Woods W.A., Kaplan R., Nash-Webber B.
1972
The lunar sciences natural language information system: Final report. – Cambr. (Mass.): Bolt, Beranek & Newman, 1972.

Younger D.
1967
Recognition and parsing of context-free languages in time n3 // IC 1967, v.10, 189-208.