В.З. Демьянков

Морфологическая интерпретация текста и ее моделирование

This page copyright © 2003 V.Dem'jankov.

http://www.infolex.ru


ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ

ГЛАВА ПЕРВАЯ

МОРФОЛОГИЯ И МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ

1. "Морфология"

2. Объекты морфологии

3. Морфологическая теория

3.1. "Единица и упорядочение" (Item and Arrangement)

3.2. "Единица и процесс" (Item and Process)

3.3. "Слово и парадигма" (Word and Paradigm model)

3.4. Так какой же тип модели лучше?

4. Морфологическая система языка

5. Внешние и внутренние рубежи морфологии

5.1. Разделы морфологии

5.2. Морфосинтаксическая параметризация языков

6. Морфонологическая проблематика морфологии

6.1. Морфонология

6.2. Подразделение задач морфонологии

6.3. Статус морфонологической репрезентации

6.3.1. "Морфонема - реальность языка"

6.3.2. "Морфонема - фикция"

6.3.3. Так нужна ли морфонема?

6.4. Единство морфонологии

6.4.1. "Морфонология слита с фонологией"

6.4.2. "Морфонология - отдельный компонент"

6.4.3. "Морфонология слита с морфологией"

6.4.4. "Кусочечная морфология"

6.4.5. Так где же живут морфонологические операции?

ГЛАВА ВТОРАЯ

ЭКСПЕРТНАЯ СИСТЕМА МОРФОЛОГИЧЕСКИХ ЗНАНИЙ

1. Идея экспертной системы языковых знаний

2. Хранение и переработка знаний

3. Морфологическая интерпретация текста

4. Система распознавания слова

5. Принципы построения интерпретатора слов

6. Распознавание слова

6.1. Лексическая идентификация

6.2. Словоизменительная идентификация

7. Предварительный итог

ГЛАВА ТРЕТЬЯ

ФОРМАЛЬНЫЕ МОДЕЛИ МОРФОЛОГИИ

1. Морфология в начале "генеративной революции"

2. "Стандартная генеративная фонология"

3. "Естественная фонология"

4. "Лексикалистская гипотеза": лексикализм

5. Развитие лексикализма

5.1. Модель М.Халле

5.2. "Порождающая морфология"

5.3. Лексикализация синтаксиса

5.4. Обобщенный лексикализм

6. Направления критики лексикализма

7. "Просодическая морфология"

8. "Естественная морфология"

9. "Теория лексической структуры" Р. Либер

10. "Лексическая фонология" (Lexical Phonology)

10.1. Стратификация лексикона

10.2. Как работают правила?

10.3. Репрезентации в лексиконе

10.4. Критика "лексической фонологии"

ГЛАВА ЧЕТВЕРТАЯ

СЛОВОИЗМЕНЕНИЕ И СЛОВООБРАЗОВАНИЕ

1. Из истории разграничения

2. Критерии различения

3. Последствия разграничения для описания языка

4. Словоизменение и флексия

4.1. Интегративная функция флексии в словоформе

4.2. Как описывается словоизменение

4.3. Словоизменение как когнитивный процесс

5. Парадигма

5.1. Определение парадигмы

5.2. <Заглавное> слово

5.3. Основа слова и морфологическое единообразие

5.4. Предназначение парадигмы

5.5. Парадигма и лексикон

5.6. Парадигма как иерархия граммем

5.7. Принципы организации парадигм

ГЛАВА ПЯТАЯ

ЛЕКСИКОН В МОРФОЛОГИИ

1. Основания для группировки концепций лексикона

1.1. Наличие связей между статьями лексикона

1.2. Статус производных и непроизводных основ

1.3. Степень абстрактности

2. Что хранится в лексиконе

2.1. Лексикон морфем

2.2. Лексикон словоформ

2.3. Лексикон еще более крупных единиц

3. Р. Джеккендофф: "полный" и "обедненный" лексикон

4. Концепция лексической целостности

5. Лексикон как база данных

6. Как соотнесены лексические репрезентации

ГЛАВА ШЕСТАЯ

ГИПОТЕТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ В МОРФОЛОГИИ

1. Предварительные замечания

2. Принципы морфологической интерпретации

3. Работающая экспертная система

4. Словари языковых единиц

4.1. Лексикон как словарь морфем

4.2. Словарь основ

4.3. Словарь флексий

4.4. Словарь постфиксов

5. Списки, упорядочивающие единицы словарей

5.1. Парадигмы

5.2. Супплетивы

6. Списки "рабочих единиц"

6.1. Граммемы

6.2. "Корректоры"

6.3. "Ограничения"

6.4. Классы букв

6.5. Классы основ при флексии

6.6. Правила

6.7. Альтернации

6.8. Пометы парадигм

ЗАКЛЮЧЕНИЕ

ЛИТЕРАТУРА :

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА

Научно-исследовательский вычислительный центр

В.З. ДЕМЬЯНКОВ

МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ТЕКСТА

И ЕЕ МОДЕЛИРОВАНИЕ

Издательство Московского университета, 1994 (Электронная версия монографии, вышедшей небольшим тиражом)

ББК 81.1

Д 30

УДК 410.417.801

Рецензенты:

доктор филологических наук, профессор А.Е.Кибрик,

доктор филологических наук, профессор Б.Ю.Городецкий

Печатается по постановлению Редакционно-издательского совета

Московского университета

Демьянков В.З.

Морфологическая интерпретация текста и ее моделирование. – М.: Изд-во МГУ, 1994. – 206 с.

ISBN 5-211-03219-5

Учебно-методическое пособие посвящено морфологической проблематике создания экспертных систем лингвистических знаний. Дается обзор современного состояния разработки морфологических интерпретаторов, рассматриваются концепции и методы современной морфологии. Особенное внимание уделяется концепции универсальной морфологии, нашедшей применение в экспертной системе морфологических знаний, настраиваемой на параметры различных естественных языков.

Для студентов старших курсов и аспирантов, специализирующихся в области теоретического и прикладного языкознания, а также разработчиков систем искусственного интеллекта.

077(02) – 94 – заказное ББК 81.1

ISBN 5-211-03219-5 © Московский государственный университет, 1994

К оглавлению

ПРЕДИСЛОВИЕ

Как и интерпретация вообще, морфологическая интерпретация – истолкование словоформ – опирается на постоянно меняющуюся базу знаний.

Наилучшей моделью такого изменения является – при уровне научной технологии последних лет – экспертная система. Создание этой экспертной системы было основной нашей задачей.

Цель данной книги – тройная. Во-первых, описать основы морфологического моделирования. Во-вторых, дать преподавателям достаточный справочный материал по современным морфологическим теориям, особенно по теориям словоизменения (словообразованию мы надеемся посвятить не меньшую по объему работу). В-третьих, вкратце описать построенную нами оболочку экспертной системы лингвистических знаний.

В первой главе рассмотрены задачи теоретической морфологии, во второй – проблематика экспертных систем. Эти две главы вводят в нашу проблематику с двух разных сторон. В третьей главе описывается спектр "формальных моделей морфологии". Читатель должен сам решить, какой подход ему наиболее близок, мы не стремимся навязать ему свои вкусы.

В четвертой главе речь идет об основных проблемах словоизменения и о том, как обычно решают эти проблемы морфологи. В пятой же главе мы рассматриваем морфологические аспекты лексикона языка, в первую очередь, те, которые затрагивают морфологическую интерпретацию словоформы. Наконец, шестая глава посвящена нашей концепции морфологической интерпретации, устройству экспертной системы и приемам обращения с нею.

-4-

К оглавлению

ГЛАВА ПЕРВАЯ

МОРФОЛОГИЯ И МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ

К оглавлению

1. "Морфология"

Термин "морфология" как название раздела языкознания, занимающегося установлением и описанием морфемного состава конкретного языка [132, с.17], заимствован в 1859 г. Шлейхером из биологии [328, с.9] в понимании, близком к тому, что Гёте называл морфологией в естественных науках. Цель лингвистической морфологии – описание структуры слов, рассматриваемых как вторичная сущность. Эта структура определяется – подобно молекуле – как конфигурация "кирпичиков" смысла.

Это значение термина унаследовано и структурализмом, к задачам морфологии относившим устанавление разложимости слов – т.е. сегментирование и классифицирование мельчайших значимых элементов [132, с.17]. Поскольку "для знания слова говорящему нет необходимости знать, т.е. воспринять и усвоить в отдельности все словоформы, которыми оно может быть представлено" [42, с.22], морфологи с полным правом предполагают, что "слово (в общем случае) представляет собой комплексную знаковую единицу, то есть членится на элементы знакового характера" [6, с.31].

Каталогизировать мельчайшие элементы, установив законы их комбинирования, а тем самым исчислив все возможности языка, было в духе девятнадцатого века. Вспомним таблицу Менделеева. Судьба этой идеи в языкознании значительно сложней. Филологи давно уже отказались от надежды свести описание эволюции слов в индоевропейских языках к комбинированию четырехсот или пятисот базисных корней, тем самым разгадав секреты происхождения языка. А ведь именно так ставилась задача в Оксфордских лекциях Макса Мюллера [260]. История индивидуальных языков больше не рассматривается прямолинейно в дарвинистском русле, а сфера морфологии – да и языкознания в целом – больше не ограничивается историей языка [247, с.3]. Морфологией чаще называют более общий раздел языкознания, занимающийся "формами слов" в различных употреблениях и конструкциях [247, с.3].

Первоначальная идея каталога морфем (как теперь стало принято называть эти элементы языка) трансформировалась в попытки

-5-

более широкого взгляда на структуру языка, что привело к бурному и продуктивному развитию морфологических исследований в последние годы – см., например, обширную библиографию [71], охватывающую 1960-1985 гг. и содержащую в качестве индекса таксономию терминов морфологии.

К оглавлению

2. Объекты морфологии

Можно выделить три типа определений морфологии. Это – исследование:

1. Морфемного состава языка [132, с.17], то есть звуков и звуковых комплексов, связанных со значением и образующих "знаменательные (морфологические) части слов, каковы: корень, префикс, суффикс, окончание и основа; при этом она показывает, как язык пользуется ими для изменения слов по склонениям и спряжениям, а также для словопроизводства. Вместе с тем морфология группирует самые слова по характеру их значения и формы в те наиболее крупные разряды, которые известны под названием частей речи" [4, с.91]. Это значит, что морфология исследует отношения между минимальными языковыми единицами вместе с их семантическим содержанием [97, с.V]. Например, "то, что дает право смотреть на всякий звук или совокупность звуков речи, обладающие известным значением, как на морфемы вообще[…], как в данном языке создаются те отношения между морфемами разных типов, которые порождают слово с точки зрения его внутреннего устройства[…]; так, она изучает не звук, вид и значение различных морфем, а только возможные в данном языке отношения между морфемами, порождающие слово как известную форму (думаю, что, говоря так, употребляют этот термин в духе учения Фортунатова)" [9, с.219]. В сферу морфологии входят лексические и грамматические категории, проявленные морфемами слова [241].

2. Форм слов [35, с. 37], а точнее, – структуры слов и путей, которыми структура слов отражает отношение этих слов к другим словам – как в рамках некоторой конструкции, их включающей (предложения), так и в рамках всего словаря языка [64, с.146]. В иных терминах – изучение конструкций, в которых роль играют "связанные формы" [3, с.195]. Такую структуру иногда

-6-

называют "внутренней структурой" слов [198, с.113]. Цель морфологии – построить теорию для описания таких структур в любом языке. Причем, по Е.С.Кубряковой: "Тенденция поставить во главу угла не морфему, а слово сближает современный период развития морфологии за рубежом с традициями отечественного языкознания, для которого морфология была всегда не столько учением о морфеме, как, например, для дескриптивистов .., сколько учением о слове и репрезентирующих его морфологических структурах" [27, с.158].

"Техника" описания в различных концепциях бывает разной. Например, кроме понятия морфемы, используют понятие процесса: о словах говорят как "формирующихся" сущностях. Так, форма feet представляется как foot плюс замена [u] на [i]. При такой постановке вопроса морфология описывает процессы синтеза и анализа слов при использовании содержимого лексикона и правил продуцирования слов [205, с.17-18], а задача морфологии – описать и объяснить процессы создания, использования и восприятия единиц со статусом слова в речевой деятельности, выяснить роль морфологических процессов и морфологических единиц в осуществлении речевой деятельности [26, с.60].

Например, в одной из реализаций такого подхода стремятся выяснить соответствия "между глубинно-морфологическим ("морфолексемным") представлением словоформ и их фонетической (или графической) репрезентацией" [6, с.16]. Причем: "переход от смысловой записи к (глубинно-)морфологическому представлению высказывания осуществляется в пределах семантического и/или синтаксического, а не морфологического компонента. Для морфологии же глубинно-морфологическое (в наших терминах – морфолексемное) представление словоформы (типа "1 лицо единственного числа наст.-буд. времени от глагола играть" или играть 1 ед.наст., "им. падеж единственного числа от сущ. дом" или дом им.ед. и т.п.) считается заданным извне" [6, с.16].

Компромисс между "морфемоориентированным" и "словоориентированным" подходами представлен той концепцией, в которой считается, что морфология "призвана описывать словоформы данного языка более экономным способом, чем простое их перечисление (т.е. чем просто составление списка словоформ с сопоставленным

-7-

каждой словоформе значением). Эта задача выполнима постольку, поскольку в общем случае слово представляет собой сложную структуру, не элементарный знак, а сочетание элементарных знаков, т.е. комплексную знаковую единицу с означаемым, членимым на элементы, которые сами являются означаемыми, и, соответственно, с означающими, членимыми на элементы, которые сами являются означающими[…] Иными словами, возможность отказаться от "словарного" способа описания соответствий между формой и содержанием словоформ обеспечивается фактом наличия частичного фонетико-семантического сходства каждой данной словоформы с рядом других" [6, с.55].

3. Формы означающих в широком смысле [145, с.361] – не отдельных морфем и не словоформ, а более общих объектов – основных значений и конструкций, представленных в языке, и их взаимосвязей в данной лингвистической системе независимо от их дополнительного значения [46, с.267]. Речь идет о группировках "языковых средств с точки зрения их формальной близости в противоположность науке о языковой номинации и науке о языковом соотнесении" [33, с.200]. Иногда эта задача расшифровывается как исследование не слов (это задача морфосинтаксиса), а продуктивности форм выражения и принципов перекодировки языковых содержаний [168, с.58]. Именно в этом значении используется данный термин в словосочетании морфология сказки.

В данной работе мы используем термин морфология скорее в первых двух значениях, а термин морфологическая интерпретация связан у нас с компромиссом между морфемоориентированной и словоориентированной трактовками морфологии.

К оглавлению

3. Морфологическая теория

Традиционные грамматики видели в изучении слов и отношений между словами контекст для решения даже проблем, сегодня относимых к ведомству синтаксиса и фонологии. Морфология была краеугольным камнем лингвистики в целом [64, с.146].

В русле когнитивистской волны последних лет общую цель морфологической теории видят в объяснении наиболее обычных для человеческих языков свойств морфологических систем (например,

-8-

фузию, алломорфию и т.д.) через призму когнитивных характеристик человека как такового [97, с.3].

Кроме этой глобальной цели, морфологи-теоретики стремятся ответить на следующие вопросы, касающиеся синхронии языка [245, с.97]:

1. Каковы базисные единицы морфологической структуры и каковы отношения между этими единицами?

2. Как сигнализируются или реализуются эти единицы в фонологической структуре предложения?

3. Каковы критерии морфологического анализа конкретного языка?

В 1940-х – начале 1950-х гг. ответы на первые два вопроса казались тривиальными. Обсуждался в основном третий вопрос. Первые два вопроса особенно заволновали лингвистов в 1970-е годы. Какова же причина такой динамики интереса к морфологии?

Главный вопрос в 1940-е гг. был связан с выделением морфемы: как организовать формальную процедуру этого выделения, которая давала бы "объективную" картину [245, с.114]. Высшим достижением в этой области обычно считают работу З.Харриса [165]. С распространением идей генеративизма (см. [108]) этот вопрос перестал интересовать теоретиков, хотя по-прежнему он не до конца ясен для составителей практических грамматик и словарей.

Объяснение этому состоит в следующем. Если рассмотреть историю теоретического языкознания за последние 125 лет, можно заметить, что интерес к морфологии возникал только в теоретических течениях, достигших определенной зрелости [64, с.146]. Например, младограмматики перешли к морфологии, только "освоив" фонологию. Так же обстояло дело с американским структурализмом, а затем и с генеративизмом. Именно зрелым состоянием генеративизма и объяснимо то, что после довольно долгого перерыва к середине 1970-х годов морфология вновь стала одним из важнейших полигонов для лингвистической теории.

Были и дополнительные причины для отсутствия интереса к морфологии в 1960-е гг. (о них очень подробно и убедительно говорится в работе Е.С.Кубряковой [26, c.7-9]). Например, иллюзия завершенности, законченности и даже исчерпанности морфологической

-9-

проблематики как разработки процедур и условных приемов "вычленения морфем и их отождествления, установления дистрибуции морфем и их окружения и т.д." Это впечатление, впрочем, создалось не на пустом месте: дистрибутивная методика, действительно, к тому моменту исчерпала себя как самоцель и не могла больше ставить каких-либо интересных вопросов перед лингвистом-теоретиком. Эта теоретическая опустошенность – отсутствие теоретической проблематики, перспектив для морфолога того времени построить объяснительную теорию языка, которая соответствовала бы стандартам объяснительности, наводила на мысль, что морфология (того времени) не соответствовала общенаучным стандартам теории.

"Методический" этап языкознания к этому времени был позади, и лингвисты-теоретики не признавали уже за чистой методикой статуса теории. Новые стандарты объяснительности требовали также "другого стиля мышления – более абстрактного уровня рассуждений, использования большого количества формул или близких к ним построений, иной степени отвлечения от конкретных данных, знания логики и отчасти математики и т.д." [26, c.8].

Сказалось и увлечение синтаксисом, даже мода на синтаксис в то время. Все остальные традиционные лингвистические дисциплины должны были (в соответствии с духом времени) только обслуживать синтаксическую теорию. Собственно морфология – как комплекс проблем, связанных с соположением элементарных значимых единиц в рамках слова – растворилась в фонологии и синтаксисе. Тогда обычно считали, что морфология – вспомогательный уровень структуры между фонологией и синтаксисом. На нем описывается внутренняя структура, или "форма" слов (при этом под словом понималась последовательность морфем), а синтаксис описывает, как эти слова сочетаются в рамках предложений. Заметим, что такой взгляд, согласно которому между синтаксисом и морфологией нет четкой границы, не был нововведением генеративистов: он встречается значительно раньше (см., например, [272]). В начале 1970-х гг. положение это квалифицировалось как чрезмерное огрубление [235, с.96].

Менее существенным – хотя и часто упоминаемым фактором – было якобы пренебрежительное отношение к "поверхностной структуре"

-10-

языка. Мне хотелось бы напомнить, что правильность и семантические свойства именно "поверхностных" реализаций "скрытых" (или "глубинных" и "семантических") языковых структур были тем основанием, на котором исследователь строил свою порождающую грамматику. Именно реальные предложения, нарушающие стройные гипотезы об исходной репрезентации предложений данного языка – "контрпримеры" для теории, – погребли огромное количество несостоявшихся грамматических построений. Когда царит дух опровержимости ("фальсифицируемости", у К.Поппера) как непременного качества хорошей научной теории, наблюдаемые "поверхностные структуры" играют решающую роль. Теория морфологии, сложившаяся к 1960-м годам вне генеративизма, мало зависела от реальных примеров и контрпримеров – несмотря на обилие иллюстративного материала в публикациях того времени. Это и предопределило отношение к ней.

В начале 1990-х гг., когда имеется большое количество конкурирующих концепций, морфологические теории различаются по следующим "параметрам" [80, с.487]:

- стандарты объяснительности,

- ставится ли вопрос об описании семантических свойств сложных слов и как это описание организовано,

- использование понятия морфологической продуктивности,

- какая ось структуры слова – парадигматическая или синтагматическая – находится в центре исследования,

- трактовка отношения между морфологией и синтаксисом.

Все предложенные когда-либо модели морфологии, трактующие словоизменение, вслед за Ч.Хокеттом [171] условно разбивают на три группы [154, с.11]:

1. Модель "единица и упорядочение", связанная с установлением инвентаря морфологических элементов (морфем) языка и выяснением того, какие их комбинации допустимы, а какие – нет.

2. Модель "единица и процесс", в которой из исходных элементов получают поверхностные структуры.

3. Модель "слово и парадигма", в которой слово подчинено парадигме.

Ниже кратко охарактеризуем каждую из этих групп.

-11-

К оглавлению

3.1. "Единица и упорядочение" (Item and Arrangement)

При этом методе полный морфологический анализ языка включает [171]:

- инвентарь морфем (единиц items, по Хокетту),

- указание порядка следования морфем в слове,

- инвентарь морфов – реализаций морфем в словоформах.

Словоформу анализируют как комбинацию морфем, расположенных в некотором порядке, и оперируют терминами статики [75, с.401]. Например, глагольное словообразование описывается так [75, с. 402]:

1. Каждая глагольная форма, функционирующая как обозначение третьего лица единственного числа настоящего времени, причастия или герундия – состоит из основы и флексии.

2. Различные фонематические представления конкретной основы, взятой вне флексии, и различные фонематические представления флексии, взятой вне основы, считаются морфемными альтернантами некоторой морфемы.

3. Один из альтернантов морфемы может быть нулевым, но не может быть морфем без ненулевых альтернантов.

4. У разных морфем могут быть общие альтернанты.

5. Фонематически различные формы, встречающиеся в одном и том же окружении и не являющиеся свободными вариантами друг друга, считаются морфемно разными.

Затруднения возникают из-за "внутренней флексии", особенно аблаута [245, с.98-99], cp. sink – sank, drink – drank, sing – sang и т.д.: налицо неуникальное соотношение форм. Говорить о мене i на a как о "морфе" (см. [164, с.167], [266]), с заменяющим статусом, – значит ставить под сомнение принцип линейного расположения сегментов [69], [171].

В работе [75] утверждается, что слово sank целиком является сигналом для лексического элемента sink, а "прошедшее время" представлено нулевым морфом в конце слова. Это решение удовлетворило не всех [266], а потому Хокетт обратился к иным моделям объяснения. Однако в "стратификационной грамматике" [217], [218], [148] к этому решению вернулись:

1. Указанные примеры дают основание для разграничения

-12-

различных уровней – слоев анализа ("страт" – отсюда и название концепции). Альтернанты обычной морфемы D, выражающей прошедшее время, содержатся в формах типа waited, hissed, turned, shown (в последнем случае морф -n вместо ожидаемого – ed). Имеем три уровня анализа для словоформы waited:

WAIT прич. прош. вр. weit D weit id

Самый верхний уровень задан в терминах морфем из лексикона, второй – промежуточный морфонематический уровень (morphon у С.Лэма), третий – фонетический.

2. Есть процедура трансдукции – перехода с одного слоя на другой.

К оглавлению

3.2. "Единица и процесс" (Item and Process)

Словоизменение описывается в терминах процессов, дающих словоформы от исходных основ [75, с.399]. Так, претеритная форма waited считается результатом присоединения суффикса к основе wait, took образуется от take в результате мены гласной, built – в результате мены согласного в основе build, sold

- от sell в результате мены гласного и добавления согласного суффикса, went – от go в результате супплетивизма, put – от put с помощью нулевой мены.

Слово уподобляется серии "волн" (а не частиц-морфов), когда пик одной волны соответствует одной морфеме, пик следующей волны – другой морфеме, а промежуточное пространство заполнено аморфной жидкостью [273], [275, с.656], [276].

Например, в латинском склонении в форме mensas (род. падеж ед. числа от mensa "стол") пик первой волны – mens, пик второй волны – s, а долгий гласный a между ними – промежуточный материал.

Образование форм рассматривается как процесс "волнообразования", состоящий из трех стадий:

1. Построение исходной репрезентации, когда пики морфем записываются одна за другой в нужной последовательности. Скажем, к sink справа присоединяется Past Tense, к mens присоединяется

-13-

s и т.д.

2. Некоторая часть морфем (типа Past Tense) влияют на соседние морфемы. Так, sink превращается в sank. Исчезая, такие морфемы запускают процесс изменения i в a.

3. Наконец, к работе приступает морфонемика, сопоставляющая репрезентации, возникающие на первых двух стадиях. Так, получив в качестве показателя прошедшего времени D, корень hiss дальше взаимодействует с этой флексией, в результате последняя оглушается, превратившись в сегмент t.

Динамические термины этого подхода – наследие древности [245, с.104]. Третьей стадии соответствуют правила сандхи. Использовались правила этого типа и у структуралистов [77]. Однако эксплицитно динамическую окраску получило морфологическое описание словоизменения в генеративных грамматиках, начиная с модели "Синтаксических структур" [108, с.32], а затем широко использовалось в стандартной генеративной фонологии [115].

К оглавлению

3.3. "Слово и парадигма" (Word and Paradigm model)

Этот подход использует традиционное понятие парадигмы словоизменения [245, с.108]:

1. В каждой лексеме выделяется основа.

2. Выделяется серия морфологических процессов, запускаемых при наличии соответствующих свойств грамматического слова.

Например, в итальянском основой лексемы cantare "петь" считается canta. Если получаемому (или интерпретируемому) слову приписано свойство "будущее время" или "сослагательное наклонение", то добавляется r с ударением на последующем слоге. Если слову приписано свойство "кондиционалис" и т.д., добавляется ударное e. Получаемая форма преобразуется по морфонематическим правилам. Например, базисная репрезентация canta-r-e-bb-ro (bb и ro добавляются в результате еще каких-то процессов) преобразуется так, что второе a переходит в e (в результате взаимодействия с ударением в следующем слоге), вставляется гласная e для разделения bb и ro. Окончательный результат: canterebbero. Особенности этого подхода, вопросы, им решаемые, продемонстрируем на следующих примерах [245, с.107], ср. [281]:

-14-

1. Сравним формы итальянского языка: donna "госпожа" – donne "госпожи" (мн.ч.), monte "гора" – monti "горы" (мн.ч.), ragazzo "мальчик" – ragazzi "мальчики", dito "палец" – dita "пальцы". Можно ли сказать, что окончания "сигнализируют" об единственном числе, противопоставляемом множественному (ср. [274] и [111, с.170 и след.])?

2. Возьмем в итальянском же форму canterebbero "они пели бы". Где в точности можно провести границу между морфемами (ср. [244], [215])? Ведь из сопоставления с другими формами и основами видно, что:

- сослагательное наклонение сигнализируется сегментами: r, e, bb, (e)ro,

- третье лицо – сегментами bb, (e)ro,

- множественное число – сегментом ro.

3. Почему элемент, входящий в последовательность морфем, идентифицируется признаками до и после корня? Почему морфема в начале слова предписывает выбрать тот или иной конкретный альтернант морфемы после нее или даже в конце слова?

Сторонники подхода "слово и парадигма" так отвечают на эти вопросы [247, с.144]. Морфемы линейно упорядочены, но являются не самостоятельными сущностями, а всего лишь свойствами конкретного слова в целом. И наоборот, контрастные свойства слова в целом считаются отдельной морфемой. Морфемы обычно, но не всегда, можно прямо указать в слове.

Признаки, приписанные некоторому морфосинтаксическому свойству, т.е. "экспоненты" (exponents) этого свойства [247, с.144], соответствуют противопоставлениям, навязываемым парадигмой для данной лексемы. Экспонирование (exponence) бывает кумулятивным (cumulative), развернутым (extended), слитым и накладывающимся (overlapping).

Например, в русском языке падеж и число приписаны окончаниям кумулятивно: одно и то же окончание экспонирует и ту, и другую категорию. При развернутом же экспонировании морфологическим признакам приписаны две или большее количество позиций в слове. Например, в древнегреческих формах leluka, leloipa вид маркирован одновременно с помощью редупликации и суффиксом

-15-

и/или чередованием корня. В арабском настоящее время экспонировано одновременно префиксом (a, ta, na и т.д.) и соответствующим чередованием корня (в прошедшем времени имеем katab, в настоящем – ktub). Ср.: aktubu "(я) пишу", naktubu "(мы) пишем", katabtu "(я) писал", katabna "(мы) писали" и т.д.

В отличие от кумулятивного экспонирования, слитое экспонирование – фузия – результат особого процесса, сандхи, и связано с фонологической, а не морфологической закономерностью. Например, в испанском языке в форме второго лица множественного лица действительного залога настоящего времени vivis < viviis "(вы) живете" (cp. comprais "(вы) покупаете") окончание is являет пример фузии, а не кумулятивного экспонирования [247, с.147]. Исторически фузия в данном случае представляет развернутое экспонирование.

Пример накладывающегося экспонирования – лицо и число в древнегреческом, никогда ни экспонированные порознь, как и залог и время. Эти категории как бы накладываются друг на друга.

Затруднения с данным подходом, основанным на понятии слова как физически данной единицы (исключение – шаг в сторону абстракции – делается разве что для понятия лексемы) возникают при описании очень многих моментов словоизменения. Тогда исследователю приходится прибегать примерно к тем же "маленьким хитростям", что и при подходе "единицы и арранжировка".

К оглавлению

3.4. Так какой же тип модели лучше?

Все указанные модели имеют свои сильные и слабые стороны. Некоторые теоретики подумали поэтому, что для разных типов языков следует использовать и разные подходы [281, с.137], а языки можно отнести к тому или иному типу в зависимости от оптимальной для него морфологической концепции (ср. [242], [234], [70], где близкое положение принимается для фонологического описания).

Однако эта установка принципиально противоречит общенаучным стандартам теории [245, с.108]:

- универсальности, то есть применимости к любому объекту (языку), более того,

-16-

- безоговорочности, то есть применимости к каждому конкретному исследуемому объекту (к языку, в данном случае) в максимальной степени, без каких-либо оговорок об особых, специальных случаях.

Экспертная система лингвистических знаний, по определению, должна работать при самых разных теоретических предпочтениях потенциального пользователя и позволять верифицировать произвольную концепцию на фоне материала конкретного языка. Наша задача состоит поэтому в разработке не метаязыка или еще одной концепции морфологии, а метаметаязыка, на котором формулируемы произвольные концепции без вмешательства во внутреннюю механику системы.

К оглавлению

4. Морфологическая система языка

Морфологическая система конкретного языка определяется как свойства и взаимосвязи языковой системы в целом, затрагивающие структуру слов (точнее, "морфологических слов" [328, с.35]) и словоформ. Она задается принципами, определяющими синхронную структуру слова (и взрослого носителя языка, и ребенка) и морфонематические изменения в истории языка [178, с.42-43]. Эту систему можно представить и как совокупность наборов (множеств) элементов, находящихся в бинарных оппозициях с остальными членами, когда каждый набор соответствует некоторой морфологической подсистеме, – скажем, системе вида или времени, числа или лица. Морфологическая система в целом – совокупность не отдельно взятых этих членов, а неделимых групп. Отсюда вытекает возможность оперировать этой системой в терминах абстрактной алгебры [90, с.141].

Видимо, в силу такой глубокой внутренней организации морфологическая система "в наименьшей степени, сравнительно с другими сторонами языка, подвержена воздействию со стороны других языков, родственных или неродственных, а поэтому в большей степени доступна для определения ее собственных закономерностей развития" [28, с.4].

-17-

К оглавлению

5. Внешние и внутренние рубежи морфологии

К оглавлению

5.1. Разделы морфологии

Есть два основания, по которым морфологию подразделяют на поддисциплины:

1. Тип рассматриваемого объекта. С этой точки зрения морфология подразделяется на две большие области [247, с.38]:

- словоизменение, занимающееся процессами, связанными с флексией,

- словообразование, в которое входят две подобласти исследования:

- деривация; например, рассматривается, как слово рисование и рисунок получаются от рисовать; деривация связана с теми случаями, когда имеется по крайней мере один форматив (-унок, -ование), не употребляемый самостоятельно,

- композиция, или основосложение: как образуются единицы типа ice-cream от ice и cream, а русское пароход от пар и ход; то есть случаи, когда обе части основы представляют собой самостоятельные основы.

2. Внутренняя организация морфологического описания. По этому основанию выделяются "модули" [331, с.198-199]:

- морфосинтаксис – правила группирования морфологических единиц в более крупные образования – в слова и/или словоформы,

- правила чередования,

- морфонематические правила,

- лексикон, или "лексический компонент", в котором не только собраны все лексические единицы конкретного языка, но и заданы импликативные связи между их различными свойствами ("правила лексической избыточности").

К оглавлению

5.2. Морфосинтаксическая параметризация языков

Понятие "слово", существенное для разграничения морфологии и синтаксиса, всегда определяют в рамках общетеоретической концепции. Поэтому водораздел между этими дисциплинами также концептуально зависим [247, с.7].

-18-

Стремясь к единообразию теории, З.Харрис [166] объединял морфологию с синтаксисом. Его "синтаксическая морфология" исследует морфологическую организацию предложений, закономерности соединения форм языковых знаков в предложения [87, с.114]. Поэтому, скажем, показатель времени является независимой составляющей предложения, вне глагола как слова [255, с.2].

Чаще же разграничивают синтаксис и морфологию [261, с. 279], ср. [272]. Синтаксис занят внешними функциями слова и отношениями между словами в предложении, а морфология – внутренней структурой слов и отношениями между словами в рамках парадигмы [247, с.154]. Промежуточные случаи – словообразование. Если трудно отграничить словоизменение от деривации [261, с.309], берут на вооружение "словообразовательный подход к словоизменению".

Поскольку же внутренняя структура слова кажется неуниверсальной, свойственной конкретному языку, часто полагают, что морфологические критерии ненадежны при универсально-синтаксическом описании [59, с.18]. Скажем, использование именительного и эргативного падежей не указывает прямо на синтаксическую структуру: языки часто прибегают к смешанному типу, когда переходные глаголы в форме перфекта или прошедшего требуют эргатива, а в иной форме – номинатива. Понятие "личная форма глагола" является морфологическим, а синтаксис, основанный на морфологии, в силу указанной презумпции, не считается вполне универсальным [117, с.67]. В некоторых языках местоимения подчиняются иным законам, чем полные именные составляющие.

Поэтому приходится быть начеку и устанавливать, отражает ли морфологическая реализация синтаксические отношения или камуфлирует их.

Презумпция неуниверсальности морфологии была причиной недоверия к морфологической типологии [49, с.300]. Мы полагаем, что морфология конкретного языка, как и синтаксис, дает параметризацию универсального каркаса. Этот каркас – универсальная морфология – "оболочка" нашей экспертной системы языковых (в частности, морфологических) знаний. Человек-эксперт, заполняющий или корректирующий сведения, хранимые в этой системе, параметризует конкретный язык.

-19-

Известно, что грамматические отношения в рамках словосочетания морфологически маркируются либо в главе, либо в зависимом члене составляющей, либо в обоих членах, либо ни в одном [265, с.56]. Наболее распространенной (по количеству языков) является маркировка главы (как, например, в тюркских и в венгерском языках), ср. венг.:

az ember ház-a (букв. артикль + человек + дом + показатель принадлежности) – "дом человека".

А теоретики чаще рассматривают в качестве наиболее типичной противоположную маркировку, доминирующую в индоевропейских языках, типа русского дом человека. Человек-эксперт должен одинаково ровно относиться ко всем четырем логическим возможностям универсального каркаса.

Языки параметризуются относительно частей каркаса в соответствии с используемыми типами маркировки, обладающими, кстати, консервативным характером, а потому дающими ключ к генетическому родству языков. (Интересно, что в отличие от словообразования, в словоизменении каждого конкретного языка последовательно используется только один из указанных типов.)

В морфосинтаксисе рассматриваются контуры связей между языковыми средствами и процедурами составления предложений [168, с.38]. Части предложения и процедуры комбинирования этих частей взаимозависимы. Поскольку языковая форма есть единство содержания и выражения, проявленное во взаимосоотнесении частей и процессов их комбинирования, исходным материалом для морфосинтаксического анализа, по мнению приверженцев этой гибридной дисциплины, является "мысль" (в смысле Gedanke у Г.Фреге), подлежащая выражению [168, с.8]. Задача же морфосинтаксиса состоит в сегментировании слов [168, с.53].

Морфосинтаксис как методика анализа – предваряющий этап рассмотрения языковых фактов в аксиологическом (семантико-референциальном и понятийном) ключе. Путь этого анализа таков [139, с.217-218]:

1. Начиная с наиболее крупных единиц, исследователь спускается все ниже до самых мелких единиц, держа в фокусе внимания не слово или морфему, а словосочетание.

2. Словосочетания типологизируются как глагольное, именное,

-20-

внекатегориальное. Считается, что в каждую языковую единицу входят:

- один непременный элемент – ядро,

- остальные элементы (наличие и природа которых зависят от природы единицы в целом и/или ядра), иерархически подчиненные ядру или даже более крупному образованию,

- те категории, которые придают единице языковой статус.

3. Анализ внутри словосочетания, приводящий к установлению функциональных групп и формативов.

Именно морфосинтаксической является так называемая морфологическая типология Дж. Гринберга [12], позволяющая [253, с.2] наглядно параметризировать морфологическую структуру разных языков и сопоставлять эти параметры у разноструктурных языков. Основная методическая гипотеза этой типологии: можно установить (в количественных терминах) основные морфологические и синтаксические процедуры на основе пяти формальных оснований классификации:

- общая сложность слова,

- техника соположения составляющих в рамках слова,

- наличие или отсутствие корневых, словоизменительных и словообразовательных элементов,

- порядок следования элементов, подчиненных корню (префиксов и суффиксов),

- корреляции с отношениями между словами.

Как отмечает Б. Комри [121, с.43], вряд ли какой-либо реальный человеческий язык можно отнести к чисто изолирующим, агглютинативным, фузионным, полисинтетическим, на основе параметров, вычисляемых на при помощи перечисленных критериев. Каждый язык занимает некоторую позицию между противоположными полюсами на шкале: синтез (среднее количество морфем на слово)

- фузия (степень, в какой морфемы в рамках слова поддаются членению, при двух полюсах: агглютинация и фузия). Морфологическая типология задает континуум переходов от одного элементарного типа к другому. Некоторые из вычисляемых индексов логически не элементарны [121, с.48]. Например, индекс фузии связан с двумя логически независимыми параметрами: со степенью выделимости морфем и с отсутствием чередований.

-21-

Итак, можно не просто параметризовать языки, но и установить взаимозависимости между различными параметрами. Для этого необходим инструмент, более тонкий и надежный, чем обычная картотека лингвиста. Именно таким инструментом и является экспертная система лингвистических знаний.

К оглавлению

6. Морфонологическая проблематика морфологии

К оглавлению

6.1. Морфонология

Морфонология, или морфофонология, или (особенно в американской лингвистике) морфофонемика, или (поскольку термин "морфофонемика" предполагает существование фонемного уровня) "системная фонемика" ([110, c.87], см. также [326, с.273]), составляющая граничную зону между морфологией и фонологией, содержалась в неявном виде в различных лингвистических традициях. В индийских грамматиках санскрита были детальные правила чередования [206]. И.А.Бодуэн де Куртенэ [5] усовершенствовал этот подход и предложил детализированную общую теорию сандхи, гуна и врдхи, создав, по [140, с.63], предпосылки для собственно морфонологии.

Отцом-воссоздателем морфонологии был Н.С.Трубецкой, писавший: "До сих пор морфонология была в Европе одной из самых заброшенных областей грамматики. Если сравнить в этом плане теории древних греков и римлян с теориями древнееврейских, арабских и в особенности древнеиндийских грамматистов, то бросается в глаза недостаточное понимание морфонологических проблем в период античности и средневековья в Европе. Однако и в новое время такое положение не претерпело существенных изменений. Современная семитология попросту позаимствовала морфонологические теории у арабских и древнееврейских грамматистов, не приведя их в соответствие с современными научными точками зрения. Индоевропеисты положили в основу морфонологии индогерманского праязыка морфонологические теории индийцев, тщательно их разработав, вследствие чего возникла так называемая индоевропейская система аблаута и вся теория индоевропейских корней и суффиксов" [47, с.115]. И далее: "Однако если рассмотреть

-22-

результаты, полученные современной индоевропеистикой в этой области, то становится ясно, что в сущности они не имеют ничего общего с собственно морфонологическим методом: корни ("основы") и суффиксы приобретают здесь характер метафизических сущностей, а аблаут становится своего рода магическим действом. Характерной чертой является также отсутствие здесь связи с каким-либо живым языком" [47, с.115].

Морфонологи стремились выявить факторы чередования морфов одной морфемы, не объяснимые чисто фонологически. В этом была новизна их подхода: предшественники Трубецкого не признавали, что "морфонология не только для праязыка, но и для каждого отдельного языка составляет особую и самостоятельную область грамматики: обычно морфонологию трактовали как результат компромисса или взаимодействия между историей звуков и историей форм и рассматривали одну часть морфонологических явлений в фонемике, а другую – в морфологии" [47, с.115]. Морфонология же Трубецкого "заставила обратиться к поискам других причин, вызывающих чередования в составе морфов одной морфемы или же сохраняющих эти чередования несмотря на мощные процессы унификации и нормирования речи; она помогла увидеть в числе этих факторов содержательные и функциональные" [26, c.12-13].

В США морфонология в середине 1930-х годов стала одним из главных полигонов американского структурализма [77].

Как и названия других разделов грамматики, термин "морфонология" имеет два основных значения [18, с.42]:

- все случаи или система определенных явлений языка,

- учение, исследование, описание или теория таких явлений, в том числе, исследование принципов, обусловливающих эти явления.

К морфонологическим явлениям относят:

1. Материальные аспекты морфемы: грамматические и традиционные чередования [2, с.59], – звуковые и фонемные модификации морфем, связанные с различными окружениями последних [18, с.42]; то есть, чередования соответственных фонем в рамках чередующихся форм (shapes) одной и той же морфемы, для образования морфологических элементов (в первую очередь, морфологические чередования) [1, с.52-53]. Это фонемное модифицирование морфем не зависит непосредственно от собственно позиций фонем

-23-

[39]. Морфонемика – путеводитель по полному списку альтернантов морфем или некоторого разряда форм конкретного языка [75, с.416], своеобразный справочник по фонологической структуре морфемы, а конкретнее – по морфонологическим рядам, сводимым к традиционно чередующимся фонемам [32, с.101-118].

Эти аспекты связаны с фонемной формой морфем, слов и конструкций в отвлечении от значений ("биосоциальной функции") [169, с.20], типичного облика морфем [170, с.63]. Поскольку во всех языках есть морфемы, морфонемика существенна всегда, даже если у каждой морфемы языка есть ровно одна фонемная реализация [170, с.63], – ср. иное мнение у Трубецкого: "Только такие языки, которые не имеют морфологии в собственном смысле этого слова, могут обойтись также и без морфонологии: для подобных языков некоторые разделы, обычно относимые к морфонологии (например, раздел о фонологической структуре морфем), должны включаться в фонологию" [47, с.115].

В морфонологии, таким образом, рассматривается формирование фонемного облика морфем: типичный облик альтернантов, типы чередования и различные контекстные факторы (как фонологические, так и грамматические), предопределяющие условия, в силу которых выбирается тот или иной альтернант морфемы в конкретном окружении [170, с.63].

2. Материальные аспекты слова: структура слова и составляющих его компонентов, заданные в терминах фонем и просодем; в частности, ударение, порядок следования и сочетаемость компонентов слова, правила их варьирования – чередования фонем, интерфиксация и др. [38].

3. Материальные аспекты еще более высокого уровня: морфологическое использование фонологических средств конкретного языка [47, с.115], особенно – фонологических различий [45, с.21-22]. Такая формулировка дала основание считать [16, с.486], что формирование морфонологии как лингвистической дисциплины – результат "последовательного перенесения внимания исследователей с субстанции на структуру, на отношения". Во всяком случае, рассматриваются соотношения между фонологическими и грамматическими структурами (последние задаются в виде иерархии непосредственно составляющих) предложения [104, с.343]

-24-

– процессы, приводящие к грамматичным последовательностям фонем [108].

Как видим, классы объектов морфонологии аналогичны классам объектов морфологии (см. раздел выше), но ограничены "материальной" стороной.

К оглавлению

6.2. Подразделение задач морфонологии

Поскольку объекты морфонологии столь различны, естественно стремление классифицировать задачи этой дисциплины, а соответственно, и ее разделы.

Полная морфонологическая теория, по [47, с.116-117], состоит из следующих трех разделов (из которых только первый несомненно значим для всех языков):

1. Теория фонологической структуры морфем; конкретнее, применительно к русской морфонологии [51, с.33], – порядок и состав фонем корня, суффикса, префикса, окончания. Иногда этот раздел называют морфолексикой, в противоположность собственно морфонемике [296, с.249]. Например, в генеративных грамматиках морфолексические явления описываются с помощью упорядоченных между собой правил, преобразующих нефонологическую запись (представление, репрезентацию) морфемы (заданную в виде индексов, наборов синтаксических и семантических признаков) в исходную фонологическую форму (или формы) – в морфонематическую репрезентацию. В первых генеративных грамматиках [109] терминальные символы синтаксического дерева предложения превращаются в фонетическое описание высказывания в результате именно правил морфолексики. И только после этого морфонематическая запись преобразуется в "поверхностную репрезентацию" [246]. Так, в "Синтаксических структурах" Н.Хомского [108] упоминаются следующие правила:

walk --> /wok/

take + PAST --> /tuk/

past --> /d/.

2. Теория комбинаторных звуковых изменений, которым подвергаются отдельные морфемы в морфемных сочетаниях; по [51, с.33], модификации порядка и состава фонем при связывании этих

-25-

элементов в слово. Эти вариации, называемые иначе внутренними сандхи, Л.Блумфилд приравнивал морфонемике в целом [77, с.244] и отличал от морфолексической вариации. Имеем:

- регулярные модели таких модификаций и их место в системе словообразования и словоизменения;

- нерегулярные явления, такие как [31,с.127-130]:

- чередование конечного согласного основы: новый – новь, вертолет – вертеть, дикий – дичь, сладкоежка – еда;

- сдвиг ударения: водопровод – проводить;

- усечение основы: крепкий – крепость, глубокий – глубина, пятипалый – палец;

- интерфиксы -л, -в-, -т- в сложениях с нулевым суффиксом: старожил, стеклодув, шерстобит;

- наложение морфем: лермонтовед, яблокрад.

3. Теория звуковых чередований, выполняющих морфологическую функцию – то, что иногда [51, с.33] характеризуют как закономерности выбора морфологических элементов, зависящие от состава и порядка фонем в них. Эта "фонология морфологических процессов" описывает фонологические отношения между различными формами реализации, или алломорфами, входящими в слово [205, с.17-18]. Логически возможны три случая:

- чередование (альтернация), когда разница в фонологическом оформлении морфемы связана с морфологическим различием, ср.: скептиКскептиЧеский;

- вариация, когда разница в фонологическом оформлении не связана с морфологическим различием, ср. англ.: burnt – burned;

- конверсия без перефонологизации, когда морфологические различия не связаны с фонологическими, например: set как имя, как глагол и как прилагательное.

Морфонемные чередования создают фонетическое расстояние между альтернантами, в одних случаях большее, в других – меньшее. Историю морфонемики конкретного языка можно рассматривать как минимизацию расстояния между алломорфами [120, с.51]. Такова судьба некоторых видов чередования (lenition) в валлийском, градация согласных по силе в финском, палатализация в венгерском, спирантизация велярных в турецком. Эти случаи

-26-

трудно объяснить иным способом – скажем, как избегание неоднозначности или исключений.

По какому же принципу сочетаются морфемы в рамках структуры слова? Из множества кандидатов интересным представляется "принцип дополнительности по маркированности" (principle of markedness complementarity), предложенный М.Шапиро [286, с.259]: противоположно маркированные основы и суффиксы притягиваются друг к другу, а идентично маркированные – отталкиваются. Так, в японском основы, оканчивающиеся на гласный, немаркированы, а на согласный – маркированы. Суффиксы же, начинающиеся на гласный, немаркированы, а на согласный – маркированы, ср.: tabe-ru, iki-ru, nusum-u, kos-u [287, с.146].

Указанное трехчастное деление морфонологии не исчерпывает всего терминологического разнообразия в отношении разделов этой дисциплины. Тот же объем задач, но с иными подразделениями и в иных терминах имеется в виду в работе [40,с.148]:

- учение о фонологической структуре сем,

- учение о неопределенности их фонологических структур,

- учение о функциональном использовании неопределенности семы (внутренняя флексия, инфиксация); наиболее важна именно эта задача, хотя есть языки – типа турецкого, – для грамматики которых она не существенна.

Есть проблемы в разграничении морфонологии и фонологии, морфонологии и морфологии и даже морфонологии и синтаксиса. Об этом и пойдет речь в следующих разделах.

К оглавлению

6.3. Статус морфонологической репрезентации

Морфонология, по большинству определений, охватывает фонологические "приспособления", зависящие от морфологического и/или синтаксического изменения выражения, вызванного морфологическим ядром языка [232, с.129]. "Морфонемная репрезентация" [232, с.103] создана для того, чтобы указывать продуктивные (закономерные) взаимосвязи между фонологически и морфемно соотнесенными формами. Важнейшая функция морфонологических правил – получение и интерпретация словоформ. Анализ словоизменения и словообразования во многих конкретных языках [232,с.103]

-27-

показывает, что на вход этих правил должны подаваться поверхностные формы, а не инварианты морфем. Причем именно фонемные (а не морфонемные) свойства форм зачастую предопределяют результат работы этих правил.

Морфонология исследует не только фонемную структуру морфем, но и чередование морфем как морфологический процесс [304, с.128-129]. Если конкретное морфологическое чередование достаточно регулярно и характерно для языка, чередующиеся фонемы могут рассматриваться как морфологически однородное множество. Морфонема – элемент класса этих фонем, рассмотренных как компоненты конкретных морфем, ведущих себя сходным образом в морфологическом отношении, – то есть, занимающих сходную позицию в рамках одной и той же серии мутаций. Морфонема никогда не смешивается с фонемой как таковой, даже когда все реализации конкретной фонемы являются членами одного и того же морфонемного класса. Морфонемная запись – гибрид между фонологическим и морфологическим представлениями слова, поскольку чисто "морфологическая" запись была бы значительно менее наглядна.

Морфонологическая запись выглядит как последовательность символов фонем и морфонем. А именно [164, с.25], морфему можно записать как комбинацию символов, не меняющихся от контекста к контексту. Например, для морфемы knife "нож", чередующейся с knive (knives – "ножи"), имеем запись /naiF/, в которой F компактно представляет набор фонем и указывает на возможность чередования f – v. Это F соответствует реализации f в слове knife и реализации v в слове knives. Можно описать условия, когда имеет место одна реализация и когда – другая: скажем, перед показателем множественного числа имеем реализацию v, а в остальных случаях – f. Таким образом, всевозможные чередования морфем сводятся к чередованиям частей морфемы – то есть, к морфонемам [164,с.226-227], и не нужно для каждой морфемы эксплицитно задавать список морфов, ее представляющих: достаточно записать морфему в терминах морфонем и задать набор чередований (с указанием условий, при которых эти чередования происходят), реализующих морфонемы. В нашем примере, используя морфонему F, можно описать свойства целого класса морфем типа: wife "жена", wolf "волк" (ср. формы множественного числа: wives,

-28-

wolves). Соответственно, морфонематическая репрезентация этих морфем такова: /waiF/, /wulF/. Такая запись содержит символы и морфонем, и простых фонем. Последние записываются (условно) строчными, а не заглавными буквами, в отличие от морфонем. Использование понятия морфонемы в рамках комбинированной записи и дает экономию описания [164, с.232].

Задача морфонолога сводится тогда к тому, чтобы "определять строго синхронически как все морфонемы, существующие в каждом […] языке или диалекте, так и место, занимаемое данной морфонемой внутри морфемы" [45, с.21-22].

Морфонему можно поэтому определить так:

- если идти в анализе сверху вниз – основная единица морфем, состоящая из разных (в том числе, и в диалектном отношении) вариантов фонем, не противопоставляемых в рамках одной и той же лексической единицы. Бывают систематические чередования морфонем – подстановки, модификации, замены [294, с.307],

- если идти снизу вверх – звуки, фонемы и/или комплексы фонем, чередующиеся в зависимости от грамматических условий [23], [18, с.42],

- наконец, с точки зрения результата описания – "образ, состоящий из двух или нескольких фонем, способных замещать друг друга согласно условиям морфологической структуры внутри одной и той же морфемы" [45, с.21].

Пользуясь понятием морфонемы, лингвист достигает наглядности, но за счет расширения алфавита элементарных символов для записи морфем: к символам фонем добавляются символы морфонем. Следует ли принимать такое расширение всерьез, как соответствие реальности языка, или считать его простым приемом описания? В этом вопросе мнения лингвистов расходятся.

К оглавлению

6.3.1. "Морфонема – реальность языка"

Сторонниками этого взгляда были основоположники морфонологии [45, с.21]. По [264, с.507], важность морфонемы как структурной единицы еще не до конца осознана исследователями. Постблумфилдианцы просто отмахнулись от этой единицы и от методов описания, с нею связанных. Однако морфонемы – реальные

-29-

фонологические единицы, а не простые фикции описания.

Те, для кого морфонема – всего лишь исследовательский прием, считают, что после слияния исторически различных фонем теряется навсегда и их идентичность порознь, а последующая фонологическая судьба навсегда едина [175, с.117]. М.Халле [158, с.70] поставил это положение под сомнение, считая, что фонемы, совпавшие на каком-либо этапе эволюции, позже могут возникнуть как полностью различные сущности. Те, кто считают морфонему не фикцией, утверждают [264, с.515]: несмотря на это слияние, звуки, больше не составляющие фонем, могут продолжить свое самостоятельное существование, но на морфонемном уровне. А поскольку слившиеся фонемы ведут себя с синхронной точки зрения не одинаковым образом, будущее их поведение также не обязательно будет одинаковым.

К оглавлению

6.3.2. "Морфонема – фикция"

Этого взгляда придерживаются те, кто считает, что хотя морфонология по-своему элегантна, она заставляет абстрагироваться от реальной речи [173, с.221]. Ведь комбинированная запись соответствует некоторой абстракции от фонологической, а потому есть опасность смешать исследовательский прием (в данном случае – понятие морфонемы) с реальностью исследуемого явления. Морфонема не входит в язык, а является "маленькой хитростью", приемом лингвиста, не больше и не меньше. Осознание этого позволяет избежать смешения реальности языка с простотой описания [173, с.221].

К оглавлению

6.3.3. Так нужна ли морфонема?

По логике научного исследования, поскольку понятие морфонемы появилось как удобный прием описания и не является непосредственно наблюдаемой сущностью, тяжесть доказательства реальности лежит на лингвисте, утверждающем, что морфонема – больше, чем прием.

В шестой главе мы попытаемся ответить на этот вопрос в следующей формулировке: какая система морфологической интерпретации

-30-

будет работать лучше: с морфонемами или без них?

К оглавлению

6.4. Единство морфонологии

Когда описание языка представляется в виде набора правил, работа которых организована по образцу формального механизма (прототипом в этой области часто является программа ЭВМ – в той степени, в какой она соответствует представлениям лингвистов о когнитивных способностях человека), неизбежен вопрос о том, где, в каком "компоненте" собраны морфонологические правила. Можно выделить следующие группы концепций.

К оглавлению

6.4.1. "Морфонология слита с фонологией"

В целом ряде работ конца 1950-х – начала 1960-х годов

М.Халле и его соратники по генеративной фонологии [157], [48] пытались показать, что морфонология является частью фонологии, поскольку иначе придется принять, что одни и те же правила входят в оба компонента грамматики, и описание будет пещрить повторяющимися деталями (см. об этом подробнее [140, с.63]). Фактически это возврат к позиции Панини. Взят он на вооружение и в стандартной генеративной фонологии [115].

Разновидностью этого взгляда является тот, при котором не отрицается зависимость морфонологических чередований от морфологии, но морфонология все равно считается частью фонологии. Это компромисс в рамках "лексической фонологии" [79], [256]. Для одного и того же морфологического элемента постулируются несколько лексических статей, а лексические статьи, не маркированные в морфонемном отношении, считаются исключениями.

К оглавлению

6.4.2. "Морфонология – отдельный компонент"

В этой концепции принимается, что морфонология автономна, несмотря на (кажущуюся) избыточность получаемого описания [177], [222], [128], [98]. Морфонология – место встречи морфологии и фонологии языка. Задача морфонологии в рамках описания языка – показать, чем заканчивается в конкретных случаях поединок

-31-

между противоборствующими тенденциями фонологии и морфологии. В частности – между стремлением к формальной прозрачности в морфологии и к наиболее полному соответствию языкового выражения правилам фонологии [205, с.7]. Доводы таковы.

1. Как и фонологические правила, морфонематические продуктивны: им подчинены даже заимствованные основы, неологизмы, бессмысленные слова и языковые игры [126, с.8]. Однака различна их мотивация. Правила морфонемики обусловлены грамматически и/или лексически (действительны для одних категорий слов или морфем языка и не действительны для других), а фонологические автоматичны, обусловлены чисто фонологически и не знают исключений [126,с.41].

Как неотъемлемая часть языка воспринимается морфонология и носителями языка, и теми, кто его только усваивает [55, с.11]. В "естественной фонологии" [128] разграничение морфонемики и фонологии параллельно противопоставлению правил процессам [331, с.99]. Отсюда – следующее отличие:

2. Фонологические правила при усвоении языка не выучиваются, а просто "не подавляются", поскольку отражают исторические естественные процессы, обусловлены грамматически (или морфемно), – потому конфигурации и/или сегменты, возникающие по фонологическим правилам, вполне возможны в иных фрагментах того же языка [123]. А морфонологические правила должны выучиваться как надстройка над фонологическими [126, с.42]: выражения, допустимые чисто фонологически, подвергаются цензуре морфонологии. Недаром ошибки и детей и взрослых связаны именно с игнорированием какого-либо морфонологического правила.

3. Правила морфонемики (или, если угодно, "морфонологические конвенции") имеют отдельную судьбу в истории языка, зачастую характеризуя технику выражения одновременно нескольких морфологических категорий: скажем, лица, числа и времени [55, с.11]. Большинство этих правил возникают как фонологические, создающие фонологически немотивированные чередования в морфологии, а тем самым разрушающие иконичность морфологии. Постепенно морфонемные чередования, сопровождающие определенные морфологические операции, становятся избыточными индикаторами этих операций, даже частью морфологического знака, а когда

-32-

уходит в небытие сам этот знак, морфонемное чередование может стать отдельным морфологическим знаком [126, с.51]. Одним из типичных видов изменения является отказ от чередования, то есть восстановление иконической функции, когда одна форма основы обслуживает целую парадигму. По Дардену [126, с.58], когда основа исходной грамматической формы достаточно информативна с точки зрения фонологии, чтобы предопределить необходимость чередования, то именно она становится входом в правило морфонемики: исходные грамматические формы подвержены выравниванию в наибольшей степени, так что количество операций, совершаемых над этими формами, минимизируется.

4. Когда фонологическое правило теряет автоматичность и становится грамматически обусловленным, морфонемика отражает знание носителя языка о правильных формах. Семантически значимое наличие или отсутствие чередования при конкретном суффиксе играет прагматическую роль [152, с.176].

Итак (по [125, с.79], но в отличие от концепции [196]), представление о морфонологии как об отдельном компоненте заставляет принять, что правила морфонемики заведуют чередованиями фонем, обусловленными грамматически или лексически. "Автоматические чередования", приводящие к фонологической нейтрализации, также иногда называют морфонемными.

В то же время, в некоторых концепциях этой группы отвергают следующие положения (которые другим кажутся верными):

1. Правила, работа которых зависит от наличия границ каких-то определенных классов, не являются фонетическими, а потому относятся к морфонемике [319], [177, c.14].

2. Внешние сандхи – результат грамматического переструктурирования в диахронии, при котором лексической репрезентацией является фонетическая форма слова, произнесенного в изолированном положении [319].

3. Все слова во всех своих формах перечислимы в рамках грамматики [319].

4. Все алломорфы перечисляются в рамках грамматики, причем чередования сегментов представляются как дизъюнктивный набор при каждой морфеме [184], [177, c.73-74].

5. Все правила выражают наиболее очевидные обобщения, относящиеся

-33-

к поверхностной структуре [177, c.13].

6. Влияние фонологии на правила морфонемики сводится к структуре слога и к фонотактическим ограничениям [179].

К оглавлению

6.4.3. "Морфонология слита с морфологией"

В этой концепции, как и в классической компаративистской позиции Курыловича [30], морфонология считается частью морфологии [327], [232], пусть даже описание избыточно. Так считают сторонники естественной порождающей фонологии [97, с.V]: морфонемика исследует отношения между алломорфами – фонологическими репрезентациями для вариантов одной морфемы, – однако является частью морфологии, поскольку именно последняя обусловливает процедуры морфонемики. По [140, с.64-65], морфонологические чередования сводимы к чисто фонологическим условиям правильности (скажем, структуры слога и слова), но вне функции этих чередований. Остальные же чередования относятся к морфологии, будучи результатом морфологических операций. Итак, ни фонологическая природа морфонологических чередований, ни стремление исследователей к экономии при организации грамматики не могут убедить в том, что морфонология полностью отделена от морфологии [140, с.75].

Морфонологические чередования, в отличие от фонологических [140, с.65]:

1. Не имеют фонологических или фонетических ограничений. Например, морфонологическими чередованиями не являются: оглушение согласного на конце слова в немецком, ср. t – d в паре Tag "день" (читается: tak) – Tage "дни" (читается: tage) и чередование нуля с фонемой e в испанском: tren "поезд" – trenes "поезда", но alumno "ученик" – alumnos "ученики".

2. Не автоматичны (в смысле: [172]), то есть допустимы только в некотором конкретном морфологическом контексте. Ср:

- нем.: Wald – Wälder "лес" – "леса",

- исп.: bueno – bondad "добрый" – "доброта",

- франц.: électriqueélectricité "электрический" – "электричество",

- англ.: wife – wives "жена" – "жёны".

-34-

Участвуя в формировании слова, они часто сопровождаются какой-либо морфологической операцией типа аффиксации, усечения или редупликации, причем связаны с меной морфологических категорий, ассоциированы с некоторой морфологической функцией, т.е. сигнализируют о морфологическом противопоставлении.

3. Не все слова соответствующей морфологической категории подвергаются их действию. Например, умлаут в немецком используется для формирования форм множественного числа далеко не всех существительных.

4. Не всегда бывают "естественными чередованиями", т.е. результатом фонологических процессов (в смысле "естественной фонологии").

5. В истории языка не являются динамичными, т.е. не могут самопроизвольно менять сферу действия, переходя от одного морфологического контекста к другому. В то же время, они могут развиваться даже когда исчезают первоначальные фонологические их причины. А при этом семиотическая мотивация у правил морфонемики не меньше, чем у фонологических, отличие состоит только в деталях механики работы. Поэтому [287, с.156] морфонологические чередования нельзя считать окаменевшими рефлексами фонологических правил.

Различаются два типа морфонологических чередований, а соответственно, два типа правил, обладающих морфонологическим эффектом [232, с.129-130]:

- фонотактические ограничения на план фонетики (фонотактические правила) – действительны для всех поверхностных форм, как участвующих в чередованиях, так и не участвующих,

- не мотивированные фонотактически – собственно морфонологические правила.

К оглавлению

6.4.4. "Кусочечная морфология"

Представители этого взгляда считают, что морфонология не существует как отдельный компонент, а по кусочкам представлена в разных компонентах описания (как и полагали до Трубецкого) и не заключена в колбу фонолога (вопреки мнению Халле) [104, с.343]. Иначе говоря, морфонемика – разнородное и логически не

-35-

всегда последовательное собрание структур (patterns) и связей.

Хотя фонологические различия обычно отражают грамматические и наоборот, однако омонимия часто разрушает эту идилическую симметрию. Омонимия в сочетании с объемом и сложностью семантического универсума время от времени затрудняет анализ. Так, часто бывает, что на некотором уровне следовало бы постулировать два элемента, а не один, но с помощью чисто фонологических приемов нельзя разделить эти два элемента. Поэтому морфонология – нотация, алломорфы и процессы – всего лишь удобные инструменты описания (как полагал, например, Хокетт [172, c.32-36]). Чем яснее и прозрачнее морфонемное описание и чем ближе оно к ходу исторического развития, тем лучше. Иногда эти два критерия – ясности и историчности – совпадают, см. [305, с.2], где отмечается сходство пути построения формул морфонемики и реконструкции фонологической истории языка (хотя: "Наиболее удачная формулировка фактов синхронии обычно не выглядит как реконструкция реального исторического развития"). Задача только в том, чтобы узнать, когда лучше придерживаться одного критерия, а когда другого.

К оглавлению

6.4.5. Так где же живут морфонологические операции?

Вопрос, существует ли морфонология, не стоит сводить к выяснению ее местожительства: является ли она частью фонологии, частью морфологии, живет отдельно – или по кускам представлена везде. Вряд ли Трубецкой хотел непременно поселить морфонологию отдельно. Это было бы аналогично желанию поселить всех африканистов в Африке, а русистов в России, чтобы люди занимались своим делом по месту прописки.

Итак, не важно, где "живет" морфонология: важно, где она работает. А работает она везде, где есть материальная реализация семантических единиц – морфем, слов, предложений, текстов.

-36-

К оглавлению

ГЛАВА ВТОРАЯ

ЭКСПЕРТНАЯ СИСТЕМА МОРФОЛОГИЧЕСКИХ ЗНАНИЙ

В первой главе мы только вскользь коснулись идеи экспертной системы морфологических знаний как универсального "метаметаязыка" морфологии. Обратимся теперь к вопросу о предназначении экспертной системы вообще.

В результате широкого распространения персональных ЭВМ построение специальных систем знаний о языке в последние годы стало весьма актуальным занятием. Даже простые системы редактирования текста (с переносом слова со строки на строку, корректировкой орфографии, локализацией ошибки в согласовании имени и прилагательного, когда это существенно), обладающие зачастую весьма ограниченными лингвистическими возможностями, пользуются большой популярностью. По внутреннему устройству эти системы обработки слова, или "морфологические процессоры", сильно отличаются от остальных информационных систем.

В существующих "редакторах" использованы далеко не все ресурсы естественных языков. Например, обычно человек не бракует необычную (не хранимую, ранее не занесенную в систему) основу, построенную по морфологическим законам данного языка. Существующие редакторы бракуют нехранимые основы.

Мы полагаем, что качественно более эффективный, чем существующие, морфологический процессор нельзя построить только с помощью приемов информатики и "маленьких хитростей" – случайно обнаруживаемых закономерностей языка. Необходимо опереться на достижения современной общей морфологии как раздела языкознания. Чем шире такой фундаментальный фон, тем больше свобода оправданного маневра при построении системы морфологической обработки текста.

Современные представления о морфологии в теоретическом языкознании, опирающиеся на теорию интерпретации, на типологию, на огромный фактический материал конкретных языков, создают фундамент для построения систем морфологических знаний. Простой механический перенос этих данных с "бумажного" на "машинные" носители информации менее перспективен, чем универсальные оболочки для экспертных систем языковых знаний.

-37-

Такие системы не только накапливают информацию о языке в некотором внутреннем формате, но и используют ее для распознавания и синтеза текстов (в режиме верификации). Усовершенствование редакторов текста для конкретного языка тогда можно рассматривать как результат такой оптимизации этих систем, когда из всего богатства универсальных средств отбираются только процедуры и параметры, существенные для конкретного языка, остальные же типы знаний – полезные для какого-либо иного, но не данного языка и усложняющие работу, – выносились бы за скобки.

В отличие от обычных баз данных, экспертная система для лингвиста не простое хранилище сведений: на основе своих обновленных сведений она должна давать анализ произвольному выражению объектного языка и синтезировать – при необходимости – словоформы конкретной лексемы, коль скоро задан требуемый набор грамматических категорий.

Например, для русского языка система должна уметь анализировать выражения типа лесами, недоигравшимися, бело-сине-красному – соответственно: лес в форме мн.ч.Т.п., недоиграть в форме причастия прошедшего времени действительного залога мн.ч.Т.п., бело-сине-красный в форме м./ср.рода ед.ч.Д.п. Обратная задача: по лексеме в "заглавной" форме и по набору грамматических признаков синтезировать нужную словоформу.

Аналогия с экспертной системой в медицине заключается в том, что "диагноз" и "методы лечения" (в нашем случае – синтез и корректировка словоформ) зависят от сведений, полученных предварительно от человека-эксперта и в силу этого обладают авторством. Такой режим работы с системой назван верификацией потому, что именно он позволяет установить, насколько верна лингвистическая концепция человека-эксперта, опрашиваемого системой. В нашем случае симптомами правильности концепции являются анализ и синтез словоформ, соответствующие интуиции носителя языка.

При построении экспертной системы лингвистических знаний необходимо ориентироваться на учет универсалий и фреквенталий (соответственно, несомненных и частотных законов) языка в качестве элементов базы знаний, то есть, на представления о том, что бывает и чего не бывает в человеческом языке.

-38-

К оглавлению

1. Идея экспертной системы языковых знаний

Идея создания экспертной системы возникла в 1970-х годах, когда исследователи в области искусственного интеллекта занялись построением базы знаний, обладающей элементами искусственного интеллекта [142, с.186]. Экспертная система – программа для ЭВМ, дающая решение (на уровне эксперта) для проблем в некоторой области и обладающая [93, с.164]:

- эвристичностью, т.е. способностью производить умозаключения на основе знания фактов и формальных знаний, объединенных в теорию;

- прозрачностью, т.е. способностью давать объяснения для своего выбора хода рассуждений и отвечать на вопросы о хранимых знаниях;

- гибкостью в усвоении, интегрировании и использовании новых знаний по ходу работы для получения последующих своих решений.

Несколько более конкретно [142, с.186], эта система:

1) ориентирована на конкретную область экспертизы;

2) способна делать выводы из посылок, сформулированных не до конца четко, даже на основе недостоверных предписаний;

3) умеет правдоподобно объяснять ход размышлений;

4) факты отделяет от механизмов логического вывода;

5) способна пополняться по ходу и в результате работы, охватывая все более широкие наборы знаний;

6) обычно основана на наборе правил, в том числе – на практических правилах, формулируемых экспертом-человеком при объяснении хода мыслей;

7) дает прямой совет, а не заставляет спрашивающего делать нужные выводы (как было бы в случае обычных баз данных);

8) обладает коммерческой ценностью, в отличие от многих иных систем искусственного интеллекта, "игрушечного" типа.

Необходимость в экспертных системах диктуется следующими обстоятельствами:

1. Нужно исключить зависимость от субъективности живого эксперта или группы экспертов.

2. Требуется интегрировать знание, полученное из разных

-39-

источников. Особенно важно это для тех областей, в которых уровень развития теории не позволяет достаточно хорошо структурировать знания, когда два эксперта только изредка приходят к единому мнению.

3. Знание одного эксперта необходимо использовать сразу в нескольких разных местах.

4. Необходимо преодолеть слабости человека, в частности, исключить эмоции.

Экспертная система предполагает [213, c.18] наличие:

- эксперта-донора знаний,

- "инженера знаний", извлекающего знания из эксперта и упорядочивающего их,

- структуры понятий для формализации и хранения данных,

- язык программирования для задания алгоритмов.

Общие свойства экспертных систем [213, c.28-29]:

1. Нацеленность на имитацию эвристического поведения человека-эксперта: методы сбора данных, логического вывода, стратегии обработки информации, принципы подтверждения и/или опровержения гипотез.

2. Конкретность области знаний, затрудняющая обобщения.

3. Практическая направленность.

По конструкционным свойствам различаются следующие типы экспертных систем [213, c.58-59]:

1. Информационная система – программа, непосредственно разрабатываемая программистом в режиме непосредственного общения с экспертом. Правила, применяемые системой для логического вывода, не зависят от узкой области знаний. Недостатки: трудности обновления, ревизии и обобщения хранимых знаний.

2. Система обобщения процедур: допускает постоянное взаимодействие между "инженером знаний" и экспертом, но специальные знания выявляются в результате процедур, работающих на некоторой эвристической основе. Например, система диагностики инфекционных заболеваний.

3. Автоматизация работы "инженера знаний": основана на диалоге между экспертом и программой, обычно позволяющей вести диалог с экспертом.

4. То, что пока еще является утопией: система, полностью

-40-

заменяющая эксперта, работающая индуктивно, сама собирающая и обобщающая нужную информацию, проводящая экспертизу на основе фактических данных, литературы и опроса специалистов.

Главная идея и ценность экспертной системы – моделирование динамики знаний. Основные компоненты экспертной системы:

- база знаний,

- механизмы логического вывода,

- модуль расширения и усвоения знаний,

- интерфейс для формулирования пояснений,

- генератор подзадач, вытекающих из проблемы, стоящей перед системой [105, с.294].

По поводу последнего компонента отметим следующее. Рассуждение на основе знаний объектной области у человека связано с тем, что общая задача как бы разбивается на подзадачи, образующие иерархию. Каждой подзадаче соответствуют своя типология знаний и свои критерии правильности решения. На разных этапах рассуждения экспертная система занимается одной из подзадач. К наиболее общим классам подзадач относятся:

1) классификация,

2) абстрагирование от конкретной ситуации,

3) целенаправленный поиск знаний,

4) синтез объекта по уточненному плану действий,

5) проверка гипотез,

6) выведение следствий из компоновки гипотез.

В качестве единиц хранения – "элементарных знаний" – выступают не только декларативные сведения, но и меняющиеся от эксперта к эксперту предписания – правила, что делать при том или ином состоянии обследуемого объекта [254, с.209]. Для лингвистов понятие правила сегодня не нуждается в обширных пояснениях: формулировкой лингвистических правил – правил языка и речи – мы занимаемся всю свою профессиональную жизнь. Моделирование лингвистических правил как базового набора означает необходимость соответствующей архитектуры экспертной системы. Системы, базирующиеся, среди прочего, на хранимых представлениях для правил, позволяют отражать знания, расширяющие возможности эксперта и в то же время по-новому воплощающие в жизнь принцип модульности в сочетании с принципами "логического

-41-

программирования" [254, c.209].

К обычным аспектам поведения экспертной системы – к хранению знаний и к решению задач – отнесено и взаимодействие человека с системой по ходу решения задачи, сотрудничество в логическом выводе и по ходу модифицирования базы знаний [269, с.402]. Обращаясь к помощи экспертной системы по ходу написания текста на ту или иную конкретную тему, пользователь может опираться на двоякую помощь системы:

- выработка аргументации,

- оформление этой аргументации в форме, приемлемой для потенциальных адресатов.

Программы текстовых редакторов в большей степени пока что нацелены на вторую задачу [269].

Общение пользователя с экспертной системой не зависит от глубины проникновения во внутреннюю механику системы. В то же время, это регламентированное общение, поскольку нерегламентированный диалог сложен для самого человека, требует большего сосредоточения внимания, чем тот вид, который явился результатом многих лет программистских наработок со своими – широко известными в практике – приемами и уловками: "меню", подсказки варьирующейся обстоятельности, демонстрационные примеры и т.п. Там, где пользователю разрешено вводить сложные высказывания, имеем следующие проблемы (ср. [223, с.49]):

- переработка текстов как последовательности слов: интерпретация сложных синтаксических структур и перевод их в семантическое представление при учете контекста;

- представление знаний внутри самой системы, разработка вспомогательных средств для формализации, хранения и поиска знаний при обработке показаний экспертов;

- техника дедукции: процедуры доказательства;

- формализация объектного знания, в нашем случае – формализация знаний о языке-объекте.

К оглавлению

2. Хранение и переработка знаний

В этом вопросе есть две стороны:

- содержание знаний,

-42-

- репрезентация знаний, форма хранения, предназначенная для эффективного поиска, переупорядочения и модифицирования.

Эти стороны неразделимы. Например, изобретение нового формального аппарата для представления знаний открывает новые перспективы и для содержательного расширения объема знаний. Чаще всего используются следующие подходы к кодированию знаний для того, чтобы чисто формальным – "синтаксическим" – путем устранять недостоверные сведения, противоречия и обновлять информацию по ходу новых показаний эксперта:

1. Система "продукции" [270]. Знание представляется как набор правил, каждое из которых состоит из двух частей: из антецедента и консеквента, или условия и результата, или (как в порождающей грамматике) левой и правой частей. Однако, в отличие от типичной программы для ЭВМ, "продукция", или "деривация", в рамках такой базы знаний не представляет собой последовательность предписаний, которые следует выполнить одно за другим. Скорее имеется в виду неупорядоченный набор правил (в этом сходство с поздними версиями генеративной грамматики), соответствующий – в своем "пакете" – некоторому элементу базы знаний. Такой элемент может быть легко введен в состав уже имеющейся базы знаний – иерархии "пакетов". При необходимости в этой иерархии можно произвести перестановки. Сам же "пакет" легко ввести в состав уже имеющегося набора знаний, также, при необходимости, модифицируемого в остальных частях.

2. Модификация исчисления предикатов первого порядка, когда знание представляют как высказывание, в котором отсутствуют модальный компонент и кванторы. Эта техника во многом повторяет предыдущую [200, с.74]. Используется также "процедурное представление" части знаний, как в языке программирования пленнер: в то время как в представлениях указанного выше первого типа речь идет о "знаниях, что", здесь скорее формулируются "знания, как". Используется аппарат семантических сетей, аналогичных тем, которые нашли свое применение в психологии для моделирования мыслительных ассоциативных связей в памяти человека. В качестве надстройки фигурируют языки "фреймов". Семантическая сеть состоит из:

- узлов, представляющих объекты, понятия или ситуации;

-43-

- бинарных отношений между этими узлами.

Наконец, при этом же подходе используются системы "продукции", опирающиеся на "правила продукции" типа тех, которые составляют "машину Поста" (предложенную еще в 1943 г.) и широко известны как "правила непосредственно составляющих (НС)" в порождающих грамматиках. Система продукции состоит в таких концепциях из трех частей:

- база правил продукции, каждое из которых читается так: "Если выполнено условие А, то выполни действие В"; в частности, "правила переписывания" интерпретируют "действие" как замену одного символа последовательностью других символов;

- отражение контекста, дающее свойства реального состояния, того, при котором работает данное правило и которое меняется после этой работы;

- интерпретатор, регулирующий применение правила и решающий, какое из конкурирующих правил должно работать в данном случае и каковы дополнительные изменения, которым должен подвергнуться контекст в результате.

3. Аппарат "сверхкатегорий" [193, с.325-329]. Понятия организованы в иерархии, связи внутри которых структурированы так, чтобы осуществлять логический вывод на основе перехода от общего к частному и обратно. Принимаются следующие положения:

- организация понятий в памяти такова, что более конкретные частные понятия наследуют свойства, "признаки", от более общих; возможно и "структурное наследование", когда понятия, входящие в определенную структуру, наследуют признаки некоторой "сверхкатегории" этой структуры. Например, знание понятия продажа предполагает знание понятия передача;

- понятийных категорий больше, чем лексических;

- с помощью одного понятия можно пояснить другое, что не всегда означает, что одно из них зависит от другого.

Эффективность подхода оценивается по гибкости решения проблем и обновления базы знаний в результате работы эксперта с системой. Помимо адекватности и точности, существенна и "плотность" (density), или "детализированность" [155, с.565-583], – количество связей между отдельными понятиями в базе знаний, то есть, насколько детально разработана область

-44-

знаний относительно концепции и хранимых знаний.

Экспертное владение материалом, среди прочего, предполагает способность улавливать скачки от более разработанной, детализированной, области к менее детализированной и наоборот. Плотность системы проявляется в ее реакции на профессиональные параметры пользователя: то, что в качестве адекватного ответа она может предложить хорошему специалисту, показалось бы избыточным или неправдоподобным дилетанту. Сведения о "местном" падеже в русском языке нерусисту – простому носителю языка (в школе слышавшему о "предложном" падеже) покажутся подозрительными, пока ему не продемонстрируют контрастную пару в лесу – в лесе. Итак, одной из важнейших характеристик экспертной системы является способность дифференцированно "общаться" с различными типами пользователей. Строя систему для консультации школьников, студентов и академиков по родному языку, следует учитывать и этот человеческий фактор.

Наконец, задача модифицирования базы знаний, а как частный случай – устранения противоречий. Хранимые сведения могут вступать в противоречие с новыми, поступающими даже от одного и того же эксперта. Есть две тактики [240, с.26]:

- комплекс превосходства, консервативность: подозревать в неаккуратности данные более поздние по времени появления;

- комплекс неполноценности: в неправильности подозревается не последняя по времени информация, а та, которая вызвала конфликт мнений.

Пусть, например, все объекты были разбиты на непересекающиеся классы А, В и С, а через некоторое время некий объект охарактеризовали как обладающий одновременно свойствами А и В. Система ревизии мнений выбирает среди альтернатив одну, прогнозирует последствия предпочтения, сопоставляет полученные результаты при различных выборах. Если противоречие выявляется, пересматривается база знаний, в противном же случае – прибегают к консервативной технике.

Дальнейшее усовершенствование экспертных систем – в учете технологии лингвистического исследования: в аккуратном описании и моделировании операций, выполняемых обычно лингвистами при исследовании и упорядочении материала. В некотором смысле, это

-45-

возвращение к дескриптивистской постановке вопроса, но в рамках одной из подзадач – пополнения экспертной системы. Важное отличие от "методического" периода в истории языкознания состоит в том, что главным при таком пополнении является наличие общелингвистической концепции, верифицируемой с помощью системы при морфологической интерпретации.

К оглавлению

3. Морфологическая интерпретация текста

Для разработчиков экспертной системы нелингвистических знаний этот вопрос обладает скорее практической, чем теоретической значимостью [147, с.250]. Иное положение, когда разрабатывается экспертная система для хранения и пересмотра данных о языке: возможности системы будут различными в зависимости от морфологической концепции создателей.

Мы строим универсальный метаметаязык морфологии, на котором выразим максимально широкий спектр морфологических концепций – как зарегистрированных, так и возможных. Усовершенствование метаметаязыка заключается не только в расширении типов языка-объекта, морфология которого может задаваться в рамках системы, но и типов концепций морфологической репрезентации и структуры языка в целом.

Наше положение в этой связи таково: понимая текст, носитель языка способен дать объяснение каждому отдельному слову (не всегда это объяснение у разных носителей языка будет совпадать), опираясь при этом на свои гипотезы о морфемном составе, т.е. о "внутренней форме" слова [14]. Морфологический интерпретатор решает свою задачу, когда адекватно моделирует эту деятельность человека, в разной степени владеющего данным языком: степень компетентности в языке может варьироваться от нуля до бесконечности.

Далее будем разграничивать понятия следующим образом. Лемматизацией будем называть идентификацию словоформы (текстовой формы слова) как представителя некоторой лексемы, хранимой в словаре. Для этого используются алгоритмы анализа словоформ, устанавливающие базисную, или основную ("заглавную"), форму лексемы. В иной формулировке [322, c.38] лемматизация

-46-

– сведéние словоизменительных парадигм (представленных словоформами) к формам, считаемым заглавными.

Морфологическая интерпретация словоформы – расширение понятия лемматизации на тот случай, когда лексема (или основа словоформы, если ее рассматривать в качестве ключа поиска) не обязательно хранится в словаре, а "вычисляется" по аналогии, на основании других хранимых единиц словаря и свойств анализируемой формы.

Например, словоформу недоперебежишь нельзя лемматизировать, если в словаре нет лексемы недоперебежать или соответствующей ей основы. Но эту форму можно морфологически проинтерпретировать, если в словаре есть лексема бежать или ее основа. В языках с богатым словообразованием морфологическое распознавание текста состоит в интерпретации словоформ.

Морфологическая интерпретация ставит следующие проблемы:

- установление заглавной (фонологической и/или орфографической) формы лексических единиц, той, по которой как по ключу можно найти сведения о семантике, синтаксисе и прагматике всей лексической единицы;

- двустороннее соотнесение заглавного и реального (текстового) лексических представлений.

К оглавлению

4. Система распознавания слова

Ранние системы распознавания текста ориентировались, главным образом, на языки с бедной морфологией или на те, в которых легко отделить основу от флексий [231, c.266]. Алгоритм состоял в распознавании аффиксов и/или флексий в составе словоформы (по сравнительно небольшому списку вспомогательных морфем), после чего оставшаяся часть словоформы – гипотетическая основа – искалась в лексиконе. Обычно вся эта техника выглядела как анализ справа налево. К началу 1980-х годов картина изменилась:

1. В поле зрения попали агглютинативные языки (тюркские, финно-угорские, языки американских индейцев), с богатой и зачастую экзотической (на фоне английского) морфологией. Для них тактика "от флексии – к основе" непродуктивна. Более правдоподобна

-47-

тактика "слева направо": вычисление сначала основы, а затем флексий.

2. Появился целый ряд идей о двуступенчатости распознавания слова, о соотнесении слов одновременно на лексическом уровне и на уровне хранимых словоизменительных парадигм.

Разработанная нами и описываемая в шестой главе экспертная система лингвистических знаний позволяет хранить данные о языке и выяснять, насколько удачна та или иная морфологическая концепция анализа и продуцирования форм языка. Уместно будет в общих чертах описать сначала несколько известных систем.

В "эксперте-распознавателе слов" [293, с.89] каждое слово языка рассматривается как источник сложных экспертных знаний о процедурах понимания слова в различных контекстах. Авторы системы опирались на следующие гипотезы:

1. Знание языка у человека организовано, прежде всего, как знание слов, а не правил.

2. Понимание языка, в первую очередь, – координирование информации между модулями-миниэкспертами (составляющими большую систему "эксперта в области слов"), делящими между собой области влияния в языковом и понятийном окружении. Это значит, что большую экспертную систему для языка надо строить, базируясь на представлениях о том, как должны быть отражены нерегулярности языка, исключения из правил, и только в следующую очередь – как трактовать главные закономерности языка.

В другой концепции морфологическая обработка слова представляется как выявление внутренней структуры слова: анализ слова в виде дерева НС, где в качестве непосредственно составляющих фигурируют объединения морфов [283, с.17]. Выделяются следующие компоненты процессора словоформ:

- парадигматический компонент, задающий словоизменительные ("флективные") свойства словоформ с помощью категорий рода, лица, числа, падежа, времени и наклонения;

- селективный компонент, задающий синтаксическую сочетаемость словоформ в виде логических выражений (приписываемых словоформе);

- иерархический компонент, задающий понятийные иерархии, иногда в корне отличные от деления слов на части речи;

- компонент зависимостей, определяющий, какие синтаксические

-48-

зависимости характерны для данного слова и какую роль в них может играть слово;

- компонент упорядочения слов в предложении.

В третьей концепции [186, с.114] алгоритм, работая в тексте по принципу слева направо, опирается на различительные признаки письменного текста. Число таких признаков сравнительно невелико. Распознанная графическая форма слова далее сверяется со словарем, упорядоченным в виде дерева, что позволяет быстро и легко определить "окрестность" слов, близких к данному по внешнему виду (по сочетаемости букв). В зависимости от того, каково количество слов в такой окрестности, определяется и вероятность правильности прогноза. В среднем же такая окрестность составляет два с половиной слова. Система гарантирует распознавание 85 – 100 % слов в произвольном тексте. Эта механика нашла широкое применение, на ней основано большое число работающих анализаторов слов для английского языка.

К оглавлению

5. Принципы построения интерпретатора слов

Эвристической ценностью в моделировании человеческой интерпретации слов обладают:

- традиции морфологического описания – такие, как латинская, китайская, семитская, индийская;

- возможности разнообразных версий формальных грамматик;

- психолингвистические исследования ошибок.

В поисках общетеоретического (метатеоретического) подхода исследователи подошли вплотную к осознанию следующих идей:

1. В отличие от автомата, человек редко держит в голове все возможности интерпретировать слово. Столкнувшись с трудностями, процессор, как и человек, должен либо повысить свою бдительность, использовать более надежные стратегии поиска и собственно морфологической обработки словоформы (скажем, проверить, не было ли распознаваемое слово результатом какой-либо редкостной морфологической альтернации, сочетания с неожиданными элементами или с малоупотребительными флексиями), либо признать ошибочность слова, либо же, наконец, признать свою некомпетентность. Степень "мобилизационной готовности" варьируется

-49-

в зависимости от этих факторов
[150, c.145].

2. Распознаванию слова помогает учет возможного значения словоформы в целом, его упреждающая семантическая интерпретация: "внутренний лексикон" человека допускает при необходимости и семантический поиск, что роднит его с базами данных стандартного типа. Не случайно, например, при афазии Брока (вид аграмматизма) этот семантический поиск доминирует, вытесняя иные стратегии [330, с.239-231].

3. Семантическая обработка происходит обычно параллельно фонологической/графической. Поэтому человек способен воспринимать малапропизмы (основанные на фонологическом сходстве слов), создающие своеобразный семантический эффект. Однако одни исследователи [146, с.247] считают, что сходство форм обычно констатируется интерпретатором только после того, как получены (в результате семантического поиска) несколько конкурирующих гипотез об анализе слова; другие [301, с.573] – что всегда оба вида поиска одновременно имеют место при интерпретации слова, параллельны, согласуются между собой по промежуточному результату (см. также [127], [300]). Третьи же [137] пытались так представить семантический и формальный поиск, чтобы сделать результат одного из них исходным для другого (см. также [94]). Скорее всего, различные виды взаимодействия, в том числе и перечисленные, одинаково реальны [297]. Выбор определяется предшествующим опытом интерпретации текста [106].

4. Следует различать результаты, полученные неосознанно, и те, которые явились результатом дополнительных усилий, своеобразных "грамматических размышлений" человека. Первые (в частности, даже когда у распознанной лексемы оказывается много равноправных лексических значений) не усложняют значительно всю процедуру обработки, не приводят к "аналитической перегрузке", в то время как вторые могут привести к переутомлению и к перерасходу ресурсов памяти и терпения человека [307, с.375]. Процессор слов должен быть организован так, чтобы и в нем такой перерасход (менее, впрочем, тягостный, чем у человека) происходил, по крайней мере, не в тех звеньях, которые соответствуют работе подсознания человека.

5. На работе процессора слов сказывается конечная цель

-50-

[92, с.98-99]. Компьютер должен использоваться более эффективно, чем пишущая машинка для ввода и редактирования текста. Это

- средство для создания текстов, а потому нужна обратная связь для исправлении ошибок и избегания недоразумений. Каждая замеченная интерпретатором ошибка и любое подозрительное выражение либо автоматически заменяется на вариант, предлагаемый "редактором", либо легитимизируется, т.е. заносится в память как правильное и дальше уже подозрений вызывать не будет. Выбор делает человек, а претворяет в жизнь машина. Примерно так работают наиболее популярные системы; к ним добавляются еще автоматические тезаурусы [92]. От процессора слов требуется максимальная бдительность в сочетании с терпимостью и скромностью, иначе легитимизация авторского словоупотребления станет для пользователя мучением.

К оглавлению

6. Распознавание слова

Для морфологической интерпретации текста распознавание слова сопряжено со следующими моментами [65, c.533]:

- установление лексической идентичности – идентификация лексемы, из которой вытекает набор синтаксических и семантических свойств словоформы как представителя лексемы;

- построение морфологической репрезентации, отражающей словоизменительные категории, передаваемые данной словоформой.

К оглавлению

6.1. Лексическая идентификация

Распознавание слова – решение трех задач [238, c.71]:

- лексический доступ – отображение речевого или письменного сигнала на представление в виде лексической формы;

- выбор, или селекция – установление того, что в наилучшей степени может соответствовать речевому входу;

- интеграция – включение полученного результата (то есть синтаксической и семантической информации, содержащейся в лексемах) в рамки более общих процедур.

Лексическая обработка включает [317, c.2]:

- предварительный лексический "контакт", или "атаку",

-51-

когда слушатель/читатель воспринимает речь/текст как вход и генерирует представления (репрезентации), соположимые с теми видами представления, в рамках которых задается поисковый образ формы слова для конкретной лексической единицы; эти репрезентации называются контактными;

- активизацию: лексические статьи, оцененные как достаточно близкие к контактной репрезентации на первой фазе, гипотетически считаются изменившими свои характеристики и поэтому отличными от глубинного представления;

- селекцию, или выбор: после первых двух фаз продолжается аккумулирование физических данных до тех пор, пока в результате сопоставления с данными лексикона, параллельно этому накоплению, не будет локализована нужная лексическая статья в словаре; такой процесс выглядит как дифференциация (когда прообраз требуемой статьи обрастает все большим количеством деталей), как редукция (противоположный случай) или как простая идентификация (при гипотезе о точном совпадении эталона с экземпляром слова в речи);

- констатация распознанности слова;

- "лексический доступ" – тот момент, когда всевозможные свойства хранимой лексемы – фонологические, семантические, синтаксические и прагматические – становятся полностью доступными интерпретатору, "приземлившемуся" на территории соответствующей статьи в словаре.

В поисках нужного слова по словарю активизируется значительно больше единиц, чем затем понадобится. Этот избыток слов может нечаянно, в виде вкраплений, встретиться в речи или, соответственно, в виде коннотаций (порой весьма навязчивых) обнаружиться в интерпретации чужой речи данным носителем языка. Общие стратегии поиска лексической статьи или ее морфологической обработки [54, c.175]:

- "понтонная" стратегия: значение слова выбирается в качестве временного мостика еще до того, как рассматривается в деталях физический – звуковой или письменный – облик слова; провести в жизнь эту стратегию в чистом виде затруднительно, поскольку имеет место параллелизм и взаимодействие различных фаз распознавания и продуцирования речи, так что семантическое

-52-

упреждение так или иначе должно опираться и на учет физического облика речи;

- каскадная модель, когда считается, что при продуцировании речи уже имеются готовые значения, а формы могут еще только находиться в процессе становления;

- "расширяющаяся активация" (spreading activation), при которой значение и форма слова взаимозависят и при продуцировании, и при распознавании речи, а именно: любое продвижение к значению вызывает соответствующие поправки при рассмотрении формы, а любые дифференциация, редукция или наложение форм приводят к корректировке гипотез о значении целого слова.

В случае устной речи, помимо обычных задач, есть еще распознавание границ слова, усложняющее строение системы, но дающее более глубокое понимание сути лексического поиска. Слушающий не ждет, пока звуковое слово прозвучит целиком: восприятие речи (как, впрочем, и восприятие письменного текста) обладает опережением физического сигнала [239]. Эффективный лексический поиск можно поэтому связать и с умением правильно идентифицировать начало слова и отобрать кандидата из большого числа вариантов. Как показывают экспериментальные исследования [118], [119], [237], процедура распознавания начала слова непосредственно соотнесена и с процедурой лексического поиска.

Одним из индикаторов границ слова является просодия [306, с.520 и след.]. Аналогичную роль играет при лексическом поиске в письменном тексте пунктуация: пробелы, точки, запятые, разбиение на абзацы и строчки и т.п. Поэтому получается, что лексическое представление хранимых языковых единиц – морфов, слов и т.д. – отражает и то, что традиционно внеположено лексике – просодию в широком смысле. В частности, смена сильных и слабых слогов также связана с лексическим поиском. По [151], сильные слоги являются ключевыми: сопоставление распознаваемой цепочки со слабыми слогами эталона слова начинается только после успешного выдвижения гипотез, связанных с сильными слогами.

При восприятии письменного текста лексический поиск опирается на гипотетическое озвучивание текста читающим, на гипотезы о просодической интерпретации в качестве ведущей. В итоге одну часть (априорно одинаково вероятных) предположений читающий

-53-

игнорирует, а другую выводит на передний план. Иногда [306] считается, что лексикон позволяет вести поиск слова не только по внутренней форме (по наличию и линейной последовательности морфов), семантике и синтактике, но и по слоговой и даже по метрической структуре (по структуре мор). "Сговор" семантики и просодии – свойство не только поэтической речи.

Лексический доступ при распознавании письменного текста включает следующие подпроцессы [84, c.108]:

1. Распознавание формы букв, что тривиально, если нет, скажем, диграфов. Однако в немецком не однозначно распознавание буквенного сочетания "sch" как "s+ch" или как "sch" целого знака, читаемого примерно как русское "ш".

2. Построение поискового образа слова, ключа для поиска лексической статьи во внутреннем лексиконе. В частности, отделение неплотно прилегающих к основе префиксов в русском языке (ищем глагол разбежаться при текстовой форме переразбежавшись в предложении Иванов не взял высоту два метра семнадцать сантиметров; переразбежавшись, он поставил новый мировой рекорд) и отвлечение от того, что идет после первого ведущего морфа в слове (таков, например, поиск отглагольного имени по глагольной основе без учета суффикса -ние в русском языке).

3. Выбор лексического "бункера", вокруг которого концентрируются лексические единицы с данным поисковым образом. В обычном алфавитном словаре таким бункером можно считать место в словаре, где идут слова, начинающиеся на данную букву, в китайском словаре – слова, начинающиеся на данный иероглиф.

4. Собственно поиск в рамках найденного бункера, когда решающим фактором является относительная частотность (соответственно которой и упорядочены лексические статьи внутри бункера), причем в зависимости от обстоятельности поиска иногда прекращают дальнейшие поиски, как только найдено первое решение, а иногда стремятся найти все возможные решения.

5. Проверка после нахождения статьи. В отличие от фазы поиска (когда "ключ" примеряется к заголовку лексической статьи), учитываются все детали, считаемые существенными в рамках лексикона данного языка. Если проверка дает отрицательный результат, поиск возобновляется.

-54-

6. Считывание лексической статьи – собственно "лексический доступ": все содержимое лексической статьи становится доступным процессору.

Собственно лексическим поиском в этой схеме можно назвать фазы с третьей по пятую, пока еще не локализована лексическая статья. Все эти фазы взаимодействуют таким образом, чтобы поддерживать, а не затруднять выполнение соответствующих операций в рамках других фаз-модулей. Конструкторы морфологического процессора стремятся оптимизировать такое взаимодействие. В частности, по [73, c.197], морфологический процессор для сложных слов в английском и голландском языках должен быть устроен так, чтобы в рамках целого предложения слова с деривационными суффиксами обрабатывались легче, чем без них. Слова с "синтаксически ориентированными" аффиксами, типа перфектных форм глагола на ge-, облегчают распознавание целого предложения.

К оглавлению

6.2. Словоизменительная идентификация

Вслед за С.Андерсоном [65, c.535] можно предположить, что в лексиконе при морфологической обработке отыскиваются корни или "производные основы", являющиеся "несущей конструкцией" словоформы.

Скажем, в арабском лексиконе основа takallam – "разговаривал" (так называемая пятая порода от основы kalama – "говорил"), получаемая регулярным образом от исходного корня (в данном случае от корня klm), ищется по исходному корню (klm). И только потом рассматривается множество парадигм – "парадигматическое пространство" – данной лексической единицы, позволяющее определить, входит ли словоформа в такое парадигматическое пространство. Это пространство в лексической статье можно обозначить некоторым символом, по которому как по ключу ищется описание парадигмы в отдельном хранилище информации. Тогда лексикон представим в виде набора пар:

- лексический ключ – корень или производная основа,

- морфолого-парадигматический указатель.

В экспертной системе эта информация содержится:

- в виде процедур, встроенных в процессор, в сам его алгоритм,

-55-

и соответствующих универсальным, то есть действительным для всех человеческих языков, процедурам морфологической интерпретации;

- в виде "наполнения", или параметров, действительных специально для данного языка и внеположенных алгоритму, но регулирующих работу алгоритма таким образом, что в сочетании с универсальными процедурами получается реальный набор правил словообразования и словоизменения конкретного языка, во всех частностях и исключениях.

Универсальный компонент должен предусматривать по возможности полный набор выбираемых параметров – различительных признаков конкретного языка – относительно данного процессора, разумеется. Эти параметры – не что иное как типологические характеристики, исследуемые лингвистами уже давно и известные во многих деталях.

Например, языки располагаются на непрерывной шкале "флективность – агглютинативность". "Кумулятивные" парадигмы (в смысле работы [102, c.601]) с омонимией окончаний, как парадигмы склонения и спряжения в латинском, русском и многих других флективных языках, должны использоваться при морфо