Э. К. ЛАВОШНИКОВА

О  «ПОДВОДНЫХ КАМНЯХ» 

В  КОМПЬЮТЕРНЫХ  СИСТЕМАХ  ПРОВЕРКИ  ПРАВОПИСАНИЯ

Переработанный  вариант  статьи,  опубликованной в журнале  Вестник  Московского  университета.  Серия 9.  Филология.  2002,  № 6,  с.151-163.

Статья  служит  предостережением  для  пользователей  персональных  компьютеров,  работающих  с  текстами  на  русском  языке  и  слишком  доверчиво  воспринимающих  сообщения  орфокорректоров.

На  примере  системы  MICROSOFT   WORD   выявляются  причины  не  всегда  корректной  работы  современных  автокорректоров,  а  также  даются  рекомендации  для  дальнейшего  совершенствования  таких  спеллеров.

«Почему именно ОРФО?»

Проблемы, возникающие при создании машинных словарей, обслуживающих компьютерные системы проверки правописания,  логично было бы обсуждать на примере наиболее распространенного  спеллера,  «спелл  чекера» или  «спел-чекера» (как справедливо отмечает  В. А. Успенский [12],  общепринятого русского термина для таких программ нет).  В текстовый редактор для  IBM -совместимых компьютеров  MICROSOFT WORD   встроен  автокорректор (еще одно название)  ОРФО – система проверки правописания.

В версии  WORD2000 используется тот же автокорректор, что и в версии 1997 г. Очевидно, был сделан вывод, что он уже достаточно эффективно работает, подчеркивает слова, отсутствующие в его словарях, что заставляет пользователя решать вопрос (иногда с помощью так называемой «подсказки») об их орфографической корректности, подчеркивает сомнительные синтаксические конструкции, ошибки в пунктуации, а также по мере возможности следит за стилем.  Массовый пользователь в ближайшем будущем вряд ли станет заменять  WORD 2000  чем-то новым.

Стилистика – дело тонкое.  Начнем с русской орфографии.

«Опасное сходство»

При поверхностном тестировании оказалось, что в основном словаре автокорректора ОРФО имеются (порождаются из основ и окончаний) следующие слова:

адАптация (адаптивный,  адаптировать)  и   адОптация (адоптивный, адоптировать),

браННый  (бранные  слова)   и   браный,

вскоре   и   в   скоре,

достИгать,  постигать  и   достЕгать,  постегать (от глагола  стегать),

кОртежикАртеж,

летчик-аси   летчик-асс,

пародировать и парадировать (от слова  парад),

(пере)платить   и   (пере)плотить (от слова  плот),

подражать   и   подрожать (от глагола  дрожать),

полеННица (дров)   и   поленица (богатырь, ватага  удальцов),

помешАнный  и помешЕнный (от глагола помесить),

(по)щИпать   и   (по)щЕпать (откалывать  лучину),

прЕзрение  (презирать, презреть)  и   прИзрение (призирать, призреть),

прЕпираться   и   прИпираться (от глагола припирать),

хАлява  и  хОлява,

эстАкада  и   эстОкада.

Этот список может быть продолжен. Подобные схожие по звучанию пары слов в академических словарях часто снабжены толкованиями. Так, в «Грамматическом словаре» А. А. Зализняка [3]

к термину  адоптация  дано толкование «принятие»;

к прилагательному  браный – «вытканный узорами»;

к существительному  скора  дается примечание – «старин., собир.: шкуры» (поэтому  «в  скоре» должно означать  «в шкурах»);

к слову  картёж «игра в карты»;

к существительному  асс – «древнеримская монета»;

к слову  призрение дано толкование «попечение»;

к существительному  холява «стеклянный цилиндр; голенище»;

к термину  эстокада  дается толкование «удар шпагой».

К сожалению, компьютерная грамотность не всегда сочетается с безупречным владением родным языком.  Не каждый пользователь станет обращаться к академическим словарям, многие полагаются на спеллер, а если он пропускает вышеприведенные слова без замечаний, то подобный кажущийся «плюрализм» в написании слов может привести к пропуску ошибок.

«Понимай как знаешь»

Чтобы проиллюстрировать, в какой степени можно полагаться на работу автокорректора ОРФО (версия WORD 2000), ниже приводятся специально придуманные предложения с «разрезаниями» слов (дефисом или пробелами), со «склеиваниями», с удвоением или пропуском букв и прочими типичными ошибками. Эти же фразы могли бы послужить  для  тестирования и других компьютерных систем проверки правописания.

В примечаниях к этим предложениям даны заглавные слова и фрагменты словарных статей, взятые из «Русского орфографического словаря» [9]. Некоторых слов нет в [9]. В таких случаях даются ссылки на другие словари. Для некоторых слов даны ссылки на толковые словари.

Слова,  отсутствующие  в  словарях  [1], [2], [7], [8], [9]  и  [10],  помечены  сочетанием  символов [*].  Слова, отсутствующие  также  и  в  «Грамматическом  словаре  русского  языка»  А. А. Зализняка (1977 г.),  помечены символами  [**].

1.  Стриптиз-ерша, каскад-ерша  и  дизайн-ерша  не  что   иск   али.   Каждя  из  них  ползада (sic !)  и  сбирала  в  оологическом  саду, в  близи  того  мест   а,  где  си  дел  ежь,   для  своей   певче  птички   и  ли   голуб   я  всяки  ж   ирных   черв   яков.

(См.:  ёрш,  «али... союз»,  каждить [**],  зад,  «сбирать(ся)... устар.», оологический,  близь,  «си... нота...»,  дело (или  деть),  ёжить(ся),  певчий,  голуба,  «всяк, другие формы не употр. (всякий)»,  «ирный корень и аирный корень»,  черва,  як.)

2.  Од  ин  дальне  восточный  перевод   чиккура  тор и  пи   онер  морс  кой  тема  тики,   г  ерой  пол-юса,   како   нем  пишет  вся печатня (sic !)  продукция, сутра  очень  пи-сучий,  хотя  впивает  только  кофе   и   ли   како.

(См.:  ода,  «ин частица»,  дальний,  «чик, неизм.»,  кур (или кура),  тор (или тора),  «пи... название буквы, матем.»,  «онёр: со всеми онёрами»,  «кой... устар. к  который»,  тик,  «г грамм»,  ёра [9], [11],  «юс... название буквы»,  «како, нескл., с. (название буквы)»,  немой,  печатня,  «сутра, -ы»,  сучий,  впивать(ся).)

3.  Вышвыряете,  выбросаете  кучу  де   нег  на  не   вежду.  Он  станет  пи   тать  после  пол-учения  так  их  су  мм  запродажу  пи-ара,   полчая (sic !)  больше  друг  их  в  ваш  ем  фон-де,   не   сбыточные  надежды.

(См.:  вышвырять,  «выбросать... простореч.» [11],  де [**],  нега,  «вежды... ед. вежда»,  «пи  название буквы»,  «тать, -я» [7], [9],  учение,  су,  «мм миллиметр»,  запродажа,  «ара, нескл., м. (попугай)» (или  «ар  ед. измер.»),  чай,  есть,  фон,  «-де  частица»,  сбыточный (сбыточное ли дело?).)

4.  Закраем   кварт  ала  время  нок, о  коло   указ-теля   нов   ого   по   ворота  к  почто   вой  станции   нетям   и  кочек, но  ж   аль, что  нети  ни  одного  пеше  хода.

(См.:  «закрай... закраек»,  кварта,  алый,  «нок... мор.; археол.»,  «коло, нескл., с.» [9], [10],  «теля, теляти,  других форм нет...»,  новый,  «ого, неизм.»,  почто [7], [9],  вой (или выть),  «нети: в нетях»,  «ж и же, частица...»,  «аль, али, союз»,  пеший.)

5.  У захваченных  намосту  через  полчеса (sic !)  после военных  манеров (sic !)  язы   ков  коники с  победным  клико  отобрали  всеоружие,  абой  продол  жался.

(См.  сочи   нения   Лермонтова,  «Вал-ерик»).

(См.:  намост,  чёс,  «манер: на манер...»,  яз [*],  ковы [7], [9],  «коник... уменьш. к кон и конь»,  клико,  «всеоружие, -я: во всеоружии»,  аба [*],  продол [*],  сочить(ся),  нения [9], [10],  ерик [7], [9].)

6.  Кто там? Не  ужели  я  вас  о  бижу,  яко  всем  обращаюсь.  Раздан  так  ой  приказ,  стань  те  вряд  или  вкруг.

Отвеет ( sic !):  А  ник-то!  Но  вый   конь  в  паль-то!  Запря  гай!  Нуда,   верно  мыслете ( sic !),  это  плотни   к.

(См.:  ужели,  бижу [*],  яко,  «розданный... роздан» ( разданный [**]),  ой,  «вряд частица устар. к вряд ли»,  «вкруг устар., нареч.»,  отвеять(ся),  никнуть,  выя,  «паль, -и»,  запереть(ся),  гай,  нуда,  «мыслете... название буквы»,  плотнить,  к.)

Автокорректор  ОРФО  при  любой  настройке  не  выдает  никаких  замечаний  к вышеприведенным  «высказываниям». Нет подчеркиваний  красной  волнистой  чертой – предупреждений о возможных орфографических ошибках, т.к. все эти слова (от пробела до пробела или знака препинания) имеются или  порождаются в основном словаре спеллера, нет и подчеркиваний зеленой  волнистой  чертой – предупреждений о синтаксических или стилистических ошибках.

«Как слово наше отзовется?»

Далее мы получим новые подтверждения перегруженности словаря автокорректора  ОРФО  архаичной  и  редко  употребляемой  лексикой.

Слова-примеры  проверялись  по  «Орфографическому  словарю» [8].   Если  в  [8]  какого-либо  слова (словарной  статьи)  нет,  то  оно может  быть  представлено  в  «Русском  орфографическом  словаре» [9],  если  его  нет  и  в  этом  более  объемном  словаре,  то  такое  слово  помечено  [*],  [**] (см. выше)  или  номером  другого  словаря  из  списка  литературы  в  конце  данной  статьи,  если  такая  словарная  статья  там  имеется.

Текстовый редактор  MS   WORD   вроде бы не имеет ничего против устаревшего слова  теля [9]  в значении «теленок» даже при настройке на деловую переписку.  Казалось бы, много места в машинном словаре это  «теля»  не займет, пусть будет!  Однако беда в том,  что оно не лежит спокойно в словаре спеллера,  а иногда вылезает,  как подводный камень.  Слово  теля  предлагается  WORD ’овской подсказкой в перечне вариантов для некоторых слов с ошибками (например, «леля»  вместо  деля).  Кроме того, автокорректор не замечает ненужных пробелов и дефисов (разрезания словоформ) в следующих примерах:

«учи  теля»,  «люби  теля»,  «глуши  теля»,  «зри  теля»,«нагрев-теля»,  «нагрева  теля»,  «строи  теля»,  «указ-теля»,  «указа  теля»,  «держа  теля»,  «иск-теля»,  «иска  теля»,  «спаса  теля»  и др.  Таких разбиений  с  теля, где первая часть выступает как нормальная словоформа, обнаружено свыше 230.  Еще пример безнаказанного разбиения в некоторых контекстах:  «теля  тина».

Если бы подобный словарь использовался при  машинном  переводе,  то в результате таких разрезаний на выходе получалось бы:  «учи  теленка»,  «указа  теленка» (вернее, иностранные эквиваленты этих словосочетаний) и т.д.

При  сканировании  со сгиба развернутой книги иногда могут не считаться в память компьютера первые или последние символы строки.  Если в прилагательных  маленький  или остаточный  пропадет первая буква, то WORD ’овский автокорректор на получившиеся слова  аленький [8]   и  статочный [8] («статочное ли дело?») никак не прореагирует даже при настройке на деловую переписку, тем более что  синтаксис  предложения при таком  «урезании» останется без изменений.

В основном словаре автокорректора ОРФО представлены ботанические термины  перилла [8]  и  ость [7], [8],  термин  севр (фарфор) [9], геологический термин  трапп [8],  астрономический  вертикал [8],  морской термин  протрактор [8], [10], музыкальные термины  затакт [8], [9],  нона [8], [9]  и  нонет [8], [10].

Никаких предупреждений  к  узкоспециальным терминам,  «похожим»  на более употребительные словоформы и конструкции, подсказка  ОРФО (версии 1997 и 2000) не выдает.

В идеале по желанию пользователей им должны предоставляться дополнительно различные тематические словари. Однако и в данных версиях текстового редактора есть возможность завести свой небольшой личный словарь.

«Напрасные слова, уж вы не обессудьте...»

Разумеется, многие употребительные местоимения и другие короткие слова нередко совпадают с началами или концами более длинных словоформ и могут при случайных разбиениях слова пропускаться.  С этим приходится мириться.  Но старые наименования букв  како [8] (есть такая буква!),  ерь [8] и  ук [9] могли бы снабжаться особыми пометами. Их можно было бы и совсем убрать из основного словаря автокорректора. Кстати, слово  ер [8]  как старое название твердого знака в словаре автокорректора ОРФО отсутствует, хотя и порождается такая словоформа. Как нетрудно убедиться, словоформы  ер,  ерой (ёр,  ёрой) и т.д. образуются в системе  ОРФО  от устаревшего слова  ёра [9].  В «Толковом словаре русского языка» под ред. Д. Н. Ушакова (1935 г.) дается значение слова  ёра – «озорной гуляка, волокита».

В словаре автокорректора  ОРФО  имеются паронимы  замешанный (от глагола  замешать) и  замешенный (от глагола  замесить).  Кроме того, от редкого глагола  замшить [*], помеченного в словаре Д. Н. Ушакова [11] как областной («обложить, покрыть мхом»), в системе ОРФО образуется еще и причастие  замшенный, которое в текстах пользователя с большей вероятностью может получиться в результате пропуска первой  «е» в слове  замешенный.

Приведем еще несколько примеров лексем, включенных в основной словарь автокорректора  ОРФО,  которые с большей вероятностью могут быть получены в результате распространенной ошибки - пропуска буквы:  поветь [8],  (обл.) в [9],  рожество [*],  преставление (смерть) [8],  корец [8], в [11] - «обл., ковш».

Так  ли  уж  необходимы  устаревшие,  областные  и  диалектные  слова  в  основном  словаре  системы  проверки  правописания?

В словаре ОРФО представлены устаревшие, возвышенно-поэтические лексические единицы  угль [*],  брег [9],  ветр [*]  и  огнь [8].  А в результате - ошибочный пропуск гласной в словах  уголь,  берег,  ветер  и  огонь  автокорректором не будет замечен.

Из-за присутствия в основном словаре архаизма  млеко [*]  в значении  «молоко»  без каких-либо предупреждений может быть пропущено ошибочное разбиение  «млеко  питающее».

В словаре автокорректора ОРФО имеется редкий устаревший глагол  неводить [*], образованный от существительного  невод. При достаточно распространенной опечатке – замене символа  «л» на соседний по клавиатуре символ  «д»  в глаголе  неволить - слово с такой ошибкой не будет подчеркнуто («не хочу тебя неводить»). Кроме того, присутствие в словаре спеллера глагола  неводить  приводит к тому, что пропускаются сращения глагольных форм от глагола  водить  с отрицанием  «не»:  невожу,  неводит,  неводили  и т.д.

В словаре ОРФО имеются устаревшие глаголы  преложить [8]  и  прелагать [8],  схожие по смыслу и написанию с  переложить  и  перелагать.  Из этого следует, что если  в высокочастотных  словах  предложить,  предложивший,  предложенный  или  предлагать,  предлагающий, предлагаемый  пропадет буква  «д», а в глаголах  приложить,  прилагать  или в образуемых от них причастиях вместо  «при»  набрать  «пре»,  то автокорректор  ОРФО  таких ошибок не  заметит.

В словарях текстового редактора  MS   WORD   представлены и никак не обособляются  низкочастотные глаголы:  взмутиться [8],  вкраивать [8],  вмесить [8],  вымеШать [8],  вытроить [*], густить [8],  досажать [9], низойти [8], прашивать [8],  прейти [8], пригашать(ся) [8],  сроить(ся) [8],  утонить [8] и  утонять(ся) [8],  уточить [8]  и др.  (Далеко ли до греха?  Даже при настройке на деловую переписку при нечаянной перестановке букв вместо глагола  искать  может появиться глагол  сикать [8],  каковой спеллером ОРФО никак не подчеркивается.)

Такие глаголы, а иногда и образуемые от них причастия в реальных текстах пользователя скорее могут появиться в результате пропуска или замены букв в более употребительных словах.

Подобные  почти  не  употребляемые  слова  можно  было  бы  убрать  из  словаря  автокорректора,  поскольку  он  нацелен  на  обнаружение  ошибок  в  текстах  массового  пользователя  и  не  обязан  включать  в  себя  всю сокровищницу  архаичной  лексики.

Эти слова в текстах пользователя просто будут подчеркиваться красной волнистой чертой как не  найденные в словарях спеллера.

Справедливости ради следует отметить, что некоторые слова (к архаичной лексике это не относится) все же вызывают у автокорректора  ОРФО  сомнения с точки зрения стиля. Подсказка относит их к  жаргонной,  разговорной,  просторечной,  экспрессивной  или даже  бранной  лексике.  Они подчеркиваются (на первом этапе проверки) красной, а чаще зеленой волнистой чертой. Но списки таких помеченных слов в системе  ОРФО  далеко  не  полны.  Например, у глагола  спотыкнуться  в словаре  А. А. Зализняка есть ссылка на глагол  споткнуться,  где к варианту  спотЫкнуться  дается помета  простореч.,  однако система  ОРФО  слово  спотЫкнуться  пропускает без каких-либо подчеркиваний.

«Требуется особый подход»

Если архаичную и специальную лексику можно вывести за пределы основного словаря автокорректора, то более употребительные слова,  «слишком похожие» на другие, желательно было бы на этапе создания машинных словарей снабжать  особыми  пометами.

Представим себе такую ситуацию.  В тексте несколько раз встретилось слово  страница, но только один-два раза - страННица или  станица.  Эти слова могут появиться и в результате опечатки в слове  страница.  Для подобных случаев (контингент  и  континент,  контракт  и  контакт,  смеЩение  и  смеШение)  желательно было бы предусмотреть особое сообщение:  «Это  ли  слово  имелось  в  виду?».

Фразеологизмы (устойчивые обороты речи) требуют особой обработки. Однако автокорректор ОРФО выдает подчеркивания красным (претензии к орфографии) в конструкциях:  «притча  во  языцех»,  «вынь  да положь» (им признается только нормативная форма повелительного наклонения  положи),  «ничтоже  сумняшеся»,  «скрепя  сердце» (неграмотное  «скрипя  сердце» у спеллера ОРФО не вызывает возражений). Можно  «воздать  сторицей»,  а можно  «воздать  стАрицей», что в системе ОРФО тоже никак не возбраняется.

Некоторые  сокращения,  которые не могут стоять в начале предложения, автокорректор должен был бы проверять на заглавную букву, чтобы впредь не пропускалось: «Проч.», «Др.»,  «Т.д.»,  «Т. п.».

Синтаксис  предложений  с сокращениями не всегда успешно проверяется.  Так, система  ОРФО  не  имеет замечаний к фразе с пропущенным мягким знаком  «Он  пошел  проч.».

«Конца пока не видно»

Казалось бы, словарь автокорректора  ОРФО  очень богатый, может претендовать на какую-то полноту и всеохватность, раз включает в себя даже редко встречающиеся в современных текстах слова.

К сожалению, это не так. Не находятся и подчеркиваются красным ставшие популярными в последнее время, но не всегда имеющиеся даже в сравнительно новых изданиях словарей следующие слова: 

автовладелец [8],  автослесарь [8],  гиподинамия [8], [10],  землеотвод [2],  зомбировать [1],  комплексовать [9],  компромат [9],  мегаполис [9],  наркокурьер [9],  политкорректный [1],  растаможить [9],  сверхдержава [8],  телеведущий [9],  фермерствовать [**] и многие другие.

Кроме того, если даже в словаре автокорректора ОРФО имеются слова   дотировать,  лобби,  харизма,  маргинальный  или   эксклюзивный, то слов  дотироваться [9],  лоббировать [9],  харизматический [9],  маргинал [9],  маргинализация [9],  эксклюзив [9]  или   эксклюзивность [9]  нет.  То есть включение механизмов  словообразования - задача для будущих версий автокорректора.

Отсутствие в версиях 1997 и 2000 годов многих неологизмов можно было бы объяснить консерватизмом специалистов, отвечающих за пополнение словарной базы спеллера, их осторожностью, нежеланием вносить  «отсебятину».

Допустим, пользователь хочет узнать, не выходя за пределы текстового редактора, как следует писать:  риЭлтор [**]  или  риЕлтор [1], [9],  рИмейк [**]  или  рЕмейк [1], [9],  кремлЕнолог [8]  или  кремлИнолог [9],  плеЙер[8]  или  плеер[1], [9] (если новые заимствованные слова и включены в последние издания словарей, то единодушие в их написании бывает  не  всегда).  Но пользователю как бы отвечают, что таких новых слов в словарях автокорректора  ОРФО  пока еще нет.

Система  ОРФО  не знает слов  электорат,  камикадзе,  смог (есть глагольная форма, нет существительного - смога)пицца,  ваххабиты  или  фундаментализмкоторые представлены даже в сравнительно старых изданиях словарей иностранных слов (см. [10]).

В системе  ОРФО  иногда не обнаруживаются и давно известные и привычные слова, если не всегда имеющиеся в наиболее доступных изданных в разное время словарях, то довольно часто встречающиеся  в газетных текстах.

Примеры:  заметочка [9],  защитничек [9],  наследничек [**],  проводочек [**],  телефончик [9],  заначка [8],  технарь [8],  подыгрывание [9],  зарабатывание [9],  (не)воспроизводимость [**],  невысказанность [9],  влекомый [8] («влечь... влекомый» [3]).

В системе  ОРФО  нет некоторых образований с префиксами (приставками) и префиксоидами:

антисанитария [9],  исхалтуриться [**],  нафантазировать [8],  по-абхазски [**],   подредактировать [9],  порассуждать [8],  поприсутствовать [9],  разгерметизация [8],  растиражировать [8],  самоирония [9],  соцреализм [8],  спецсеминар [8]  и др.

Частые  «ложные тревоги»,  т.е.  необоснованные подчеркивания из-за недостаточной полноты словаря автокорректора приводят к тому, что пользователь перестает обращать на них внимание и в результате может пропускать слова с ошибками.

«Как вас теперь называть?»

Имена  собственные  имеют свои особенности в склонении.  Примеры:  «лошадь под Петей Ростовым»,  но «под городом  Ростовом»,  говорим о девушке  Любови (эта форма от имени  Любовь  спеллером  ОРФО  объявляется  сомнительной,  т.к. не порождается в его словарях), о гражданине  Немеце.  Они не подчиняются правилам русской орфографии (фамилии  Мкртчян,  Козак,  газета  Коммерсантъ  и др.).  Слова, начинающиеся с заглавной буквы,  если они не найдены в основном словаре, проверяются по словарю имен собственных.

В системе  ОРФО  нет топонимов  Смоленщина [9],  Рязанщина [9]  и т.п.  Такие названия, как  Алания [**] (Северная Осетия)  и  Саха [9] (Якутия),  появились в нашем лексиконе примерно в одно и то же время,  но  Саха или  Кыргызстан [**]  в словаре имен собственных спеллера  ОРФО  имеются, в то время как  Алания,  гордая  Ичкерия  или новая столица  Казахстана  Астана  пока еще подчеркиваются как ненайденные.  Нравятся нам новые названия или нет, но желательно знать, как они пишутся.

В словаре имен собственных  ОРФО  отсутствуют такие (ставшие достаточно популярными) женские имена, как  Алёна [8],  Элина [**],  Марианна [8]  и  Марьяна [8],  хотя неформальные  Мариша,  Светка  или  Шурочка  имеются.  Не представлено отчество  Виссарионович  (уже подзабыли?)Нет также вариантов отчеств  Иваныч,  Васильич,  Андреич  и т.п., которые могли бы подчеркиваться (зеленым) как разговорные.

Производных от имен собственных, разумеется, может быть очень много, это открытый список.  Но всё же:  не  обнаруживаются в словаре спеллера  ОРФО  прилагательные  лермонтовский [9],  тургеневский [9],  достаточно частотное слово  сталинизм [8].

«Что включено в словарное гнездо?»

Превосходная степень в словаре автокорректора могла бы образовываться от большего числа прилагательных, поскольку такие сравнительно длинные слова со специфическими суффиксами, как правило, не превращаются в «подводные камни» и не мешают спеллеру выполнять свои функции.  Однако в системе  ОРФО  объявляются ошибочными (подчеркиваются красным) образования  свежайший,  аппетитнейший,  безобиднейший,  благотворнейший,  несноснейший,  пренеприятнейший,  толерантнейший  и др. (соответствующие прилагательные в исходной форме в словаре ОРФО представлены).  В системе ОРФО не порождается образование  наивыгоднейший [9], хотя  слово  выгоднейший  представлено.

Для автокорректора  ОРФО  многие слова с отрицательной частицей  «не-»  оказываются  «неизвестными».  Примеры

невыездной [9],  неаппетитность [2],  негуманность [9],  немногочисленность [9],  неощутимость [9],  несинхронность [9],  нетипичность [9] и др.  При этом соответствующие лексемы без частицы  «не-»  в словаре  ОРФО представлены.

В системе  ОРФО  в разных контекстах пропускаются без замечаний сомнительные сращения кратких страдательных причастий с отрицательной частицей  «не».  Примеры предложений с такими не отмеченными спеллером ошибками:

Защита здесь   непредусмотрена.

Посылка  неполучена.   Правильные выводы  несделаны.

«Возможны варианты?»

Автокорректор  ОРФО  пропускает без замечаний даже при настройке на деловую переписку стилистические  варианты  слов и падежных окончаний, которые следовало бы сопровождать соответствующими предупреждениями. Примеры искусственно построенных предложений с параллельными вариантами окончаний:

С этою  будущею  перерегистрациею  и  с  полученною  лицензиею  мы  начнем  первый  этап  акциею,  ассоциирующеюся  с  презентациею.

Предприятья   гидромашиностроенья  в связи  с наличьем   сокрытья  прибыли  от  налогообложенья   подлежат снятью  с участья  в  соревнованьях.

Радушье,  проявленное  Наталиею,  способствует  нашему   взаимодоверью.

Никаких подчеркиваний со стороны спеллера ОРФО.

Справедливости ради следует отметить, что варианты  этоюлетнею,  погодою,  открытья,  свершеньятомленье  и т.п. иногда встречаются в поэтических текстах.

«На спеллер надейся, а сам не плошай!»

При поверхностном тестировании обнаружилось, что WORD ’овский автокорректор подчеркивает как неправильные формы  ходов,  ходам  и т.д. (не склоняет слово ход в косвенных падежах множественного числа, хотя помета «минус», указывающая на отсутствие мн. числа,  дана в словаре А. А. Зализняка только в одном из значений слова  ход).

В системе ОРФО не представлены варианты глагольных форм от  блистать (наряду  с  блистает) - блещет,  блещутподчеркивается как неправильная словоформа  чтут (образуется только вариант  чтят), не пропускается форма повелительного наклонения  выбросьтене считаются допустимыми варианты  замучает, измучают, помучаю, промучает и т.д.  Признаются только формы  замучит,  измучит  и т.д.

Имеются и другие досадные недочеты.  Например, автокорректор  ОРФО  не знает форм  родительного падежа множественного числа  сыновей,  плоскогубцев,  круглогубцев  и  авиаписем [2] (предлагает форму  *авиаписьм), образует ненормативные словоформы  *турков,  *ботиночков.  Кроме того, в словаре спеллера  ОРФО  порождаются ненормативные формы  *раздан,  *раздано,  *разданный,  *исчезший (вместе с формой  исчезнувший).

В системе  ОРФО  порождаются и такие  «странные»  словоформы:  промысЕла,  промыселы;  спался,  спалась,  спавшийся;  лежусь,  лежатся,  лежалась,  лежась,  лежащийся,  лежавшийся (в словаре  А. А. Зализняка [3]  к глаголам спаться и лежаться  дано указание безл. - Пример:  Мне не спится,  не лежится).

Из фразеологизма  «ни зги не видно»  автокорректор производит словоформы, которые в современном русском языке не употребляются:  зга [**]згу,  згой,  згою  и т.д.

В словаре автокорректора  ОРФО  имеются такие словоформы, которые с гораздо большей вероятностью могут получиться в результате склеивания при невнимательном редактировании текста или при сканировании. Словарь  А. А. Зализняка [3] к заглавному слову словарной статьи  всеоружие  после  двоеточия  приводит выражение  «во всеоружии»,  а к слову  нети – «в нетях».  Двоеточие означает, что слово употребляется только в приводимом сочетании и, следовательно, не должно быть таких словоформ, которые порождаются в системе  ОРФО:  всеоружия,  всеоружию,  нетей,  нетям и т.д.

В системе  ОРФО  «узаконена»  часто встречающаяся в современных текстах, но не рекомендуемая академическими словарями и справочниками форма  найм (нормативная форма именительного падежа - наём).  Однако справедливости ради отметим, что столь же  «популярное»  слово  займ автокорректор ОРФО пока еще подчеркивает как ошибочное.

«И не играть словами...»

Далее мы увидим большую  «россыпь подводных камней».

Если в словах  отряд,  подотряд  по  «техническим причинам»  пропадет конечная буква  «д», то автокорректор ОРФО воспримет получившиеся  «словоформы»  отря и  подотря  как деепричастия от глаголов  отереть  и  подтереть.

В системе ОРФО «узаконено» очень много более чем странно звучащих деепричастий от  глаголов  совершенного  вида: 

распростря,  нападя,  заползя,  перемря,  умря,  вымря,  запря,  сопря,  отопря,  вотря,  сотря,  утря,  вытря,  а также  исчезши,  подвигши  и т.д.

С другой стороны, многие из тех деепричастий прошедшего времени, которые даны  в  «Грамматическом словаре» А. А. Зализняка [3] (растерев,  вытерев,  отперев,  замерев), в системе  ОРФО  не  образуются и подчеркиваются как неправильные.

Кроме того, автокорректором ОРФО порождаются сомнительные в стилистическом плане, пусть даже теоретически возможные формы деепричастий от  глаголов  несовершенного  вида. Примеры: 

грев,  давав,  делав,  дув,  ев,  жав,  изготовляв,  крав, крыв,  лежав,  мирив,  пев,  смотрев,  рвав,  стояв,  терев,  требовав  и т.д.

Как правило, такие деепричастия от глаголов несовершенного вида подчеркиваются зеленым как не рекомендуемые данным спеллером.  Подсказка объявляет их малоупотребительными. Однако они как раз этой же подсказкой рекомендуются, если не найденные в словарях автокорректора ОРФО слова  «похожи» на эти деепричастия (отличаются одной буквой).  Например, если в слове  заявлять  пропадет последняя буква (мягкий знак),  то для получившегося  «заявлят»  подсказка предложит среди прочих вариант  «заявляв».

Образование  таких  сомнительных  в  стилистическом  плане  грамматических  форм  не  только  засоряет  подсказку,  но  может  приводить  и  к  пропуску  ошибок.  Так  стоит  ли  словоформами,  не  рекомендуемыми  никакими  справочниками,  обременять системы  проверки  правописания?

В  «Грамматическом словаре»  А. А. Зализняка [3] особыми символами отмечены прилагательные,  краткие  формы  от которых почти никогда не употребляются.  Однако в системе ОРФО такие краткие формы образуются и пропускаются без замечаний:  дальне,  дочерня,  зелененьки,  легонька,  осторожненька,  прежни,  свеженьки,  тихонька,  углекисла  и т.д.  Очевидно, что эти слова в современных текстах с большей вероятностью могут быть получены в результате обрезания  «по техническим причинам»  последней буквы.

Часто в тех случаях, когда в словаре  А. А. Зализняка [3]  даются указания, что какие-либо формы из парадигмы слова затруднены или избегаются, в словаре автокорректора  ОРФО они порождаются и пропускаются без замечаний.  Например:  осную,  оснуетоснуем, от слов  часок,  роток,  кусток - часку,  часков,  ротки,  роткамкустком,  кустками  и т.д.

С другой стороны, парадигмы некоторых слов необоснованно сокращены.  Например,  слово  кондиция  пропускается без замечаний только в единственном числе,  а словоформы  кондиций,  кондициям,  кондициями,  (о)  кондициях  подчеркиваются как ошибочные.  Ниже даны примеры других существительных, которым вразрез со словарем  А. А. Зализняка [3] в системе  ОРФО  тоже отказано во множественном числе.  В компьютерном словаре спеллера  ОРФО  нет 

задержаний,  обрезаний,  ориентаций,  паралогизмов,  подчеркиваний,  прозаизмов,  разбиений,  размораживаний,  разрезаний,  репутаций,  сигнализаций,  совмещений,  тюркизмов,  угадываний,  удержаний,  фантасмагорий,  эвфемизмов  и др.

Список существительных, представленных в данной системе  только  в  единственном  числе,  неоправданно велик.

«Шаг влево, шаг вправо не дальше одной буквы»

Подсказка автокорректора  ОРФО, как было показано выше, пока оставляет желать лучшего. Даже если в заимствованных словах  чат [**] или  чарт [1] против правил русской орфографии допустить букву «я», реакция спеллера ОРФО не изменится – то же подчеркивание красной волнистой чертой всего слова и никаких замечаний в подсказке.  Даже  при  утроении  какой-либо буквы - никаких особых сообщений, хотя такое может встречаться практически только в аббревиатурах, да в словосочетании  длинношеее животное.

Для местоимения  ихний (прост. к их) [9], которое система ОРФО также объявляет просторечным, но сначала подчеркивает красным, подсказка должна была бы предложить нормативное притяжательное местоимение  их, однако она  выдает только один вариант -  «более похожий»  термин  ионий.

Для ненормативной формы  *полотенцев подсказка не предложит нормативную форму родительного падежа мн. числа  полотенец, а предлагает выбрать из списка  «полотенце,  полотенцем,  полотенце  в».

Разумеется,  «Москва не сразу строилась»,  но хотелось бы высказать пожелание, чтобы в следующих версиях автокорректора подсказка не только механически заменяла в ненайденном слове каждую букву всеми другими по очереди, а, например, такие стилистически не очень приемлемые и отсутствующие в словарях отглагольные существительные, как  «реализовывание» [**],  предлагала заменить словом  реализация,  «загружение» [**] – загрузкой,  «раздавание» [**] - раздачей и т.д.

Заключение

Из всего вышеизложенного главный вывод такой.

Чем богаче основной словарь автокорректора, тем больше ошибок пропускается,  чем он беднее, тем больше «ложных тревог».

С одной стороны, желательно, чтобы в каждой очередной версии словарь пополнялся новыми словами.  С другой стороны, в основном словаре должны быть выявлены малоупотребительные слова и словоформы, которые могут совпасть с искаженными (в результате наиболее вероятных ошибок и опечаток) достаточно употребительными словоформами.  Такие  «подводные камни»  могли бы снабжаться особыми пометами или выноситься в дополнительные компьютерные словари.

Литература

1. Большой иллюстрированный словарь иностранных слов. - М.: «Русские словари», «Астрель», АСТ, 2002.

2. Букчина Б. З., Калакуцкая Л. П.  Слитно или раздельно? Орфографический словарь-справочник. - М.: Рус. яз., 1998.

3. Зализняк А. А.  Грамматический словарь русского языка. Словоизменение. - М.: Рус. яз., 1977.

4. Лавошникова Э. К.  Классификация ошибок при вводе словарей и текстов в ЭВМ и их предупреждение // Материалы III Всесоюзной конференции по созданию Машинного фонда русского языка. - М., 1990.

5. Лавошникова Э. К., Трусов А. В.  Знакомьтесь, «спелл чекер» // Интеркомпьютер. №2, 1989.

6. Лавошникова Э. К., Трусов А. В.  От «спелл чекера» к автокорректору // Интеркомпьютер. №1-2, 1991.

7. Ожегов С. И., Шведова Н. Ю.  Толковый словарь русского языка. - М.: «Азбуковник», 2001.

8. Орфографический словарь русского языка (под ред. В. В. Лопатина) / РАН. - М.: Рус. яз., 2000.

9. Русский орфографический словарь: около 160 000 слов (под ред. В. В. Лопатина) / РАН. - М.: «Азбуковник», 2000.

10. Словарь иностранных слов. - М.: Рус. яз., 1989.

11. Толковый словарь русского языка (под ред. Д. Н. Ушакова). - М., в 4-х томах, 1935-1940.

12. Успенский В. А.  Труды  по  НЕматематике (С приложением семиотических посланий  А. Н. Колмогорова к автору и его друзьям). - М.: ОГИ, 2002. - Т.2, с.915.