ФУНКЦИОНАЛЬНО-СЕМАНТИЧЕСКАЯ ИНФОРМАЦИЯ В СЛОВАРНЫХ...

23
18Ч,\ 0X03-2400 Структурная и прикладная лингвистика

Transcript of ФУНКЦИОНАЛЬНО-СЕМАНТИЧЕСКАЯ ИНФОРМАЦИЯ В СЛОВАРНЫХ...

18Ч,\ 0X03-2400

Структурная и прикладнаялингвистика

С.ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Издается с 1987 г.

СТРУКТУРНАЯИ ПРИКЛАДНАЯ ЛИНГВИСТИКА

Межвузовский сборник

В ы п у с к 4

Под редакцией А. С. Герда

САНКТ-ПЕТЕРБУРГИЗДАТЕЛЬСТВО С.-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

1993

ББК 81Д С87

Сборник (адп.З вышел в 1987 г . ) содержит статьи, охваты­вающие широкий круг проблем современной теоретической и при­кладной лингвистики. Рассматриваются актуальные вопросы се­мантики и синтаксиса, применения математических методов в языкознании, разработки лингвистических основ автоматической обработки текстов.

Для специалистов по прикладной и Математической лингви­стике .

Р е д а к ц и о н н а я к о л л е г и я : д-р филол.наук В.В.Богданов, д-р филол. наук Л.З.Бондарко, д-р филол. наук А.С.Герд (отв. редактор), д-р филол. наук Б.Ю.Городецкий.

Р е ц е н з е н т : д-р филол. наук Л.Н.Беляева (Рос.гос. пед. ун-т)

Печатается по постановлению Редакционно-издательского совета

С.-Петербургского университета

п 1403000000 - 088 лт а? 076(02) - 93

(р) Издательство ^ С.-Петербургского

университета, I 993

М.И.О I к у I щ и к о в а, Н.Д.К р е м н е в а,Н.Л.К и р и ч е н к о, В.Л.З а м б р ж и ц к и й

ФУНКЦИОНАЛЬНО-СЕМАНТИЧЕСКАЯ ИНФОРМАЦИЯ В СЛОВАРНЫХ ПРОЦЕДУРАХ

ДЛЯ АНАЛИЗА ТЕКСТОВ УЗКОЙ ПРЕДМЕТНОЙ ОБЛАСТИ* *

В статье рассматривается проблема организации и представ­ления лингвистических баз данных, необходимых и достаточных для автоматизированного анализа текстов узкой предметной области "Арифметические задачи на равномерное движение".*

М. И. Откупщиков а. Н.Д.Кремнева, Н. Л.Кириченко, В.Л.Замбр- жицкий, Т993

* В статье излагаются результаты работы участников семи­нара: М.И.Откупщиковой Н.Д.Кремневой, НЛ.Кириченко, Г.М.Смир­новой, Б.Ю.Моревой, В.Л.Замбржицкого, проводимого под -руковод­ством М.И.Откупщиковой в 1987 г . в лаборатории математической лингвистики НИИММ ЛГУ.

* Такай предметная область была принята для разработки ла­бораторией математической лингвистики в 1985 г.

т

К выбору узкой предметной области привел практический опыт создания больших и малых систем анализа.2

Лингвистическое теоретическое обоснование эта идея полу- ччила позднее. В основном оно сводится к следующим аргументам.

I ) Естественные тексты моделируют миры действительности как ре­альные, так и нереальные, возможные. Эти миры практически бес­конечны. 2) Система, моделирующая п о н и м а н и е текста человеком, не может ограничиться грамматическими уровнями ана­лиза - в ней должна учитываться с е м а н т и к а в широком смысле этого слова ( т .е . знания о мире, сведения о соотнесении единиц текста с объектами описызаемого текстом мира, прагмати­ка и т . д . ). Коль скоро миров действительности бесюнечно много,' то становится невозможным (необъятным практически), по крайней мере в настоящее время, создание глобальной кибернетической си­стемы, моделирующей понимание любых текстов любых предметных областей.

Тексты арифметических задач на равномерное движение, хотя и оформлены по законам русской морфологии, оинтакоиоа и оин-таксиса текста, весьма специфичны, и эта специфика требует осо­бого лингвистического аппарата описания, далеко не всегда при­менимого к другим предметным областям.

Прежде всего в этом плане отметим два общих момента.I . Для каждого текста задач характерно единообразие ком­

муникативной функции побуждения, которая может быть описана языковой "формулой": я (автор текста задачи) хочу, чтобы адре­сат (читатель, ученик и т . п . ) решил эту задачу ( т .е . на основе зэданных параметров вычислил неизвестные). Специфика здесь не только в единообразии, но и в том, что коммуникативную функцию побуждения выполняет целый законченный текст, состоящий из не­скольких предложений, что в обычной ситуации коммуникации, ес­ли не считать текстов инструкций, встречается довольно редко.

2 Ц е К т и н Г.С. О соотношении естественного языка и формальной модели / / Общение с ЭВМ на естественном языке. Воп­росы кибернетики. М., 1982. Вып.80. С .2 0 -й .

О #

О т к у п щ и к о в а М.И. Синтаксис сводного тексте (структурная лингвистическая модель: Авторвф. дао. . . . докт. фи~ лол. наук. I . , 1987.182

2 . В т о р о й м о м е н т с в я з а н с п р о б л е м о й р е ф е р е н ц и и . О ч е в и д н о , ч т о в д а н н о м с л у ч а е н и к а к о г о п р я м о г о с о о т н е с е н и я с р е а л ь н о й д е й с т в и т е л ь н о с т ь ю в т е к с т а х з а д а ч н е м о ж е т б ы т ь в о т л и ч и е о т т а к и х , н а п р и м е р , в ы с к а з ы в а н и й , к а к Н а ш а м а м а у е х а л а о т д ы х а т ь в Я л т у , г д е р е ч ь и д е т о р е а л ь н ы х о б ъ е к т а х , д е й с т в и и и е г о о б с т о ­я т е л ь с т в а х .

Т е к с т ы з а д а ч о т р а ж а ю т с и т у а ц и и п р и д у м а н н ы е , х о т я и п о д о б ­н ы е р е а л ь н ы м . В н и х п р е д с т а в л е н с п е ц и ф и ч н ы й п о д в и д н е р е а л ь н о г о м и р а ( с р . м и р с к а з к и , л е г е н д ы , х у д о ж е с т в е н н о г о п р о и з в е д е н и я и т . п . ) , о д н а к о о т л и ч а ю щ и й с я о т п о с л е д н и х с в о е й г л о б а л ь н о й д о п у с ­т и м о с т ь ю , п р е д п о л о к и м о с т ь ю , п о т е н ц и а л ь н о с т ь ю : З а с к о л ь к о в р е ­м е н и п е ш е х о д п р о ш е л ( б ы ) п у т ь е с л и б ы ш е л с о с к о р о с т ь ю Л ?

В ы с к а з ы в а н и я т а к о г о т и п а с ф о р м о й и р р е а л ь н о г о с о с л а г а т е л ь ­н о г о н а к л о н е н и я о б р а з у ю т о д и н и з с п о с о б о в в ы р а ж е н и я к а т е г о р и и п о т е н ц и а л ь н о с т и . ^ С р . о б щ е я з ы к о в о е : Я м о г б ы п р о й т и э т о р а с с т о я н и е з а 5 ч а с о в - д е й с т в и е н е с о в е р ш а е т с я , н о м о ж е т б ы т ь с о в е р ш е н о . ® '

О д н а к о в д а н н о м в ы с к а з ы в а н и и н е р е ф е р е н т н о , н е р е а л ь н о т о л ь ­к о д е й с т в и е , а в т е к с т а х з а д а ч н е р е ф е р е н т н ы в с е о б ъ е к т ы и д е й ­с т в и я , о н и к в а з и р е ф е р е н т н ы . Р е ф е р е н т н а я с п е ц и ф и к а т е к с т о в з а ­д а ч о б л е г ч а е т п р о б л е м у р е ш е н и я р е ф е р е н ц и и . Т а к к а к в с е т е к с т ы к в а з и р е ф е р е н т н ы , т о н е н у ж н о д и ф ф е р е н ц и р о в а т ь р е ф е р е н т н ы е и н е р е ф е р е н т н ы е в ы с к а з ы в а н и я ( п о с л е д н и е в Д р у г и х п р е д м е т н ы х о б ­л а с т я х - э т о у с л о в н ы е , п о т е н ц и а л ь н ы е к о н с т р у к ц и и и т . п . ) .

В примере Пройдя путь А В , турист рассчитал, что он м о г б ы п р и й т и в В н а Т ч раньше, если б ы п р о х о д и л в час на 0 , 8 к м больше, и н а полтора часа позже. если б ы п р о х о д и л в час на 0 .8 км меньше. Ччем в действительнос­ти. Найдите расстояние АВ выделенные конструкции обозначают,

^ З н а ч е н и е п о т е н ц и а л ь н о с т и к а р д и н а л ь н о о т л и ч а е т с я о т з н а ­ч е н и я н е р е а л ь н о г о у с л о в и я , к а к в п р и м е р е : Е с л и бы я ю г прийти к 7 ч а с а м , т о м ы у с п е л и б ы н а 8 - ч а с о в о й с е а н с - н о я н е м о г . . . и п о э т о м у мы н е у с п е л и . . . Т а к а я т р а н с ф о р м а ц и я н е в о з - м о ж н а в с л у ч а е п о т е н ц и а л ь н о г о з н а ч е н и я .

® С м . : Э с л о н П . А . М о д а л ь н о е з н а ч е н и е возможноет и / н е - в о э м о к н о с т и в р у с с к о м я з ы к е ( т и п о л о г и я и с р е д с т в а выражения;: А в т о р е ф . к а н д . д и с . . . . , к а н д . Ф и л о л . н а у к . Л . , 1 9 8 7 .

183

что турист не совершал таких действий, однако мы знаем, что он не совершил в действительности и первого действия. Весь текст квазиреферентен, и мы извлекаем из него нужные сведения о па­раметрах движения, как будто бы он весь референтен.

2. Каждая задача представляет собой условие, которое дол­жно быть выполнено, чтобы имело, место следствие: нахождение не­известных величин, т .е . решение задачи.

В кибернетической системе, имитирующей мыслительную дея­тельность человека, решающего задачу, в результате автоматичес­кого анализа текста должна быть вызвана программа, которая на основе известных параметров осуществит необходимое вычисление. Это - суперцель анализа текста арифметических задач. Непосред­ственной же, ближайшей целью такого анализа является п о с т ­р о е н и е о п е р а т и в н о й с е т и д а н н ы х - кон­кретного фрейма задачи, которая содержала бы необходимые и до­статочные сведения для вычисления неизвестных величин, п о ­с л е д у ю щ е е с р а в н е н и е этой сети с типовыми се­тями данных (моделями движения), и/или в ы з о в т и п о в о й с е т и д а н н ы х и п р а в и л ь н о е е е з а п о л - н.е н и е для последующего решения.

Вот это соотнесение данных текста с типовой моделью по­средством конкретной оперативной сети данных и можно интерпре­тировать, как осуществление квазиреференции.

3. Типовые модели движения - необходимая часть п о с т о ­я н н о й базы лингвистических данных системы.

Моделей равномерного движения - ограниченное количество. Приведем наиболее характерные для текстов задач.^

а) Модель простого движения. Это основная конструкция, яд­ро:.: которой является предикат движения, связывающий три основ­а х параметра: "расстояние", "время", "скорость” .

Остальные модели обозначают составные движения разных ти­пов.

б) Модель обратного движения в двух его разновидностях:

ж»

Предлагаемая система моделей равномерного движения (тер­мин Г.С.Цейтина) представляет собой модификацию и дополнение (как в аспекте структуры моделей, так и в аспекте их классифи­кации) предложенных Г.В.Цайтиным в октябре $986 г . на научном семинаре лаборатории математической лингвистики двух моделей Движения: простого и составного.

полном (от А до В и от В до А) и частичном (от А до В и от В до какого-то .пункта на линии В-А)- Постоянным свойством полно­го обратного движения является удвоение числового значения па­раметра "расстояние".

в) Модель встречного, движения в двух разновидностях: ка­ноническое встречное (когда объекты встречаются на линии А-В) и частное встречное, когда они сближаются на линии А-В, не встречаясь.

г ) Модель движения вслед. Ее разновидности определяются сочетанием следующих парных признаков; доотиженш^недостикения конечного пункта движения одним или более объектом,наличия/от- оутствия ситуации, когда один объект догоняет другого.

д) Модель взаимного удаления объектов (в противоположном направлении из одного или разных пунктов на линии движения).

е) Модель пересекающегося движения в двух вариантах (дви­жение из точки пересечения или в точку пересечения).

ж) Модель со сложной скоростью, сложность которой зависит от дополнительных условий прохождения пути в воздушной или вод­ной среде. Вариативность определяется наличием благоприятству- ющих/неблагоприятствующих условий.

А. Обеспечение указанной выше непосредственной задачи ана­лиза текста - формирования оперативной сети данных осуществля­ется при помощи словарной информации единиц словаря, входами которых служат лексемы. Этот словарь - основной компонент по­стоянной лингвистической' базы „данных.

Отличие предлагаемого подхода к описанию словарной инфор­мации от предыдущих заключается: 1) в объединении лексической, семантической, грамматической и другой информации в одной сло­варной процедуре, что создает возможность равноправного и од­новременного ее использования при анализе,' и 2) в возможности указания в словарной статье на необходимость выполнения стан­дартных и индивидуальных процедур, характеризующих "поведение" слова в предложении и тексте.. На этом основании словарная ста­тья называется словарной процедурой, а представление словарной информации в словаре - процедурным представлением.®

7' В этом случае моделируется представление о естественном,

"человеческом", процессе понимания текста.® Ц е й т и н Г. С ., О т к у п щ и к о в а М . И . , Л е й -

185

5. Ниже речь пойдет о лингвистических признаках, релеван­тных для выполнения указанной выше задачи.

I ) С е м а н т и к а. Этот признак определяет семантиче­ский класс лексемы и его подклассы. Для данной предметной об-оласти глубина иерархии этих признаков не превышает двух.

Семантический класс глаголов: "двигаться, идти, ехать, плыть" - "предикат движения", и только у глагола "плыть" сущест­вен учет подкласса "водное", потому что при движении по реке скорость движения зависит от течения реки.

Интересно отметить, что специфика предметной области и ее "узость" показывают нерелевантность использования компонентно­го семантического анализа в полном виде. К примеру, разницу меж­ду лексемами "женщина" (сема "взрослость") и "девочка" ( - ^ к о ­торую столь важно, к примеру, учитывать в медицине и психоло­гии, для денной задачи несущественна.

Семантический класс слова "другой" - "идентификатор",име­ющий значение "д ва". На основании этого признака вызывается стандартная процедура вычисления идентификации, необходимая по­тому, что при всех идентификаторах в данной предметной области со значением "два" и больше существительное может элидировать- ся, и необходимо во всех случаях обращаться в предтекст, чтобы

к и н а Б.М ., Н е в л е в а Т.Н. Система анализа текста с про­цедурным представлением словарной информации / / Актуальные во­просы практической реализации систем автоматичестого перевода. 4 .1 . М., 1982. С .20 5-231; Р а з р а б о т к а и эксперимен­тальное исследование комплексной модели естественного языка с алгоритмическим представлением словарной информации (заключи­тельный отчет) У1ГК - 519:766. № Госрегистрации: 81030328. Л.,1985: Ц е й т и н Г.С. Программирование на ассоциативных се­тях 7 / ЭВМ в проектировании и производстве. Л ., 1985. С .И 6 - 148; К и р и ч е н к о Н.Л. Исследование возможности стяже­ния сочетаний слов, обозначающих одно понятие, для задачи ав­томатического анализа предложения / / Проблемы обработки инфор­мации. Л ., 1985. Выл.22. С.100-106.

Е проектируемой системе все лингвистические сведения о ле­ксеме организованы в виде особого формализма - словарной гипо­тезы, которая представляет собой существенную часть математиче­ского обеспечения системы, но которая в данной статье не рас­сматривается (см. ' . Р а з р а б о т к а ' и экспериментальное исследование комплексной модели я зы к а ... ; Ц е й т и н Г.С. Программирование на ассоциативных сетях).

® Вообще глубина иерархии открыта. С р .: Ц е й т и н Г .С ., О т к у п щ и к о в а М.И., Л е й к и н а Б .К .,, Н е в л е- в а Т.Н. Система анализа текста с процедурным представлением словарной информации.186

произвести процедуру его смыслового восстановления: Один пеше­ход шел со скоростью... другой - со скоростью ,..; Легковой ав­томобиль... Iрузовой - Первый п о езд ... второй - . . . и т.п.

Словарные процедуры лексем, которые по своему семантичес­кому классу относятся к базовой семантике,®1 включают в себя процедуру, работающую с соотношением семантической структуры этих лексем** и поверхностной синтаксической структуры.

Например, каждый параметр движения определяется единицей измерения и числовым значением. Кроме того, он имеет свое имя.В тексте, эта семантическая сеть (структура) реализуется в раз­ных ипостасях: с именем параметра, без имени, о особого рода редупликацией имени параметра:

Расстояние 25 км-----1------------I---

имя параметра числовое единица значение измерения

Он прошел 25 км - нет имени параметра Длина пути - 25 кмРасстояние длиной 25 км Г Редупликация имени параметра

Интересным случаем семантической информации, постоянной относительно описываемого мира, является семантика прилагатель­ных "скорый, пассажирский, легковой, почтовый, г а зо в о й ) и т.п., которые, подобно словам "первый, второй", выполняют в этом слу­чае функцию идентификатора при пассивно предсказанном ими объ­екте, но имеют при этом неопределенное числовое значение. Оп­ределение числового значения у этих слов происходит в процесое анализа: первая встречаемость в анализируемом тексте слова с неопределенным идентификатором диктует приписывание ему число­вого значения "единица", вторая - "д ва". " Л е г к о в а я ма­шина (машина^) вышла и ̂ А .. . Навстречу ей шла г р у з о в а я мамина,. . (м а ш ю ^ ) .. . Процедура вычисления числового значения идентификатора вызывается словарными статьями этих лексем.

Л е й к и н а Б.М., Н и к и т и н а Т.Н., О т к у п - щ и к о э а М.И. Элементы базового представления внутренней структуры (коннекторы) П Лингвистические проблемы функциональ­ного моделирования речевой деятельности. Л ., 1976. вып.з. о .в -

См.-: Ц е й т и н Г.С. О соотношении ка и формальной модели; О т к у п щ и к о в связного текста. Л ., 1982.

естественного язы- М.И. Синтаксис

187

2 ) Г р а м м а т и ч е с к и е п р и з н а к и опреде­ляют часть речи, номер парадигмы для изменяемых слов, а также процедуры, определяющие грамматическое поведение слов. Напри­мер, транспонированные формы глагола: деепричастие и причастие теряют часть своих синтаксических валентностей.

Интересно отметить, что в текстах задач деепричастия час­то дублируют семантику основного сказуемого, выполняя формаль­ную функцию уменьшения величины куста слов, зависимых от основ­ного предиката: Д в и г а я с ь по течению, пароход идет со скоростью. . . : Турист взбирался на гору, идя со скоростью Знм/ч.. Поезд, следуя из одного города в другой, прошел.. .

Очевидно, что для Задачи анализа можно счесть деепричас­тия избыточными - их можно элиминировать (кстати, в естествен­ной коммуникации эти выражения легко трансформируются в одно­глагольные, с р .: Турист взбирался в гору со скоростью... ) . Од­нако такая трансформация не всегда возможна или удобна;, Довер­шая двухдневный поход, пионеры были в пути всего 9 ч . .№

8 ) С е м а н т и к о - с и н т а к с и ч е с к~и е пр е“д- с к а з а н и я . Важнейшими сведениями, обеспечивающими уста­новление связей между словами и предложениями текста, а также восполнение смысла элидированных элементов текста, являются сведения о способности лексемы предсказывать наличие в тексте других лексем, связанных с ними семантически и/или синтаксиче­ски.

Семантические предсказания определяют сочетаемостные свой­ства данной лексемы в терминах предикатно-актантной структуры.

• Например, предикат движения семантически предсказывает че­тыре актанта: движущийся объект, расстояние, скорость и время. Необходимость установления таких семантических предсказаний оп­ределяется спецификой данной предметной области, которая тре­бует экспликации всех физических параметров равномерного дви­жения. Ср. общеязыковые высказывания типа Как быстро идет ма­шина; По реке плывет баржа, а на ней жгут костер и т .п . . для. которых установление обязательности четырехактантной структуры

^ 0 случаях свертки именных групп см.: К и р и ч е н ­к о Н.Л. Исследование возможности стяжения сочетаний слов . . .

*88

явно избыточно и, кроме того, может дать неправильный сигнал об анте- или постцедентном эллипсисе, которого в действительно­сти нет. Отсутствие части актантов в последних примерах свиде­тельствует о запланированной автором неопределенности некото­рых параметров движения, в то время как в нашем случае отсутс­твие актантов обозначает или эллипсис, 'восполнение которого не­обходимо совершить на основании сведений из пред- или посттек­ста, или то самое неизвестное, вычисление которого является су- перцелью анализа. Пример: Автомобиль движется со скоростью 40 км/час. Какое расстояние он пройдет за 5 часов?

Все параметры глагола "движется" (и его заместителя - си­нонима "пройдет"): движущийся объект, скорость, время и рассто­яние, неизвестность которого определяется вопросительным сло­вом "какой?" - распределены в тексте из двух предложений.

Пример определения параметров в предтексте: Спортсмен тра­тит 10 минут, проходя половину своего маршрута на лодке, и вдвое дольше добирается до финиша вплавь. Сколько времени ему пона­добится. если он с самого начала будет передвигаться только вплавь?

Параметр "скорость" ("вдвое дольше") для предиката "передвигаться вплавь" мы можем определить, лишь анализируя предтекст при помощи процедуры замещения. Неопределенность па­раметра "расстояние" должна быть элиминирована при помощи опе­раций с другими параметрами и оперативной сетью данных.

Признаки семантического класса и семантического предска­зания лежат в основе определения омонимии, синонимии и лексико­синтаксической вариативности.

Приведем пример. Каждый "поверхностный" вариант выражения элементов, предсказываемых лексемой "расстояние", представляет собой лексико-синтаксическое предсказание, при этом для масси­ва задач имеющее равновероятное с соперничающими вариантами по­явление. В таких случаях набор вариантов удобно задавать таб­лицей, указание на работу с которой дается .также из словарной процедуры лексем с семантическим классом "расстояние" (см.табл.X

Теоретической базой аппарата семантических предсказаний является грамматика предсказаний,^ в основе построения кото-

13 Ц е й т и н Г.С. О соотношении естественного языка и формальной модели... С. 45; О т к у п щ и к о в а М.И. Синтак­сис связного текста. С .88, 89. ,пд

лексем с семантическим классом -расстояние

рой лежит представление о способности любой языковой единицы в связном речевом произведении или его части поставлять реципи­енту набор предсказаний о других языковых единицах, связанных синтаксической связью. Это представление о роли предсказаний в процессе понимания легко апплицируется к словарю.

Функционально-семантическая основа предсказаний связана с морфолого-синтаксическими факторами, которые иногда являются определяющими.

Как вкратце показано выше, набор предсказаний словарной единицы существенно зависит от предметной области и задачи ана­лизов.

Синтаксический статус имеет дифференциация а к т и в н о ­го и п а с с и в н о г о предсказания. Активное обозначает предсказание управляющего слова на синтаксически управляемое им, а пассивное - управляемого на управляющее. Например, любая согласованная форма (адъективы) предсказывает своего хозяина - существительное, которое она "определяет" и с которым согласу­ется по правилам руоского согласования. (Для установления свя­зи с существительным словарная процедура каждой адъективной лексемы вызывает стандартную процедуру согласования.) Установ­ление пассивного предсказания весьма существенно при обработке эллиптичных конструкций.

В случае неуспеха вызванной процедуры согласования ока вы­зывает процедуру "Эллипсис".̂ Учет пассивного предсказания ле­жит в основе обработки однородных конструкций, эллипсиса пре­диката и т.п.

4) Признак способности языкового выражения быть мар­к е р о м (сигналом) в ы з о в а определенной модели движения.

Тексты задач содержат много таких сигналов: например,сло- ва другой, второй свидетельствуют о необходимости вызова моде­ли составного движения с двумя движущимися телами; встреча.на­встречу. встречаются, встречный - составного встречного; обрат-

^ Случаи субстантивирования причастий в текстах задач редки, поэтому конкурирующая гипотеза об эллипсису должна иметь большое предпочтение. Редкий пример субстантивации: Насколько идущий по включенному эскалатору опередит того, кто будет ехать по нему,..191

иый, обратно, назад, возвращаться - составного обратного; в од­ном и том же направлении, туда ие. вслед за. следом за. вдогон- ку, друг за другом, передний. .. задний... проследовать, дого­нять, нагонять, перегонять, гнаться - составного движения двух объектов в одном направлении; в противоположные стороны, в про­тивоположном направлении, на север. .. на ю г... - составного дви­жения в противоположных направлениях; пересекающийся под прямым углом, по сторонам. . . треугольника, на север.. . , на восток.. . . по горизонтали. . . . по вертикали... - составного движения с пе­ресекающимися трассами и т.д.

5) Признак наличия о м о н и м а . Следует отметить, что омонимия не характерна для лексики данной предметной области, хотя отдельные случаи ее все же имеются. Например, слово "дру- .гой" в косвенных падежах омонимично второму компоненту взаим­ного местоимения "один другого" и дифференциатору "другой (по­шли д р у г и м путем )„

Омоним часто различим по структуре предсказаний. Это ка­

сается также функциональных омонимов. К примеру, слово "кото­рый" в качестве прилагательного пассивно предсказывает опреде-^ ляемое им существительное и имеет в этом случае значение "ко­торый по счету". В к о т о р о м ч а с у велосипедист дого­нит пешехода, если...

Существительное который не связано с каким-либо существи­тельным своего предложения, а строго влево (через запятую) предсказывает существительное другого простого предложения, за­местителем которого оно является: . . . п е ш е х о д , к о т о - р и й шел со скоростью б км/час.. .

6) С и н о н и м и я для интересующих нас текстов более

характерна.Часты обычные лексические синонимы: скорый - курьерский;

товарный - грузовой: автомобиль - машина; отплыть - отчалить - поплыть; отойти - выйти - отправиться.

Синонимы определяются по семантическому классу и предска­

занию. Учет синонимии важен при решении проблемы гиперсгагтак-

спчески.х связей, а именно замещения. Поэтому При наличии сино-

4

нимичеокого ряда в словарных процедурах его членов должны сЗыть взаимные отсылки к этому ряду, на основании которых и должна решаться задача замещения при помощи синонима.*5

Иногда используется общеязыковой прием своеобразной мето­нимии: П о е з д от пункта А до пункта В шел со скоростью 40 км/час. В пункте В м а ш и н и с т увеличил скорость. .. Здесь "машинист увеличил скорость" равно по смыслу задачи "поезд уве­личил скорость". Ср. также: "автобус - шофер", "самолет-пилот" Есть несколько путей решения проблемы смысловой связи между та­кими словами:

а) выделить понятия движущегося объекта и субъекта, одна­ко при этом неясно, как решать в этом случае проблему замеще­ния;

б) объявить эти слова условными синонимами и сделать вза- имоотсылки из словарных статей;

в) описать их смысловые связи при помощи лексических функ­ций "тот, кто ведет поезд" - "машинист"- и т.п .

7) Л е к с и ч е с к и е п е р и ф р а з ы . Их учет так­же необходим при анализе текстовых связей: Пешеход п р о х о ­д и т р а с с т о я н и е между А и В за 5 ч . а в с а д ­н и к преодолевает его за I ч. Во сколько раз п у т е ш е - о т в и е в е р х о м быстрее п е ш е г о ? Всадниктот, кто совершает путешествие верхом, пешеход - пешее путеше­ствие.

Без установления таких связей невозможно правильно сформи­ровать оперативную сеть данных.

Смысловые конверсии типа "А больше В - В меньше А" можно вычислить при помощи особой процедуры вывода, вызываемой сло­варной статьей лексем "больше", "меньше".

8) 1 е к с 1 к о - г р а и « э т и ч е с к а я к о н в е р - с и я. Грамматическая конверсия типа "отплыть - отплытие" долж­на вычисляться грамматической стандартной процедурой или прос­тым указанием на наличие такого конверсива в словарной проце­дуре каждого предиката. Учет ее также необходим для решения проблемы замещения. Однако часто замещение производится при по-

15 Сн.гЦ е й т и н Г.М. 0 с о о т н о ш е н и и е с т е с т в е н н о г о язы­ка и формальной модели; О т к у п щ и к о в а М.И. С и н т а к с и ссвязного текста.

*98

мощи грамматического конверсива от другой лексической единицы, синонимичной замещаемому "отплыть - отход, отправление, выход".

Этот случай еще раз подтверждает необходимость взаимных отсылок между членами синонимического ряда в словаре.

9 ) } р а з е о л о г к я. Специфика предметной области по­чти исключает возможность употребления настоящих фразеологиз­мов - оказываются употребительными устойчивые сочетания терми­нологического типа: "стоячая вода, железная дорога, место на­значения, • гаревая дорсжка, по течению, против течения, на подъ­еме, на спуске, в гору, под гору, быть в пути" и т .п ,

Й ) С в е д е н и я о р е а л ь н о м м и р е (обстоя­тельствах, сопровождающих движение).

П л о т движется от пункта А до пункта Н О . часов со ско­ростью 2 км в час. К а т е р затрачивает на этот путь 2 часа. Сколько времени будет идти катер из В до А? Очевидно, что ре­шение этой задачи целиком зависит от нетекстовых сведений о том, что скорость плота равна скорости реки, что он может идти по реке только сверху вниз (А-В) и что катер будет идти против те­чения (ибо идет из В в А), а стало быть, скорость его будет ме­ньше на величину скорости течения реки. Все эти сведения долж­на предоставить для анализа словарная процедура слова "плот".

Ср. также: Скорость моторной лодки в озере 12 км/час. _С_ какой скоростью будет двигаться лодка от истока реки до ее ус­тья. если известно. . . Здесь надо знать, что озеро - это стоя­чая вода, где скорость движения равна собственной скорости лод­ки; при движении по реке надо учитывать скорость течения, а от истока до устья означает "по течению".

Н ) Информация о способности лексем диктовать о п е р а ­ц и и п о п р е о б р а з о в а н и ю оперативной сети данных (в основном речь идет о терминалах сети).

Непример, в результате анализа слов "больше на", "увели­чить на" необходимо над одним из терминалов оперативной сети совершить следующую операцию: к значению некоторого параметра прибавить определенную в тексте величину. Анализ слов "больше в", "увеличить в" дактует операцию умножения на заданную вели­чину. Слово "обратный" при полном обратном движении требует удвоения числовой величины параметра расстояния и перемены ме-

стами начального и конечного пункта движения. Учет такого пре­образовательного свойства очень важен в случаях типа: Туристшел Зкм в г о р у и 6 км п о д г о р у . Сколько вре­мени уйдет у него на обратный путь, если скорость н а п о ­д ъ е м е составляет 3 км/час, а н а с п у с к е - 6 км/час, когда на обратном пути с переменой начального пункта на конечный и, наоборот, меняется характер движения, существен­но влияющий на изменение параметров движения (схема I ) .

в вору под гору

к • Вначало лонги

путь т уда

под гору в вору

А Вло нги начало

пут ь обратно

Здесь картина осложняется необходимостью установления конвер- оивно-оинонимичных отношений "под гору" - "на подъеме", "в го­ру" - "на спуске".

Слова "остальной, оставшийся" (определения к словам с се­мантическим классом "расстояние", "времяи) диктуют, также опре­деленные операции.

Слово "через" ("через 3 часа"), как правило, обозначает уменьшение времени прохождения первого движущегося тела на ука­занную числовую величину. *

Квантор "весь" (например "все время") диктует операцию суммирования соответствующих параметров, Мотоциклист ехал 3 ч со скоростью 60 км/час и 2 ч со скоростью 70 км/час. Какое расстояние проехал он за все это время? (схема 2).

6, Естественно, что очень немного лексем в своей словар­ной процедуре будет иметь перечисленные выше признаки. Обяза­тельны лишь признаки семантического класса и грамматические (мы не включаем сюда те, которые нужны для формализма и о которых мы здесь че говорили), Остальные признаки помещаются в словар­ную процедуру и используются лишь по мере необходимости в слу­чае, если они характеризуют лекоему и если они релевантны для

мотоциклист .

х (расстояние) х(расстояние)

(скорость) (время) (скорость) (время)

Расстояние» х+х...

Таким образом, выделенная система признаков имеет нежест­кий характер в двух смыслах - исследовательском, так как общий список признаков открыт и по мере исследования может дополнять­ся, и системном - в аспекте обязательности для каждой конкрет­ной лексемы: в словарной процедуре представлены лишь те из ха­рактеризующих лексему признаков, которые релевантны для анали­за.

Различные типы информации взаимосвязаны друг о другом. Так, грамматическая процедура транспозиции форм глагола (обработка деепричастия) связана с "утерей" предсказываемых актантов, т .е . с процедурой семантического предсказания; указание на синонимы делает возможным анализировать замещение определенного типа. Пассивное синтаксическое предсказание вызывает процедуру обра­ботки эллипсиса и т .п .

Несмотря на простоту, единообразие и узость предметной об­ласти, составление лингвистической части словарных процедур требует разработанности лингвистической теории синтаксиса, се­мантики и синтаксиса текста, ориентированной на конкретную ки­бернетическую задачу.

Результаты разработки типов словарной информации на осно­ве исследования целых текстов, каковыми являются тексты арифме­тических задач, приводят, во-первых, к выводу о важности учета текстовых связей для правильного анализа - заполнения оператив­ной сети данных, а во-вторых, дают возможность исследовать ме­ханизм действия этих текстовых связей.

196

О Г Л А В Л Е Н И Е

М а т е м а т и ч е с к а я и прикладная лингвистикав С.-Петербургском университете ................................. ^

Б о г д а н о в В.В. Деятельность в вербальном общении(С.Петербургский у н -т ) ..................................................... 14

Т е л е г и н а Г .В . Семантика и прагматика модусныхпредикатов: мнения и проблемы (Тюменский у н -т) . . . 22

Д и к а р е в а С.С. Инициатива в диалоге (Симферополь­ский у н -т ) .............................................. 30

З у б к о в а Т.И. О роли предлогов 6 предложении (На материале исследований детской речи и нарушений ре­чи при афазии ) (С.-Петербургский у н -т ) ................... 39

Т а б а н а к о в а В.Д. Прагматический аспект логиче­ского анализа текста словарного определения (Тюмен­ский у н -т) . . . . .......... ......................................................... 45

Л у б и н и н а Т.А. Семантическая структура предложе­ний с инфинитивом в функции подлежащего (на' мате­риале английского языка) (С.-Петербургский у н - т ) . . 50

К л и м о н о в В.Л. О ноизоморфизме маркированности всклонении русских существительных (АН Германии)... 59

А л е к с е е в П.М. О некоторых квантитативно-лингви­стических оппозициях (Рос. пед, у н -т) ....................... 66

Г е р д А,С. К вопросу о роли низкочастотных фактов влингвистическом исследовании (С.-Петербургский ун-т) 75

М а н а с я н Н.С. О двух статистических способах раз­личения типов текста (Ереванский политех.. ин-т) . . 98

Б у т о р о в В.Л. , Ш е р е м е т ь е в а С.О. Ча­стотные характеристики семантико-синтаксических признаков предикатной лексики в текстах формулы изобрете пя (С.-Петербургский у н -т )................................ ЮЗ

Р у с к о а а М.П. Статистические параметры имен суще­ствительных мужского рода множественного числа в болгарском языке ХУШ в. (С.-Петербургский у н -т) . . 134

22А

м а р у с е н к о М.А. Алгоритмизация проверки литера­турно-критической атрибуционной гипотезы (С.-Петер­бургский ун-т) .................................. . . .................................... 1*5

Г а й ш т у т К.М. Особенности номинаций и семантичес­кого развития в терминосистеме наименований видов деловых текстов (Тверской ун-т) ....................................... 160

Г р и н б а у м О.Н., М а р т , ы н е н к о Г.Я. Струк­туризация текста в компьютерной системе "ЛИНДА" (С.- Петербургский у н - т ) ......... . ..................................................... 171

О т к у п щ и к о в а М.И., К р е м н е в а Н.Д.,К и р и ч е н к о Н.Л., З а м б р ж и ц к и й В Х Функционально-семантическая информация в словарных процедурах для анализа текстов узкой предметной об­ласти (С.-Петербургский ун-т) ............................................ 181

В о I с к у н с к и й В. Г ., З а х а р о в В.П. Диало­говый отладочный комплекс (С.-Петербургский центр научно-техн. информации) ......................... 197

П а р т ы к о З.В. Комбинаторный метод автоматизациипроцессов корректуры (Львовский полиграф, ин-т) . . . 211

C O N T E N T

M a t h e m a t l c a l linguistics at S.-PetersburgUniversity.... ............................. 3

B o g d a n o v V.V. Activities in verbal communicati­on (S.-Petersburg Univ.) ................ ........ 14

T e l e g i n a G.V. Semantics and pragmatics of moduspredicates 1 opinions and problems (Tyumen Univ.) 22

D i k a r e v a S.S. Initiative in dialogue (Simfero­pol Univ.) ........................... ........... 30

Z u b k o v a T.I. On the role of prepositions in asentence (S.-Petersburg Univ.) ................. 39

T a b a n a k o v a V.D. A pragmatic aspect of the lo­gical analysis of a dictionary definition (Tyumen Univ.) ........................................ 43

D u b i n i n s T.A. The semantic structure of senten­ces containing an infinitive subject (in English sentences) (S.-Petersburg Univ.) ................. 50

K l i m o n o v V.D. On non-isomorphism of markednessin Russian noun declension (Academy of science. Germany) ............ •.......................... 51,

A l e k s e y e v P.M. On some quantitative linguisticoppositions (Ped. Univ.) ......................... 66

H e a r d A.S. On the problem of the role of low frequen­cy facts in linguistic investigations (S.-Peters­burg Univ.) ................................ 75

M a n a s y a n N.S. On two statistic ways of text typedifferentiation (Yerevan Polytechnical Institute) 98

B u t 0 r o v V.D., S h e r e m e t e v a S.O. Fre­quency characteristics of semantico-syntactic fea­tures of predicate words in invention formula texts (S.-Petersburg Univ.) .......... ................. 103

K u s k o v a M.P. Statistic parameters of masculinenouns in the plural in the Bulgarian language of the XVIII century (S.-Petersburg Univ.) ......... 134

226

M a r u s e n k o M.A. Compiling algorithms for check- . ing literary c r itic attribution hypothesis (S.-Pe­ters burg Univ.) ............ .................................... 145

G a i s h t u t K.M. Some characteristic features of nomination and semantic development in the term system of business text names (Tver. Univ.) . . . . . . 160

G r i n b a u m O.N., M a r t y n e n k o G.Ya. Struc- turalysation of text in a computer system "LINDA”(S. -Peters burg Univ.) ............ ................................ 171

O t k u p s h c h i k o v a M.I., K r e m n e v a N.D.K i r i c h e n k o N.L., Z a m b r z h i t s - k y V.L. Functional semantic information in dic­tionary procedures for narrow subject fie ld text analysis (S.-Petersburg Univ.) ................. ............ 181

V o y s k u n s k i V.G.; Z a k h a r o v V.P. Inter­active debugging complex (S.-Petersburg Centre of Sci.-Tech. In f.) .......... . 197

P a r t y k o Z.V. Combinatorial method of proof-read­ing automation (Lvov Bolygr. Inst.) ...................... 211