Тарасов А.Ю., Зобков М.Б. Методика потокового анализа продуктов расщепления камня с использованием
ФУНКЦИОНАЛЬНО-СЕМАНТИЧЕСКАЯ ИНФОРМАЦИЯ В СЛОВАРНЫХ...
Transcript of ФУНКЦИОНАЛЬНО-СЕМАНТИЧЕСКАЯ ИНФОРМАЦИЯ В СЛОВАРНЫХ...
С.ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Издается с 1987 г.
СТРУКТУРНАЯИ ПРИКЛАДНАЯ ЛИНГВИСТИКА
Межвузовский сборник
В ы п у с к 4
Под редакцией А. С. Герда
САНКТ-ПЕТЕРБУРГИЗДАТЕЛЬСТВО С.-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
1993
ББК 81Д С87
Сборник (адп.З вышел в 1987 г . ) содержит статьи, охватывающие широкий круг проблем современной теоретической и прикладной лингвистики. Рассматриваются актуальные вопросы семантики и синтаксиса, применения математических методов в языкознании, разработки лингвистических основ автоматической обработки текстов.
Для специалистов по прикладной и Математической лингвистике .
Р е д а к ц и о н н а я к о л л е г и я : д-р филол.наук В.В.Богданов, д-р филол. наук Л.З.Бондарко, д-р филол. наук А.С.Герд (отв. редактор), д-р филол. наук Б.Ю.Городецкий.
Р е ц е н з е н т : д-р филол. наук Л.Н.Беляева (Рос.гос. пед. ун-т)
Печатается по постановлению Редакционно-издательского совета
С.-Петербургского университета
п 1403000000 - 088 лт а? 076(02) - 93
(р) Издательство ^ С.-Петербургского
университета, I 993
М.И.О I к у I щ и к о в а, Н.Д.К р е м н е в а,Н.Л.К и р и ч е н к о, В.Л.З а м б р ж и ц к и й
ФУНКЦИОНАЛЬНО-СЕМАНТИЧЕСКАЯ ИНФОРМАЦИЯ В СЛОВАРНЫХ ПРОЦЕДУРАХ
ДЛЯ АНАЛИЗА ТЕКСТОВ УЗКОЙ ПРЕДМЕТНОЙ ОБЛАСТИ* *
В статье рассматривается проблема организации и представления лингвистических баз данных, необходимых и достаточных для автоматизированного анализа текстов узкой предметной области "Арифметические задачи на равномерное движение".*
М. И. Откупщиков а. Н.Д.Кремнева, Н. Л.Кириченко, В.Л.Замбр- жицкий, Т993
* В статье излагаются результаты работы участников семинара: М.И.Откупщиковой Н.Д.Кремневой, НЛ.Кириченко, Г.М.Смирновой, Б.Ю.Моревой, В.Л.Замбржицкого, проводимого под -руководством М.И.Откупщиковой в 1987 г . в лаборатории математической лингвистики НИИММ ЛГУ.
* Такай предметная область была принята для разработки лабораторией математической лингвистики в 1985 г.
т
К выбору узкой предметной области привел практический опыт создания больших и малых систем анализа.2
Лингвистическое теоретическое обоснование эта идея полу- ччила позднее. В основном оно сводится к следующим аргументам.
I ) Естественные тексты моделируют миры действительности как реальные, так и нереальные, возможные. Эти миры практически бесконечны. 2) Система, моделирующая п о н и м а н и е текста человеком, не может ограничиться грамматическими уровнями анализа - в ней должна учитываться с е м а н т и к а в широком смысле этого слова ( т .е . знания о мире, сведения о соотнесении единиц текста с объектами описызаемого текстом мира, прагматика и т . д . ). Коль скоро миров действительности бесюнечно много,' то становится невозможным (необъятным практически), по крайней мере в настоящее время, создание глобальной кибернетической системы, моделирующей понимание любых текстов любых предметных областей.
Тексты арифметических задач на равномерное движение, хотя и оформлены по законам русской морфологии, оинтакоиоа и оин-таксиса текста, весьма специфичны, и эта специфика требует особого лингвистического аппарата описания, далеко не всегда применимого к другим предметным областям.
Прежде всего в этом плане отметим два общих момента.I . Для каждого текста задач характерно единообразие ком
муникативной функции побуждения, которая может быть описана языковой "формулой": я (автор текста задачи) хочу, чтобы адресат (читатель, ученик и т . п . ) решил эту задачу ( т .е . на основе зэданных параметров вычислил неизвестные). Специфика здесь не только в единообразии, но и в том, что коммуникативную функцию побуждения выполняет целый законченный текст, состоящий из нескольких предложений, что в обычной ситуации коммуникации, если не считать текстов инструкций, встречается довольно редко.
2 Ц е К т и н Г.С. О соотношении естественного языка и формальной модели / / Общение с ЭВМ на естественном языке. Вопросы кибернетики. М., 1982. Вып.80. С .2 0 -й .
О #
О т к у п щ и к о в а М.И. Синтаксис сводного тексте (структурная лингвистическая модель: Авторвф. дао. . . . докт. фи~ лол. наук. I . , 1987.182
2 . В т о р о й м о м е н т с в я з а н с п р о б л е м о й р е ф е р е н ц и и . О ч е в и д н о , ч т о в д а н н о м с л у ч а е н и к а к о г о п р я м о г о с о о т н е с е н и я с р е а л ь н о й д е й с т в и т е л ь н о с т ь ю в т е к с т а х з а д а ч н е м о ж е т б ы т ь в о т л и ч и е о т т а к и х , н а п р и м е р , в ы с к а з ы в а н и й , к а к Н а ш а м а м а у е х а л а о т д ы х а т ь в Я л т у , г д е р е ч ь и д е т о р е а л ь н ы х о б ъ е к т а х , д е й с т в и и и е г о о б с т о я т е л ь с т в а х .
Т е к с т ы з а д а ч о т р а ж а ю т с и т у а ц и и п р и д у м а н н ы е , х о т я и п о д о б н ы е р е а л ь н ы м . В н и х п р е д с т а в л е н с п е ц и ф и ч н ы й п о д в и д н е р е а л ь н о г о м и р а ( с р . м и р с к а з к и , л е г е н д ы , х у д о ж е с т в е н н о г о п р о и з в е д е н и я и т . п . ) , о д н а к о о т л и ч а ю щ и й с я о т п о с л е д н и х с в о е й г л о б а л ь н о й д о п у с т и м о с т ь ю , п р е д п о л о к и м о с т ь ю , п о т е н ц и а л ь н о с т ь ю : З а с к о л ь к о в р е м е н и п е ш е х о д п р о ш е л ( б ы ) п у т ь е с л и б ы ш е л с о с к о р о с т ь ю Л ?
В ы с к а з ы в а н и я т а к о г о т и п а с ф о р м о й и р р е а л ь н о г о с о с л а г а т е л ь н о г о н а к л о н е н и я о б р а з у ю т о д и н и з с п о с о б о в в ы р а ж е н и я к а т е г о р и и п о т е н ц и а л ь н о с т и . ^ С р . о б щ е я з ы к о в о е : Я м о г б ы п р о й т и э т о р а с с т о я н и е з а 5 ч а с о в - д е й с т в и е н е с о в е р ш а е т с я , н о м о ж е т б ы т ь с о в е р ш е н о . ® '
О д н а к о в д а н н о м в ы с к а з ы в а н и и н е р е ф е р е н т н о , н е р е а л ь н о т о л ь к о д е й с т в и е , а в т е к с т а х з а д а ч н е р е ф е р е н т н ы в с е о б ъ е к т ы и д е й с т в и я , о н и к в а з и р е ф е р е н т н ы . Р е ф е р е н т н а я с п е ц и ф и к а т е к с т о в з а д а ч о б л е г ч а е т п р о б л е м у р е ш е н и я р е ф е р е н ц и и . Т а к к а к в с е т е к с т ы к в а з и р е ф е р е н т н ы , т о н е н у ж н о д и ф ф е р е н ц и р о в а т ь р е ф е р е н т н ы е и н е р е ф е р е н т н ы е в ы с к а з ы в а н и я ( п о с л е д н и е в Д р у г и х п р е д м е т н ы х о б л а с т я х - э т о у с л о в н ы е , п о т е н ц и а л ь н ы е к о н с т р у к ц и и и т . п . ) .
В примере Пройдя путь А В , турист рассчитал, что он м о г б ы п р и й т и в В н а Т ч раньше, если б ы п р о х о д и л в час на 0 , 8 к м больше, и н а полтора часа позже. если б ы п р о х о д и л в час на 0 .8 км меньше. Ччем в действительности. Найдите расстояние АВ выделенные конструкции обозначают,
^ З н а ч е н и е п о т е н ц и а л ь н о с т и к а р д и н а л ь н о о т л и ч а е т с я о т з н а ч е н и я н е р е а л ь н о г о у с л о в и я , к а к в п р и м е р е : Е с л и бы я ю г прийти к 7 ч а с а м , т о м ы у с п е л и б ы н а 8 - ч а с о в о й с е а н с - н о я н е м о г . . . и п о э т о м у мы н е у с п е л и . . . Т а к а я т р а н с ф о р м а ц и я н е в о з - м о ж н а в с л у ч а е п о т е н ц и а л ь н о г о з н а ч е н и я .
® С м . : Э с л о н П . А . М о д а л ь н о е з н а ч е н и е возможноет и / н е - в о э м о к н о с т и в р у с с к о м я з ы к е ( т и п о л о г и я и с р е д с т в а выражения;: А в т о р е ф . к а н д . д и с . . . . , к а н д . Ф и л о л . н а у к . Л . , 1 9 8 7 .
183
что турист не совершал таких действий, однако мы знаем, что он не совершил в действительности и первого действия. Весь текст квазиреферентен, и мы извлекаем из него нужные сведения о параметрах движения, как будто бы он весь референтен.
2. Каждая задача представляет собой условие, которое должно быть выполнено, чтобы имело, место следствие: нахождение неизвестных величин, т .е . решение задачи.
В кибернетической системе, имитирующей мыслительную деятельность человека, решающего задачу, в результате автоматического анализа текста должна быть вызвана программа, которая на основе известных параметров осуществит необходимое вычисление. Это - суперцель анализа текста арифметических задач. Непосредственной же, ближайшей целью такого анализа является п о с т р о е н и е о п е р а т и в н о й с е т и д а н н ы х - конкретного фрейма задачи, которая содержала бы необходимые и достаточные сведения для вычисления неизвестных величин, п о с л е д у ю щ е е с р а в н е н и е этой сети с типовыми сетями данных (моделями движения), и/или в ы з о в т и п о в о й с е т и д а н н ы х и п р а в и л ь н о е е е з а п о л - н.е н и е для последующего решения.
Вот это соотнесение данных текста с типовой моделью посредством конкретной оперативной сети данных и можно интерпретировать, как осуществление квазиреференции.
3. Типовые модели движения - необходимая часть п о с т о я н н о й базы лингвистических данных системы.
Моделей равномерного движения - ограниченное количество. Приведем наиболее характерные для текстов задач.^
а) Модель простого движения. Это основная конструкция, ядро:.: которой является предикат движения, связывающий три основа х параметра: "расстояние", "время", "скорость” .
Остальные модели обозначают составные движения разных типов.
б) Модель обратного движения в двух его разновидностях:
ж»
Предлагаемая система моделей равномерного движения (термин Г.С.Цейтина) представляет собой модификацию и дополнение (как в аспекте структуры моделей, так и в аспекте их классификации) предложенных Г.В.Цайтиным в октябре $986 г . на научном семинаре лаборатории математической лингвистики двух моделей Движения: простого и составного.
полном (от А до В и от В до А) и частичном (от А до В и от В до какого-то .пункта на линии В-А)- Постоянным свойством полного обратного движения является удвоение числового значения параметра "расстояние".
в) Модель встречного, движения в двух разновидностях: каноническое встречное (когда объекты встречаются на линии А-В) и частное встречное, когда они сближаются на линии А-В, не встречаясь.
г ) Модель движения вслед. Ее разновидности определяются сочетанием следующих парных признаков; доотиженш^недостикения конечного пункта движения одним или более объектом,наличия/от- оутствия ситуации, когда один объект догоняет другого.
д) Модель взаимного удаления объектов (в противоположном направлении из одного или разных пунктов на линии движения).
е) Модель пересекающегося движения в двух вариантах (движение из точки пересечения или в точку пересечения).
ж) Модель со сложной скоростью, сложность которой зависит от дополнительных условий прохождения пути в воздушной или водной среде. Вариативность определяется наличием благоприятству- ющих/неблагоприятствующих условий.
А. Обеспечение указанной выше непосредственной задачи анализа текста - формирования оперативной сети данных осуществляется при помощи словарной информации единиц словаря, входами которых служат лексемы. Этот словарь - основной компонент постоянной лингвистической' базы „данных.
Отличие предлагаемого подхода к описанию словарной информации от предыдущих заключается: 1) в объединении лексической, семантической, грамматической и другой информации в одной словарной процедуре, что создает возможность равноправного и одновременного ее использования при анализе,' и 2) в возможности указания в словарной статье на необходимость выполнения стандартных и индивидуальных процедур, характеризующих "поведение" слова в предложении и тексте.. На этом основании словарная статья называется словарной процедурой, а представление словарной информации в словаре - процедурным представлением.®
7' В этом случае моделируется представление о естественном,
"человеческом", процессе понимания текста.® Ц е й т и н Г. С ., О т к у п щ и к о в а М . И . , Л е й -
185
5. Ниже речь пойдет о лингвистических признаках, релевантных для выполнения указанной выше задачи.
I ) С е м а н т и к а. Этот признак определяет семантический класс лексемы и его подклассы. Для данной предметной об-оласти глубина иерархии этих признаков не превышает двух.
Семантический класс глаголов: "двигаться, идти, ехать, плыть" - "предикат движения", и только у глагола "плыть" существен учет подкласса "водное", потому что при движении по реке скорость движения зависит от течения реки.
Интересно отметить, что специфика предметной области и ее "узость" показывают нерелевантность использования компонентного семантического анализа в полном виде. К примеру, разницу между лексемами "женщина" (сема "взрослость") и "девочка" ( - ^ к о торую столь важно, к примеру, учитывать в медицине и психологии, для денной задачи несущественна.
Семантический класс слова "другой" - "идентификатор",имеющий значение "д ва". На основании этого признака вызывается стандартная процедура вычисления идентификации, необходимая потому, что при всех идентификаторах в данной предметной области со значением "два" и больше существительное может элидировать- ся, и необходимо во всех случаях обращаться в предтекст, чтобы
к и н а Б.М ., Н е в л е в а Т.Н. Система анализа текста с процедурным представлением словарной информации / / Актуальные вопросы практической реализации систем автоматичестого перевода. 4 .1 . М., 1982. С .20 5-231; Р а з р а б о т к а и экспериментальное исследование комплексной модели естественного языка с алгоритмическим представлением словарной информации (заключительный отчет) У1ГК - 519:766. № Госрегистрации: 81030328. Л.,1985: Ц е й т и н Г.С. Программирование на ассоциативных сетях 7 / ЭВМ в проектировании и производстве. Л ., 1985. С .И 6 - 148; К и р и ч е н к о Н.Л. Исследование возможности стяжения сочетаний слов, обозначающих одно понятие, для задачи автоматического анализа предложения / / Проблемы обработки информации. Л ., 1985. Выл.22. С.100-106.
Е проектируемой системе все лингвистические сведения о лексеме организованы в виде особого формализма - словарной гипотезы, которая представляет собой существенную часть математического обеспечения системы, но которая в данной статье не рассматривается (см. ' . Р а з р а б о т к а ' и экспериментальное исследование комплексной модели я зы к а ... ; Ц е й т и н Г.С. Программирование на ассоциативных сетях).
® Вообще глубина иерархии открыта. С р .: Ц е й т и н Г .С ., О т к у п щ и к о в а М.И., Л е й к и н а Б .К .,, Н е в л е- в а Т.Н. Система анализа текста с процедурным представлением словарной информации.186
произвести процедуру его смыслового восстановления: Один пешеход шел со скоростью... другой - со скоростью ,..; Легковой автомобиль... Iрузовой - Первый п о езд ... второй - . . . и т.п.
Словарные процедуры лексем, которые по своему семантическому классу относятся к базовой семантике,®1 включают в себя процедуру, работающую с соотношением семантической структуры этих лексем** и поверхностной синтаксической структуры.
Например, каждый параметр движения определяется единицей измерения и числовым значением. Кроме того, он имеет свое имя.В тексте, эта семантическая сеть (структура) реализуется в разных ипостасях: с именем параметра, без имени, о особого рода редупликацией имени параметра:
Расстояние 25 км-----1------------I---
имя параметра числовое единица значение измерения
Он прошел 25 км - нет имени параметра Длина пути - 25 кмРасстояние длиной 25 км Г Редупликация имени параметра
Интересным случаем семантической информации, постоянной относительно описываемого мира, является семантика прилагательных "скорый, пассажирский, легковой, почтовый, г а зо в о й ) и т.п., которые, подобно словам "первый, второй", выполняют в этом случае функцию идентификатора при пассивно предсказанном ими объекте, но имеют при этом неопределенное числовое значение. Определение числового значения у этих слов происходит в процесое анализа: первая встречаемость в анализируемом тексте слова с неопределенным идентификатором диктует приписывание ему числового значения "единица", вторая - "д ва". " Л е г к о в а я машина (машина^) вышла и ̂ А .. . Навстречу ей шла г р у з о в а я мамина,. . (м а ш ю ^ ) .. . Процедура вычисления числового значения идентификатора вызывается словарными статьями этих лексем.
Л е й к и н а Б.М., Н и к и т и н а Т.Н., О т к у п - щ и к о э а М.И. Элементы базового представления внутренней структуры (коннекторы) П Лингвистические проблемы функционального моделирования речевой деятельности. Л ., 1976. вып.з. о .в -
См.-: Ц е й т и н Г.С. О соотношении ка и формальной модели; О т к у п щ и к о в связного текста. Л ., 1982.
естественного язы- М.И. Синтаксис
187
2 ) Г р а м м а т и ч е с к и е п р и з н а к и определяют часть речи, номер парадигмы для изменяемых слов, а также процедуры, определяющие грамматическое поведение слов. Например, транспонированные формы глагола: деепричастие и причастие теряют часть своих синтаксических валентностей.
Интересно отметить, что в текстах задач деепричастия часто дублируют семантику основного сказуемого, выполняя формальную функцию уменьшения величины куста слов, зависимых от основного предиката: Д в и г а я с ь по течению, пароход идет со скоростью. . . : Турист взбирался на гору, идя со скоростью Знм/ч.. Поезд, следуя из одного города в другой, прошел.. .
Очевидно, что для Задачи анализа можно счесть деепричастия избыточными - их можно элиминировать (кстати, в естественной коммуникации эти выражения легко трансформируются в одноглагольные, с р .: Турист взбирался в гору со скоростью... ) . Однако такая трансформация не всегда возможна или удобна;, Довершая двухдневный поход, пионеры были в пути всего 9 ч . .№
8 ) С е м а н т и к о - с и н т а к с и ч е с к~и е пр е“д- с к а з а н и я . Важнейшими сведениями, обеспечивающими установление связей между словами и предложениями текста, а также восполнение смысла элидированных элементов текста, являются сведения о способности лексемы предсказывать наличие в тексте других лексем, связанных с ними семантически и/или синтаксически.
Семантические предсказания определяют сочетаемостные свойства данной лексемы в терминах предикатно-актантной структуры.
• Например, предикат движения семантически предсказывает четыре актанта: движущийся объект, расстояние, скорость и время. Необходимость установления таких семантических предсказаний определяется спецификой данной предметной области, которая требует экспликации всех физических параметров равномерного движения. Ср. общеязыковые высказывания типа Как быстро идет машина; По реке плывет баржа, а на ней жгут костер и т .п . . для. которых установление обязательности четырехактантной структуры
^ 0 случаях свертки именных групп см.: К и р и ч е н к о Н.Л. Исследование возможности стяжения сочетаний слов . . .
*88
явно избыточно и, кроме того, может дать неправильный сигнал об анте- или постцедентном эллипсисе, которого в действительности нет. Отсутствие части актантов в последних примерах свидетельствует о запланированной автором неопределенности некоторых параметров движения, в то время как в нашем случае отсутствие актантов обозначает или эллипсис, 'восполнение которого необходимо совершить на основании сведений из пред- или посттекста, или то самое неизвестное, вычисление которого является су- перцелью анализа. Пример: Автомобиль движется со скоростью 40 км/час. Какое расстояние он пройдет за 5 часов?
Все параметры глагола "движется" (и его заместителя - синонима "пройдет"): движущийся объект, скорость, время и расстояние, неизвестность которого определяется вопросительным словом "какой?" - распределены в тексте из двух предложений.
Пример определения параметров в предтексте: Спортсмен тратит 10 минут, проходя половину своего маршрута на лодке, и вдвое дольше добирается до финиша вплавь. Сколько времени ему понадобится. если он с самого начала будет передвигаться только вплавь?
Параметр "скорость" ("вдвое дольше") для предиката "передвигаться вплавь" мы можем определить, лишь анализируя предтекст при помощи процедуры замещения. Неопределенность параметра "расстояние" должна быть элиминирована при помощи операций с другими параметрами и оперативной сетью данных.
Признаки семантического класса и семантического предсказания лежат в основе определения омонимии, синонимии и лексикосинтаксической вариативности.
Приведем пример. Каждый "поверхностный" вариант выражения элементов, предсказываемых лексемой "расстояние", представляет собой лексико-синтаксическое предсказание, при этом для массива задач имеющее равновероятное с соперничающими вариантами появление. В таких случаях набор вариантов удобно задавать таблицей, указание на работу с которой дается .также из словарной процедуры лексем с семантическим классом "расстояние" (см.табл.X
Теоретической базой аппарата семантических предсказаний является грамматика предсказаний,^ в основе построения кото-
13 Ц е й т и н Г.С. О соотношении естественного языка и формальной модели... С. 45; О т к у п щ и к о в а М.И. Синтаксис связного текста. С .88, 89. ,пд
рой лежит представление о способности любой языковой единицы в связном речевом произведении или его части поставлять реципиенту набор предсказаний о других языковых единицах, связанных синтаксической связью. Это представление о роли предсказаний в процессе понимания легко апплицируется к словарю.
Функционально-семантическая основа предсказаний связана с морфолого-синтаксическими факторами, которые иногда являются определяющими.
Как вкратце показано выше, набор предсказаний словарной единицы существенно зависит от предметной области и задачи анализов.
Синтаксический статус имеет дифференциация а к т и в н о го и п а с с и в н о г о предсказания. Активное обозначает предсказание управляющего слова на синтаксически управляемое им, а пассивное - управляемого на управляющее. Например, любая согласованная форма (адъективы) предсказывает своего хозяина - существительное, которое она "определяет" и с которым согласуется по правилам руоского согласования. (Для установления связи с существительным словарная процедура каждой адъективной лексемы вызывает стандартную процедуру согласования.) Установление пассивного предсказания весьма существенно при обработке эллиптичных конструкций.
В случае неуспеха вызванной процедуры согласования ока вызывает процедуру "Эллипсис".̂ Учет пассивного предсказания лежит в основе обработки однородных конструкций, эллипсиса предиката и т.п.
4) Признак способности языкового выражения быть марк е р о м (сигналом) в ы з о в а определенной модели движения.
Тексты задач содержат много таких сигналов: например,сло- ва другой, второй свидетельствуют о необходимости вызова модели составного движения с двумя движущимися телами; встреча.навстречу. встречаются, встречный - составного встречного; обрат-
^ Случаи субстантивирования причастий в текстах задач редки, поэтому конкурирующая гипотеза об эллипсису должна иметь большое предпочтение. Редкий пример субстантивации: Насколько идущий по включенному эскалатору опередит того, кто будет ехать по нему,..191
иый, обратно, назад, возвращаться - составного обратного; в одном и том же направлении, туда ие. вслед за. следом за. вдогон- ку, друг за другом, передний. .. задний... проследовать, догонять, нагонять, перегонять, гнаться - составного движения двух объектов в одном направлении; в противоположные стороны, в противоположном направлении, на север. .. на ю г... - составного движения в противоположных направлениях; пересекающийся под прямым углом, по сторонам. . . треугольника, на север.. . , на восток.. . . по горизонтали. . . . по вертикали... - составного движения с пересекающимися трассами и т.д.
5) Признак наличия о м о н и м а . Следует отметить, что омонимия не характерна для лексики данной предметной области, хотя отдельные случаи ее все же имеются. Например, слово "дру- .гой" в косвенных падежах омонимично второму компоненту взаимного местоимения "один другого" и дифференциатору "другой (пошли д р у г и м путем )„
Омоним часто различим по структуре предсказаний. Это ка
сается также функциональных омонимов. К примеру, слово "который" в качестве прилагательного пассивно предсказывает опреде-^ ляемое им существительное и имеет в этом случае значение "который по счету". В к о т о р о м ч а с у велосипедист догонит пешехода, если...
Существительное который не связано с каким-либо существительным своего предложения, а строго влево (через запятую) предсказывает существительное другого простого предложения, заместителем которого оно является: . . . п е ш е х о д , к о т о - р и й шел со скоростью б км/час.. .
6) С и н о н и м и я для интересующих нас текстов более
характерна.Часты обычные лексические синонимы: скорый - курьерский;
товарный - грузовой: автомобиль - машина; отплыть - отчалить - поплыть; отойти - выйти - отправиться.
Синонимы определяются по семантическому классу и предска
занию. Учет синонимии важен при решении проблемы гиперсгагтак-
спчески.х связей, а именно замещения. Поэтому При наличии сино-
4
нимичеокого ряда в словарных процедурах его членов должны сЗыть взаимные отсылки к этому ряду, на основании которых и должна решаться задача замещения при помощи синонима.*5
Иногда используется общеязыковой прием своеобразной метонимии: П о е з д от пункта А до пункта В шел со скоростью 40 км/час. В пункте В м а ш и н и с т увеличил скорость. .. Здесь "машинист увеличил скорость" равно по смыслу задачи "поезд увеличил скорость". Ср. также: "автобус - шофер", "самолет-пилот" Есть несколько путей решения проблемы смысловой связи между такими словами:
а) выделить понятия движущегося объекта и субъекта, однако при этом неясно, как решать в этом случае проблему замещения;
б) объявить эти слова условными синонимами и сделать вза- имоотсылки из словарных статей;
в) описать их смысловые связи при помощи лексических функций "тот, кто ведет поезд" - "машинист"- и т.п .
7) Л е к с и ч е с к и е п е р и ф р а з ы . Их учет также необходим при анализе текстовых связей: Пешеход п р о х о д и т р а с с т о я н и е между А и В за 5 ч . а в с а д н и к преодолевает его за I ч. Во сколько раз п у т е ш е - о т в и е в е р х о м быстрее п е ш е г о ? Всадниктот, кто совершает путешествие верхом, пешеход - пешее путешествие.
Без установления таких связей невозможно правильно сформировать оперативную сеть данных.
Смысловые конверсии типа "А больше В - В меньше А" можно вычислить при помощи особой процедуры вывода, вызываемой словарной статьей лексем "больше", "меньше".
8) 1 е к с 1 к о - г р а и « э т и ч е с к а я к о н в е р - с и я. Грамматическая конверсия типа "отплыть - отплытие" должна вычисляться грамматической стандартной процедурой или простым указанием на наличие такого конверсива в словарной процедуре каждого предиката. Учет ее также необходим для решения проблемы замещения. Однако часто замещение производится при по-
15 Сн.гЦ е й т и н Г.М. 0 с о о т н о ш е н и и е с т е с т в е н н о г о языка и формальной модели; О т к у п щ и к о в а М.И. С и н т а к с и ссвязного текста.
*98
мощи грамматического конверсива от другой лексической единицы, синонимичной замещаемому "отплыть - отход, отправление, выход".
Этот случай еще раз подтверждает необходимость взаимных отсылок между членами синонимического ряда в словаре.
9 ) } р а з е о л о г к я. Специфика предметной области почти исключает возможность употребления настоящих фразеологизмов - оказываются употребительными устойчивые сочетания терминологического типа: "стоячая вода, железная дорога, место назначения, • гаревая дорсжка, по течению, против течения, на подъеме, на спуске, в гору, под гору, быть в пути" и т .п ,
Й ) С в е д е н и я о р е а л ь н о м м и р е (обстоятельствах, сопровождающих движение).
П л о т движется от пункта А до пункта Н О . часов со скоростью 2 км в час. К а т е р затрачивает на этот путь 2 часа. Сколько времени будет идти катер из В до А? Очевидно, что решение этой задачи целиком зависит от нетекстовых сведений о том, что скорость плота равна скорости реки, что он может идти по реке только сверху вниз (А-В) и что катер будет идти против течения (ибо идет из В в А), а стало быть, скорость его будет меньше на величину скорости течения реки. Все эти сведения должна предоставить для анализа словарная процедура слова "плот".
Ср. также: Скорость моторной лодки в озере 12 км/час. _С_ какой скоростью будет двигаться лодка от истока реки до ее устья. если известно. . . Здесь надо знать, что озеро - это стоячая вода, где скорость движения равна собственной скорости лодки; при движении по реке надо учитывать скорость течения, а от истока до устья означает "по течению".
Н ) Информация о способности лексем диктовать о п е р а ц и и п о п р е о б р а з о в а н и ю оперативной сети данных (в основном речь идет о терминалах сети).
Непример, в результате анализа слов "больше на", "увеличить на" необходимо над одним из терминалов оперативной сети совершить следующую операцию: к значению некоторого параметра прибавить определенную в тексте величину. Анализ слов "больше в", "увеличить в" дактует операцию умножения на заданную величину. Слово "обратный" при полном обратном движении требует удвоения числовой величины параметра расстояния и перемены ме-
стами начального и конечного пункта движения. Учет такого преобразовательного свойства очень важен в случаях типа: Туристшел Зкм в г о р у и 6 км п о д г о р у . Сколько времени уйдет у него на обратный путь, если скорость н а п о д ъ е м е составляет 3 км/час, а н а с п у с к е - 6 км/час, когда на обратном пути с переменой начального пункта на конечный и, наоборот, меняется характер движения, существенно влияющий на изменение параметров движения (схема I ) .
в вору под гору
к • Вначало лонги
путь т уда
под гору в вору
А Вло нги начало
пут ь обратно
Здесь картина осложняется необходимостью установления конвер- оивно-оинонимичных отношений "под гору" - "на подъеме", "в гору" - "на спуске".
Слова "остальной, оставшийся" (определения к словам с семантическим классом "расстояние", "времяи) диктуют, также определенные операции.
Слово "через" ("через 3 часа"), как правило, обозначает уменьшение времени прохождения первого движущегося тела на указанную числовую величину. *
Квантор "весь" (например "все время") диктует операцию суммирования соответствующих параметров, Мотоциклист ехал 3 ч со скоростью 60 км/час и 2 ч со скоростью 70 км/час. Какое расстояние проехал он за все это время? (схема 2).
6, Естественно, что очень немного лексем в своей словарной процедуре будет иметь перечисленные выше признаки. Обязательны лишь признаки семантического класса и грамматические (мы не включаем сюда те, которые нужны для формализма и о которых мы здесь че говорили), Остальные признаки помещаются в словарную процедуру и используются лишь по мере необходимости в случае, если они характеризуют лекоему и если они релевантны для
мотоциклист .
х (расстояние) х(расстояние)
(скорость) (время) (скорость) (время)
Расстояние» х+х...
Таким образом, выделенная система признаков имеет нежесткий характер в двух смыслах - исследовательском, так как общий список признаков открыт и по мере исследования может дополняться, и системном - в аспекте обязательности для каждой конкретной лексемы: в словарной процедуре представлены лишь те из характеризующих лексему признаков, которые релевантны для анализа.
Различные типы информации взаимосвязаны друг о другом. Так, грамматическая процедура транспозиции форм глагола (обработка деепричастия) связана с "утерей" предсказываемых актантов, т .е . с процедурой семантического предсказания; указание на синонимы делает возможным анализировать замещение определенного типа. Пассивное синтаксическое предсказание вызывает процедуру обработки эллипсиса и т .п .
Несмотря на простоту, единообразие и узость предметной области, составление лингвистической части словарных процедур требует разработанности лингвистической теории синтаксиса, семантики и синтаксиса текста, ориентированной на конкретную кибернетическую задачу.
Результаты разработки типов словарной информации на основе исследования целых текстов, каковыми являются тексты арифметических задач, приводят, во-первых, к выводу о важности учета текстовых связей для правильного анализа - заполнения оперативной сети данных, а во-вторых, дают возможность исследовать механизм действия этих текстовых связей.
196
О Г Л А В Л Е Н И Е
М а т е м а т и ч е с к а я и прикладная лингвистикав С.-Петербургском университете ................................. ^
Б о г д а н о в В.В. Деятельность в вербальном общении(С.Петербургский у н -т ) ..................................................... 14
Т е л е г и н а Г .В . Семантика и прагматика модусныхпредикатов: мнения и проблемы (Тюменский у н -т) . . . 22
Д и к а р е в а С.С. Инициатива в диалоге (Симферопольский у н -т ) .............................................. 30
З у б к о в а Т.И. О роли предлогов 6 предложении (На материале исследований детской речи и нарушений речи при афазии ) (С.-Петербургский у н -т ) ................... 39
Т а б а н а к о в а В.Д. Прагматический аспект логического анализа текста словарного определения (Тюменский у н -т) . . . . .......... ......................................................... 45
Л у б и н и н а Т.А. Семантическая структура предложений с инфинитивом в функции подлежащего (на' материале английского языка) (С.-Петербургский у н - т ) . . 50
К л и м о н о в В.Л. О ноизоморфизме маркированности всклонении русских существительных (АН Германии)... 59
А л е к с е е в П.М. О некоторых квантитативно-лингвистических оппозициях (Рос. пед, у н -т) ....................... 66
Г е р д А,С. К вопросу о роли низкочастотных фактов влингвистическом исследовании (С.-Петербургский ун-т) 75
М а н а с я н Н.С. О двух статистических способах различения типов текста (Ереванский политех.. ин-т) . . 98
Б у т о р о в В.Л. , Ш е р е м е т ь е в а С.О. Частотные характеристики семантико-синтаксических признаков предикатной лексики в текстах формулы изобрете пя (С.-Петербургский у н -т )................................ ЮЗ
Р у с к о а а М.П. Статистические параметры имен существительных мужского рода множественного числа в болгарском языке ХУШ в. (С.-Петербургский у н -т) . . 134
22А
м а р у с е н к о М.А. Алгоритмизация проверки литературно-критической атрибуционной гипотезы (С.-Петербургский ун-т) .................................. . . .................................... 1*5
Г а й ш т у т К.М. Особенности номинаций и семантического развития в терминосистеме наименований видов деловых текстов (Тверской ун-т) ....................................... 160
Г р и н б а у м О.Н., М а р т , ы н е н к о Г.Я. Структуризация текста в компьютерной системе "ЛИНДА" (С.- Петербургский у н - т ) ......... . ..................................................... 171
О т к у п щ и к о в а М.И., К р е м н е в а Н.Д.,К и р и ч е н к о Н.Л., З а м б р ж и ц к и й В Х Функционально-семантическая информация в словарных процедурах для анализа текстов узкой предметной области (С.-Петербургский ун-т) ............................................ 181
В о I с к у н с к и й В. Г ., З а х а р о в В.П. Диалоговый отладочный комплекс (С.-Петербургский центр научно-техн. информации) ......................... 197
П а р т ы к о З.В. Комбинаторный метод автоматизациипроцессов корректуры (Львовский полиграф, ин-т) . . . 211
C O N T E N T
M a t h e m a t l c a l linguistics at S.-PetersburgUniversity.... ............................. 3
B o g d a n o v V.V. Activities in verbal communication (S.-Petersburg Univ.) ................ ........ 14
T e l e g i n a G.V. Semantics and pragmatics of moduspredicates 1 opinions and problems (Tyumen Univ.) 22
D i k a r e v a S.S. Initiative in dialogue (Simferopol Univ.) ........................... ........... 30
Z u b k o v a T.I. On the role of prepositions in asentence (S.-Petersburg Univ.) ................. 39
T a b a n a k o v a V.D. A pragmatic aspect of the logical analysis of a dictionary definition (Tyumen Univ.) ........................................ 43
D u b i n i n s T.A. The semantic structure of sentences containing an infinitive subject (in English sentences) (S.-Petersburg Univ.) ................. 50
K l i m o n o v V.D. On non-isomorphism of markednessin Russian noun declension (Academy of science. Germany) ............ •.......................... 51,
A l e k s e y e v P.M. On some quantitative linguisticoppositions (Ped. Univ.) ......................... 66
H e a r d A.S. On the problem of the role of low frequency facts in linguistic investigations (S.-Petersburg Univ.) ................................ 75
M a n a s y a n N.S. On two statistic ways of text typedifferentiation (Yerevan Polytechnical Institute) 98
B u t 0 r o v V.D., S h e r e m e t e v a S.O. Frequency characteristics of semantico-syntactic features of predicate words in invention formula texts (S.-Petersburg Univ.) .......... ................. 103
K u s k o v a M.P. Statistic parameters of masculinenouns in the plural in the Bulgarian language of the XVIII century (S.-Petersburg Univ.) ......... 134
226
M a r u s e n k o M.A. Compiling algorithms for check- . ing literary c r itic attribution hypothesis (S.-Peters burg Univ.) ............ .................................... 145
G a i s h t u t K.M. Some characteristic features of nomination and semantic development in the term system of business text names (Tver. Univ.) . . . . . . 160
G r i n b a u m O.N., M a r t y n e n k o G.Ya. Struc- turalysation of text in a computer system "LINDA”(S. -Peters burg Univ.) ............ ................................ 171
O t k u p s h c h i k o v a M.I., K r e m n e v a N.D.K i r i c h e n k o N.L., Z a m b r z h i t s - k y V.L. Functional semantic information in dictionary procedures for narrow subject fie ld text analysis (S.-Petersburg Univ.) ................. ............ 181
V o y s k u n s k i V.G.; Z a k h a r o v V.P. Interactive debugging complex (S.-Petersburg Centre of Sci.-Tech. In f.) .......... . 197
P a r t y k o Z.V. Combinatorial method of proof-reading automation (Lvov Bolygr. Inst.) ...................... 211