Download - КОМБИНАТОРНЫЙ МЕТОД АВТОМАТИЗАЦИИ ПРОЦЕССОВ КОРРЕКТУРЫ ● COMBINAYORIAL METHOD OF AUTOMATION IN PROOF-READING PROCESS

18Ч,\ 0X03-2400

Структурная и прикладнаялингвистика

С.ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Издается с 1987 г.

СТРУКТУРНАЯИ ПРИКЛАДНАЯ ЛИНГВИСТИКА

Межвузовский сборник

В ы п у с к 4

Под редакцией А. С. Герда

САНКТ-ПЕТЕРБУРГИЗДАТЕЛЬСТВО С.-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

1993

ББК 81Д С87

Сборник (адп.З вышел в 1987 г . ) содержит статьи, охватывающие широкий круг проблем современной теоретической и прикладной лингвистики. Рассматриваются актуальные вопросы семантики и синтаксиса, применения математических методов в языкознании, разработки лингвистических основ автоматической обработки текстов.

Для специалистов по прикладной и Математической лингвистике .

Р е д а к ц и о н н а я к о л л е г и я : д-р филол.наук В.В.Богданов, д-р филол. наук Л.З.Бондарко, д-р филол. наук А.С.Герд (отв. редактор), д-р филол. наук Б.Ю.Городецкий.

Р е ц е н з е н т : д-р филол. наук Л.Н.Беляева (Рос.гос. пед. ун-т)

Печатается по постановлению Редакционно-издательского совета

С.-Петербургского университета

п 1403000000 - 088 лт а? 076(02) - 93

(р) Издательство ^ С.-Петербургского

университета, I 993

Э.В.П а р т ы к о

КОМБИНАТОРНЫЙ МЕТОД АВТОМАТИЗАЦИИ ПРОЦЕССОВ КОРРЕКТУРЫ

1. Введение. Как известно, в настоящее время поток . документов, подлежащих тиражированию, поотоянно возрастает. В связи с этим возрастает и объем процесса корректуры, которому под вергают тексты, содержащиеся в документах. Поэтому возникает задача, состоящая в том, чтобы автоматизировать процесс коррек туры. Одному из методов решения этой задачи и посвящена данная статья.

Целью статьи является описание методики проектирования и разработки систем (подсистем, блоков) автоматизированной корректуры. В качестве материальной базы для описания этой методики будет использована автоматизированная информационная система (А.''С) "Ассистент", функционирующая в Институте научной и технической информации (г.М осква).

© З.В . Парты ко, 1993211

2. Основные методы машинной корректуры. Под машинной корректурой будем подразумевать процесс приведения текста в соответствие с оригиналом, а также с наиболее простыми языковыми нормами для нижних уровней языка, т .е . правилами орфографии и пунктуации. В процессе корректуры будем различать операции контроля, т .е . нахождения искажений, и операции реконструкции, т.е. исправления искажений, найденных в процессе контроля.

Среди методов машинной корректуры можно выделить два их основных класса: универсальные и специальные. Основное различие между этими классами методов состоит в том, что универсальные методы (например, метод дублирования) предполагают обработку абсолютно всех знаков, содержащихся в тексте (допустим, и букв, и цифр), а специальные методы (например, словарный) предполагают обработку не всех, а только какого-то одного типа знаков (допустим, только букв, но не цифр и не знаков препинания).

Относительно универсальных методов следует сказать,что их применение во всех случаях является более предпочтительным, однако стоимость их применения из-за необходимости увеличения объема набора текста (повторного ввода всего текста или дополнительного ввода контрольных разрядов) существенно превышает стоимость использования специальных методов. Поэтому разработчикам систем машинной корректуры всегда в первую очередь приходится решать вопрос о целесообразности использования универсальных методов.

Как показывают расчеты, в целом ряде случаев экономически более выгодно использовать не универсальные, а специальные методы корректуры, в частности для таких типов текстов, требования к достоверности которых не особенно высоки, например текстов информационных изданий. Однако в этом случае приходится использовать не один, а несколько или даже целый ряд методов корректуры, поскольку тексты практически всегда включают различные типы знаков: и буквы, и цифры, и знаки препинания и др. Поскольку такой способ корректуры предполагает использование комбинации нескольких методов, то в дальнейшем будем называть его к о м б и н а т о р н ы м . Разумеется, использование специальных методов корректуры не исключает возможности использования для отдельных элементов текста и универсальных методов.

212

Учитывая изложенное, рассмотрим основные характеристики наиболее часто используемых специальных и универсальных методов машинной корректуры, т .е . контроля и реконструкции.

Среди специальных методов для буквенных текстов наиболее часто используют полиграммные и словарные методы контроля, а для цифровых и буквенно-цифровых текстов - формально-логический метод контроля.

Полиграммные методы контроля можно классифицировать на биграммные, триграммные, тетраграммные, слоговые и псевдосло- говые.* К их достоинствам следует отнести простоту реализации, возможность контроля текста без ограничения на количество содержащихся в нем разных слов и низкую стоимость обработки. Основным недостатком этих методов является низкая эффективность контроля (0 ,1 5 -0 ,5 0 ).1 2

В числе словарных методов в первую очередь следует выделить кросскорреляционные и автокорреляционные.2 При автокорреляционных методах базу данных, с помощью которой проводят корректуру (например частотный словарь), образуют на основании самого текста, а при кросскорреляционных - используют заранее подготовленные базы данных, /.наппимер, орфографические словари). Достоинствами этих методов являются относительно высокая эффективность контроля (0 ,5 -0 ,7 ) и более низкая, чем при дублировании, стоимость обработки. К недостаткам следует отнести большой объем словарей, трудоемкость их создания и невозможность контроля словоформ, отсутствующих в словаре. Кроме того, необходимо учитывать, что автокорреляционные методы выдают для ручного просмотра в 2-3 раза больше словоформ, чем кросскорреляци- онные.

1 Р и б а к о в Ф.И., Р у д н е в Е.А., П е т у х о в В.А. Автоматическое индексирование на естественном языке. М., 1980.

2 К а н А.Г., Я р м о л ю к В.П) АвтоматизаЩя орфографии о го контролю в системах переробки текстово! ДнформацИ 77 Пол1граф1я 1 видавнича справа. № 7. Л-ьв1в, 1981. С.61-83.

0 2 а т о г а А. Аи-Ьогоа-Ыс йе-Ьес-Ыоп алй. со гге с Ы о п оГ е р е Ш п е е г го г в хп 1агке Ца'Ьа Ъаве / / Лоигпа1 оР АтегДсап 8 о с1 е- Ъу Тот 1.п:Гоггаа1;1оп в сД еп се. 1980 . N 1 . Р . 5 1 -5 7 .

213

Эффективность методов формально-логического контроля циф- ровг,1х и буквенно-цифровых текстов в среднем составляет не более 0 ,5 .^

Среди универсальных методов, пригодных для обработки любых типов знаков, следует выделить такие, как контроль способом дублирования и с помощью искусственно внесенной избыточности, т .е . контрольных разрядов. К достоинствам метода дублирования следует отнести его высокую эффективноеть (более 0 ,9 6 ) и простоту реализации, а к недостаткам - низкую экономическую эффективности или вообще неэффективность при малом числе корректу р .0 Эффективность контроля с помощью искусственно внесенной избыточности может колебаться в широких пределах и может достигать, например, 0 ,9 0 -0 ,9 9 .

В настоящее время разработаны методы реконструкции в основном только для несвязных текстов (их эффективность от 0 ,2 до 0 ,9 ) . Из этого следует, что для связных текстов сейчас выгоднее использовать не автоматическое, а ручное исправление искажений. Это значит, что в целом машинная корректура будет не автоматической, а автоматизированной. Однако данный вывод не исключает возможности использования машинной реконструкции для несвязных текстов.

Из данного анализа методов мы вполне сознательно исключили аппаратные методы машинной корректуры (эти методы, наиболее часто базируются на использовании контрольных разрядов или дублирования), так как они требуют существенных затрат на выпуск специализированных устройств. Исходя из этого можно предположить, что в будущем автоматизация корректуры будет происходить в основном за счет программных, а не аппаратных средств.

3. Характеристика обрабатываемых текстов. Характеризуя тексты, обрабатываемые в АИС "Ассистент", необходимо отметить, что все они имеют стандартизированную структуру. В них можно выделить следующие языковые единицы: графемы, морфемы, слова, словосочетания, предложения, сверхфравовые единства, блоки и дискурс.Каждый такой текст включает четыре блока, которые содержат:

^ М е л ь н и к о в Ю.Н. Достоверность информации в сложных системах. М., 1978.

5 '

А в т о м а т и з а ц и я переработки текста в полиграфии. « . , 1977.214

первый блок - служебную, в основном цифровую., информацию; второй блок - комбинированные, т .е . синтаксически связные

и синтаксически несвязные, тексты (библиографическое описание); третий блок - несвязные тексты (ключевые слова); четвертый блок - связные тексты (реферат).Текст каждого блока может полностью соответствовать одно

му полю (например, блок ключевых слов) или может быть сегментирован на отдельные поля (например, поле названия работы, названия периодического издания, фамилии автора и т .д . ) .

Используя различные комбинации второго, третьего и четвертого блоков, на выходе системы могут получать различные документы как в традиционном (бумажном), так и в машиночитаемом (на магнитных лентах) виде. В частности, в традиционном виде в рамках АЙС "Ассистент" издают бюллетени сигнальной информации (СИ) и реферативный журнал (РЖ).

Пример текста, обрабатываемого в системе "Ассистент", приведен на рис.1 .

4 . Способ подбора нужной комбинации методов корректуры. В случае принятия решения об использовании для машинной корректуры универсальных методов обработки выбор конкретного метода является не особенно сложным (вначале определяют • необходимую эффективность корректуры, а далее подбирают метод, обеспечивающий такую эффективность). Значительно сложнее подобрать ‘ нужные методы при комбинаторном способе обработки текста .6 Еще больше усложняет такой подбор то, что текст, как, например, в нашем случае (см. раздел 3 ), может быть сегментирован на поля. Учитывая приведенное для подбора нужных методов корректуры был использован следующий прием.

Каждому полю, обрабатываемому в системе, был присвоен приоритет $ ( у = 1 ,2 ,3 ,4 ,5 ) . Для присвоения приоритетов использовался метод балльных оценок с весовыми коэффициентами. При этом

6 3 и н г е р И.С., К у ц и к Б.С. Обеспечение достоверности данных в АСУП. М., 1974; К и т о в А.И., й н я к и- н а Т.П. Автоматизация контроля первичной информации в автоматизированных системах обработки данных / / Цифровая вычислительная техника и программирование. 1974. Вып.8. С .23-31.

215

ФАЙЛ ООО ГРАНКА МО

РЕН : Ш320УЯ СДФ(0010001 1.3132,736 (0010101 4.11,05.2227 (0200001 0 (025000) 1 (040000) 1(060000) УДК 661.322.007 (065000) 13.13.222.18(080001) АКК ЗУК II блочные выборки* Н оценки* К базы данных (10000!) Ра1чи РгавКапШ НагсЬ Ба1гакоге Т.(200000! Аппроксимация блочных аыборок при организации базданных(200010) АрргохШыКпо Ыоск ассевве» 1о баЦЬааеогоапиаНопз (21000!) Ы . Ргосевв. 1*11.(310000) 19 (320000) N 2 (451000) N1.(600001) 0.0.84 (700002) 75-79 (7000071 англ.(801000) 054290 (940000) 0020-0190(999000) Отмечается. что «из. проеитироаание БДпредставляет собой сложную задачу, облегчить решение которой может применение автоматизированных средств.Рассмотрены 3 версии подобных средств, в которых основное внимание уделено выбору путей доступа, обеспечиваюших выполнение запросов пользователей.(999001) Приводится сравнит. анализ преимуществ инедостатков зтнх подходов. Показано, что одни из них .вносит погрешность, а 2 других, хотя и позволяют получить точные оценки отличаются значительной вычислительной сложностью и, в силу этого, плохо приспособлены для целей моделирования, Предлагается аппроксимация ожидаемого числа блочныхдоступов, свободная от указанных ранее недостатков. Ил. 3. Библ. 14.(999900) АД. Белявский

Рио Л . Образец текста, обрабатываемого в АИС "Ассистент".

каж?(ое поле оценивалось по трем .параметрам, каждый из которых определял важность содержащейся в-поле информации для (а ) . .потребителей, (б ) реализации информационного поиска и (в) выдачи документа из хранилища. Таким образом, было получено, что А -

5= У В - где А - множество всех полей, а Ь : - подмножество по-

3 ‘ \ м

лей у~того приоритета.

- о

В обобщенном виде множество всех полей приведено ниже в таблице (столбец 2 ) .

Исходя из важности выполняемых полями функций, было принято, что вероятность появления искажения после корректуры (г,-) для приоритета,/»! I должна равняться или быть меньше С(соответствующая минимальная допустимая достоверность (а^) равна ^ = 0 ,9 9 9 83й ), для приоритета ^ * 2 вероятность г2 ^ !х Ю “̂ ( ^ г * 0 ,9 9 9 58 ), для приоритета / * 3 вероятность г5 < 4x10“ ̂(с?з= 0 ,9 9 9 3 2 ), для приоритета у = 4 вероятность ^ 6x10“ *̂(й?/, = 0 ,997 48) и для приоритета у'= 5 вероятность г 5 <(й?5 = 995 8 0 ).

Теперь определим, какая эффективность контроля (Еку) необходима для полей каждого подмножества Ъ - . Для этого в качестве исходного запишем неравенство:

( I )

где Д,- - достоверность информации после корректуры в полях того приоритета;

Рп - вероятность искажения знака в текстах после корректуры.

Поскольку

< - д , -то

■ >, 1 - ( 2 )

где - вероятность искажения знака в текстах до корректуры.Подставив вместо Ду значения с1у; получим минимальные зна

чения необходимых эффективностей контроля. Теперь, базируясь на данных раздела 2, подберем такие методы контроля А/к у , которые обеспечивали бы такую же или большую эффективность контроля.

й В общем случае с1= \ - Р я \ ~ ^ - \ - 1 4е / У , где а - достовер ость, Р — вероятность искажения знака, /л - средняя длина искажения (по нашим расчетам 4 * 4 ,2 ) , г - вероятность появления искажения в текстах, & - количество искажений в текстах, а V - объем текста в знаках.

217

Однако подобрать для полей каждого приоритета (Ву) свой метод контроля оказалось невозможным, поскольку, например, поля приоритета 2 (см. нике таблицу, столбец 8) включают как бук-

•* вечные, так и цифровые тексты, а методы контроля для таких текстов (см. раздел 2) являются разными. Поэтому оказалось необходимым разбить множество полей А на ряд подмножеств Сь так,

и '*чтобы А - V Си ,

ЛИ А ’где Сд - подмножество полей, обрабатываемых

Л-м методом контроля (Л в 1 ,2 ,3 . .Н). При этом было установлено три правила, в соответствии с которыми поля объединялись в подмножества : I ) поля, входящие в одно подмножество, должны обрабатываться одним методом контроля, а значит, должны включать однородную информацию (буквенную, цифровую или буквенноцифровую); 2) в каждое подмножество должны входить в основном поля одного приоритета; 3 ) поля данного приоритета можно включать в подмножества полей с более высоким приоритетом, но не наоборот. В результате деления было получено семь подмножеств (Н = 7 ) (см. ниже таблицу, столбцы ! и 2 ).

С учетом сказанного для каждой группы полей Г на основании данных раздела 2 был подобран такой метод контроля который обеспечил эффективность равную или большую Ек • (см. таблицу, столбцы 4 и 5 ). '

Что касается реконструкции искажений, то, исходя из вывог- дов раздела 2, было решено использовать не автоматическое, а ручное исправление искажений, эффективность (Ер) которого было принято считать Ер = 1 ,0 . Это значит, что в целом эффективность корректуры будет зависеть только от эффективности проводимого контроля

5. Расчет достоверности информации в блоке машинной корректуры. Расчет достоверности информации для блока машинной корректуры АйС "Ассистент" проводился в виде задачи на оптимизацию. Задача получила следующую формулировку:

218

д _ , _ Р̂ <

I ъ ■т а л . ;

._!_ д ма&а&пдд)уцЯкм1)Р{** ^ .2 Р.1.

VI <1Э В ,) •*

А ^ А-пип *Эг *■ Э- /ЕЛ * 0 »Т < л/э,

где Д - достоверность информации после корректуры;РА - вероятность искажения знака до корректуры;Р'• - частота 1-того поля на одну тысячу документов;2г- - длина г-того поля, количество знаков;

^к,Н - эффективность Л-го метода;- достоверность информации в подмножестве Ду полей / -

того приоритета;А т т " минимально допустимая достоверность информации на

выходе системы (принята равной Дт ^Лз 0,999 16, что соответствует г а 2x10"^);

Эр - годовой экономический эффект, ты с.руб.;Э - суммарная экономия от создания и внедрения блока за

год, ты с.руб.;Е - нормативный коэффициент экономической эффективности

(Е = 0 ,1 5 ) ;Л - единовременные затраты на создание и внедрение БМК,

тыс. руб. ;Т - срок окупаемости блока, годы.Указанная задача бьша запрограммирована на языке ФОРТРАН

и решалась на СМ ЭВМ. В ходе решения было установлено, что при указанных в таблице методах контроля и принятых ограничениях решение задачи о машинной корректуре существует. Это значит, что

219

создание блока машинной корректуры для АИС "Ассистент" возможно. При этом ориентировочный годовой экономический эффект составит 39 тыс.руб., а срок окупаемости - 3 ,5 года.

6. Экспериментальная проверка комбинаторного метода корректуры. Поскольку для системы было предложено использовать целый ряд методов контроля, то в первую очередь было решено определить, какое приращение достоверности информа;ии обеспечивает каждый метод контроля. Как показали расчеты, наибольшее приращение достоверности информации обеспечивает словарный метод контроля (б2$ для СИ и 92$ для РЛС). Это значит, что именно данный метод является наиболее важным для АИС "Ассистент". Исходя из сказанного, было решено экспериментально проверить правильность проектного решения на базе именно словарного метода.

Для экспериментальной проверки указанного метода были разработаны политехнический (нл 29 тыо.с-аовойррв) я отраслевой (на 3 тыс. словоформ) словари русского языка.' В политехнический словарь была включена в основном общеязыковая и общенаучная лексика, а в отраслевой - лексика области научно-технической информации. Структура каждой записи в словарях явилась следующей :

ССС.. . С/Л1/7Т2/К1/К2/ГК//,

где ССС...С - буквенный код словоформы;Д1 - длина словообразовательной основы;Д2 - длина словоизменительной основы;К1 - код флективного класса;К2 - код словообразовательного класса;ГК - признак обобщенного грамматического класса.

Экспериментальная проверка на ЕС ЭВМ словарного метода контроля показала, что уже в разработанном виде он может быть использован для обработки СИ и потребует лишь незначительного усовершенствования для обработки РХ. В ходе проверки были также определены основные технологические характеристики словарного метода: а) покрываемость текстов - около 98$; б) эффективность контроля - 0,656 (для СИ) и 0,601 (для РК); в) скорость обра-

Разработка проводилась коллективом сотрудников ВИНИТИ.220

ботки текста - 30 слов за I секунду (имеется резерв для ее повышения); г) количество слов с искажениями в общем списке неопознанных слов, выдаваемых для ручного контроля, - около 36$.

7. Архитектура блока машинной корректуры. Рекомендуемая для АИС "Ассистент" архитектура блока машинной корректуры пред ставлена в таблице. Для реализации методов контроля, перечисленных в этой таблице, необходима лингвистическая база данных, в которую должны входить:

а) массив словарей, включающий политехнический и отраслевые словари, а также словари-минимумы наиболее распространенных языков (на момент разработки суммарный объем словарей был равен 32 тыс. словоформ);

б) массив словников, т .е . списков ключевых слов или дескрипторов, по отраслям (предполагаемый объем 10-20 тыс. записей);

в) массив нормированных элементов, т .е . списков названий языков (не более 70), стран (150), городов (500), издательств (I тыс.), организаций (22 тыс.) и сериальных изданий (10 тыс.);

г ) массив фамилий (по отраслям);д) массив контролирующих функций;е) массив шаблонов.Для указанной в таблице архитектуры блока машинной коррек

туры можно наметить следующие этапы ввода и обработки текста:предкорректура (присвоение ряду полей контрольных разря

дов);запись текста на машинные носители информации;интеркорректура (контроль текста на ЭВМ);распечатка текста на фотонаборной машине с выделением ис

кажений;посткорректура (ручное исправлением адресация искажений);запись исправленного текста на машинные носители информа

ции;внесение правок в тексты с помощью ЭВМ.Образцы текстов, подвергнутых автоматизированной коррек

туре, показаны на рис.2.

г?л

Основные элементы архитектуры блока машинной корректуры АИС "Ассистент

{000001) КОДЫ ФЛК: ? И; ОШИБКА В ПОД

Ш АКК АСУ

***?

' (р$0001}~АКК планирование производствах Н расписаниях КГАПХ К АСУ"{08)11(4 ***??— > планиро ? ванне 1

•(080001) АКК СУБДХ Н ВОКС системах Н реляционные 6ДК Н защите данных* К автоматизация учреждений {МШО} **???— > НОКС 1

) (080001) АКК программное обеспеченнеК Н раз Ь аботкаХ Н/ сложность* Н методы оценки /

(0ВШ0) * « ? ? - -> аботка }

(080000 АКК тревожная сигнализациях Н обнаружениеПРИСУТСТВИЯХ )&атчики

(ЙМ11В) ***??-*> Ндатчики ?

(ввОООИ АКК автоматическая защитах К ' днсплеиХ Н переметающаяся „мыиш’ Х Я вторжение (081110) **•??— > мышь 9

Р и с .2 . Образец автоматизированной корректуры поисковых образов документов (корректурными знаками показаны правки корректоров).8. Заключение. Расчет достоверности.информации для блока

машинной корректуры АИС "Ассистент" показал, что при установленных ограничениях и комбинаторном методе контроля можно осуществлять автоматизированную корректуру обрабатываемых в системе текстов с приемлемым качеством обработки. Экспериментальная проверка наиболее важного для указанного блока словарного метода контроля подтвердила сделанный вывод.

Комбинаторный метод корректуры показал перспективность своего применения на практике, в частности для текстов, сегментированных на поля. По-видшому, комбинаторный метод в модифицированном виде может быть применен для обработки и связных текстов, не сегментированных на поля. Для этого потребуется предварительно определить важность различных элементов текста (например, знаков препинания, синтаксических связей и т.д.) для потребителей (читателей) информации.

(66000!) АКК измерительные преобразозателиХ Н рг аковкзХН восстановление сиги»лоз

223

О Г Л А В Л Е Н И Е

М а т е м а т и ч е с к а я и прикладная лингвистикав С.-Петербургском университете ................................. ^

Б о г д а н о в В.В. Деятельность в вербальном общении(С.Петербургский у н -т ) ..................................................... 14

Т е л е г и н а Г .В . Семантика и прагматика модусныхпредикатов: мнения и проблемы (Тюменский у н -т) . . . 22

Д и к а р е в а С.С. Инициатива в диалоге (Симферопольский у н -т ) .............................................. 30

З у б к о в а Т.И. О роли предлогов 6 предложении (На материале исследований детской речи и нарушений речи при афазии ) (С.-Петербургский у н -т ) ................... 39

Т а б а н а к о в а В.Д. Прагматический аспект логического анализа текста словарного определения (Тюменский у н -т) . . . . .......... ......................................................... 45

Л у б и н и н а Т.А. Семантическая структура предложений с инфинитивом в функции подлежащего (на' материале английского языка) (С.-Петербургский у н - т ) . . 50

К л и м о н о в В.Л. О ноизоморфизме маркированности всклонении русских существительных (АН Германии)... 59

А л е к с е е в П.М. О некоторых квантитативно-лингвистических оппозициях (Рос. пед, у н -т) ....................... 66

Г е р д А,С. К вопросу о роли низкочастотных фактов влингвистическом исследовании (С.-Петербургский ун-т) 75

М а н а с я н Н.С. О двух статистических способах различения типов текста (Ереванский политех.. ин-т) . . 98

Б у т о р о в В.Л. , Ш е р е м е т ь е в а С.О. Частотные характеристики семантико-синтаксических признаков предикатной лексики в текстах формулы изобрете пя (С.-Петербургский у н -т )................................ ЮЗ

Р у с к о а а М.П. Статистические параметры имен существительных мужского рода множественного числа в болгарском языке ХУШ в. (С.-Петербургский у н -т) . . 134

22А

м а р у с е н к о М.А. Алгоритмизация проверки литературно-критической атрибуционной гипотезы (С.-Петербургский ун-т) .................................. . . .................................... 1*5

Г а й ш т у т К.М. Особенности номинаций и семантического развития в терминосистеме наименований видов деловых текстов (Тверской ун-т) ....................................... 160

Г р и н б а у м О.Н., М а р т , ы н е н к о Г.Я. Структуризация текста в компьютерной системе "ЛИНДА" (С.- Петербургский у н - т ) ......... . ..................................................... 171

О т к у п щ и к о в а М.И., К р е м н е в а Н.Д.,К и р и ч е н к о Н.Л., З а м б р ж и ц к и й В Х Функционально-семантическая информация в словарных процедурах для анализа текстов узкой предметной области (С.-Петербургский ун-т) ............................................ 181

В о I с к у н с к и й В. Г ., З а х а р о в В.П. Диалоговый отладочный комплекс (С.-Петербургский центр научно-техн. информации) ......................... 197

П а р т ы к о З.В. Комбинаторный метод автоматизациипроцессов корректуры (Львовский полиграф, ин-т) . . . 211

C O N T E N T

M a t h e m a t l c a l linguistics at S.-PetersburgUniversity.... ............................. 3

B o g d a n o v V.V. Activities in verbal communication (S.-Petersburg Univ.) ................ ........ 14

T e l e g i n a G.V. Semantics and pragmatics of moduspredicates 1 opinions and problems (Tyumen Univ.) 22

D i k a r e v a S.S. Initiative in dialogue (Simferopol Univ.) ........................... ........... 30

Z u b k o v a T.I. On the role of prepositions in asentence (S.-Petersburg Univ.) ................. 39

T a b a n a k o v a V.D. A pragmatic aspect of the logical analysis of a dictionary definition (Tyumen Univ.) ........................................ 43

D u b i n i n s T.A. The semantic structure of sentences containing an infinitive subject (in English sentences) (S.-Petersburg Univ.) ................. 50

K l i m o n o v V.D. On non-isomorphism of markednessin Russian noun declension (Academy of science. Germany) ............ •.......................... 51,

A l e k s e y e v P.M. On some quantitative linguisticoppositions (Ped. Univ.) ......................... 66

H e a r d A.S. On the problem of the role of low frequency facts in linguistic investigations (S.-Petersburg Univ.) ................................ 75

M a n a s y a n N.S. On two statistic ways of text typedifferentiation (Yerevan Polytechnical Institute) 98

B u t 0 r o v V.D., S h e r e m e t e v a S.O. Frequency characteristics of semantico-syntactic features of predicate words in invention formula texts (S.-Petersburg Univ.) .......... ................. 103

K u s k o v a M.P. Statistic parameters of masculinenouns in the plural in the Bulgarian language of the XVIII century (S.-Petersburg Univ.) ......... 134

226

M a r u s e n k o M.A. Compiling algorithms for check- . ing literary c r itic attribution hypothesis (S.-Peters burg Univ.) ............ .................................... 145

G a i s h t u t K.M. Some characteristic features of nomination and semantic development in the term system of business text names (Tver. Univ.) . . . . . . 160

G r i n b a u m O.N., M a r t y n e n k o G.Ya. Struc- turalysation of text in a computer system "LINDA”(S. -Peters burg Univ.) ............ ................................ 171

O t k u p s h c h i k o v a M.I., K r e m n e v a N.D.K i r i c h e n k o N.L., Z a m b r z h i t s - k y V.L. Functional semantic information in dictionary procedures for narrow subject fie ld text analysis (S.-Petersburg Univ.) ................. ............ 181

V o y s k u n s k i V.G.; Z a k h a r o v V.P. Interactive debugging complex (S.-Petersburg Centre of Sci.-Tech. In f.) .......... . 197

P a r t y k o Z.V. Combinatorial method of proof-reading automation (Lvov Bolygr. Inst.) ...................... 211