КОМБИНАТОРНЫЙ МЕТОД АВТОМАТИЗАЦИИ ПРОЦЕССОВ...

20
18Ч,\ 0X03-2400 Структурная и прикладная лингвистика

Transcript of КОМБИНАТОРНЫЙ МЕТОД АВТОМАТИЗАЦИИ ПРОЦЕССОВ...

18Ч,\ 0X03-2400

Структурная и прикладнаялингвистика

С.ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Издается с 1987 г.

СТРУКТУРНАЯИ ПРИКЛАДНАЯ ЛИНГВИСТИКА

Межвузовский сборник

В ы п у с к 4

Под редакцией А. С. Герда

САНКТ-ПЕТЕРБУРГИЗДАТЕЛЬСТВО С.-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

1993

ББК 81Д С87

Сборник (адп.З вышел в 1987 г . ) содержит статьи, охваты­вающие широкий круг проблем современной теоретической и при­кладной лингвистики. Рассматриваются актуальные вопросы се­мантики и синтаксиса, применения математических методов в языкознании, разработки лингвистических основ автоматической обработки текстов.

Для специалистов по прикладной и Математической лингви­стике .

Р е д а к ц и о н н а я к о л л е г и я : д-р филол.наук В.В.Богданов, д-р филол. наук Л.З.Бондарко, д-р филол. наук А.С.Герд (отв. редактор), д-р филол. наук Б.Ю.Городецкий.

Р е ц е н з е н т : д-р филол. наук Л.Н.Беляева (Рос.гос. пед. ун-т)

Печатается по постановлению Редакционно-издательского совета

С.-Петербургского университета

п 1403000000 - 088 лт а? 076(02) - 93

(р) Издательство ^ С.-Петербургского

университета, I 993

Э.В.П а р т ы к о

КОМБИНАТОРНЫЙ МЕТОД АВТОМАТИЗАЦИИ ПРОЦЕССОВ КОРРЕКТУРЫ

1. Введение. Как известно, в настоящее время поток . доку­ментов, подлежащих тиражированию, поотоянно возрастает. В свя­зи с этим возрастает и объем процесса корректуры, которому под вергают тексты, содержащиеся в документах. Поэтому возникает задача, состоящая в том, чтобы автоматизировать процесс коррек туры. Одному из методов решения этой задачи и посвящена данная статья.

Целью статьи является описание методики проектирования и разработки систем (подсистем, блоков) автоматизированной кор­ректуры. В качестве материальной базы для описания этой мето­дики будет использована автоматизированная информационная си­стема (А.''С) "Ассистент", функционирующая в Институте научной и технической информации (г.М осква).

© З.В . Парты ко, 1993211

2. Основные методы машинной корректуры. Под машинной кор­ректурой будем подразумевать процесс приведения текста в соот­ветствие с оригиналом, а также с наиболее простыми языковыми нормами для нижних уровней языка, т .е . правилами орфографии и пунктуации. В процессе корректуры будем различать операции кон­троля, т .е . нахождения искажений, и операции реконструкции, т.е. исправления искажений, найденных в процессе контроля.

Среди методов машинной корректуры можно выделить два их основных класса: универсальные и специальные. Основное разли­чие между этими классами методов состоит в том, что универсаль­ные методы (например, метод дублирования) предполагают обработ­ку абсолютно всех знаков, содержащихся в тексте (допустим, и букв, и цифр), а специальные методы (например, словарный) пред­полагают обработку не всех, а только какого-то одного типа зна­ков (допустим, только букв, но не цифр и не знаков препинания).

Относительно универсальных методов следует сказать,что их применение во всех случаях является более предпочтительным, од­нако стоимость их применения из-за необходимости увеличения объема набора текста (повторного ввода всего текста или допол­нительного ввода контрольных разрядов) существенно превышает стоимость использования специальных методов. Поэтому разработ­чикам систем машинной корректуры всегда в первую очередь при­ходится решать вопрос о целесообразности использования универ­сальных методов.

Как показывают расчеты, в целом ряде случаев экономически более выгодно использовать не универсальные, а специальные ме­тоды корректуры, в частности для таких типов текстов, требова­ния к достоверности которых не особенно высоки, например тек­стов информационных изданий. Однако в этом случае приходится использовать не один, а несколько или даже целый ряд методов корректуры, поскольку тексты практически всегда включают раз­личные типы знаков: и буквы, и цифры, и знаки препинания и др. Поскольку такой способ корректуры предполагает использование комбинации нескольких методов, то в дальнейшем будем называть его к о м б и н а т о р н ы м . Разумеется, использование специальных методов корректуры не исключает возможности исполь­зования для отдельных элементов текста и универсальных методов.

212

Учитывая изложенное, рассмотрим основные характеристики наиболее часто используемых специальных и универсальных мето­дов машинной корректуры, т .е . контроля и реконструкции.

Среди специальных методов для буквенных текстов наиболее часто используют полиграммные и словарные методы контроля, а для цифровых и буквенно-цифровых текстов - формально-логичес­кий метод контроля.

Полиграммные методы контроля можно классифицировать на биграммные, триграммные, тетраграммные, слоговые и псевдосло- говые.* К их достоинствам следует отнести простоту реализации, возможность контроля текста без ограничения на количество со­держащихся в нем разных слов и низкую стоимость обработки. Ос­новным недостатком этих методов является низкая эффективность контроля (0 ,1 5 -0 ,5 0 ).1 2

В числе словарных методов в первую очередь следует выде­лить кросскорреляционные и автокорреляционные.2 При автокорре­ляционных методах базу данных, с помощью которой проводят кор­ректуру (например частотный словарь), образуют на основании са­мого текста, а при кросскорреляционных - используют заранее подготовленные базы данных, /.наппимер, орфографические словари). Достоинствами этих методов являются относительно высокая эффек­тивность контроля (0 ,5 -0 ,7 ) и более низкая, чем при дублирова­нии, стоимость обработки. К недостаткам следует отнести боль­шой объем словарей, трудоемкость их создания и невозможность контроля словоформ, отсутствующих в словаре. Кроме того, необ­ходимо учитывать, что автокорреляционные методы выдают для руч­ного просмотра в 2-3 раза больше словоформ, чем кросскорреляци- онные.

1 Р и б а к о в Ф.И., Р у д н е в Е.А., П е т у х о в В.А. Автоматическое индексирование на естественном языке. М., 1980.

2 К а н А.Г., Я р м о л ю к В.П) АвтоматизаЩя орфог­рафии о го контролю в системах переробки текстово! ДнформацИ 77 Пол1граф1я 1 видавнича справа. № 7. Л-ьв1в, 1981. С.61-83.

0 2 а т о г а А. Аи-Ьогоа-Ыс йе-Ьес-Ыоп алй. со гге с Ы о п оГ е р е Ш п е е г го г в хп 1агке Ца'Ьа Ъаве / / Лоигпа1 оР АтегДсап 8 о с1 е- Ъу Тот 1.п:Гоггаа1;1оп в сД еп се. 1980 . N 1 . Р . 5 1 -5 7 .

213

Эффективность методов формально-логического контроля циф- ровг,1х и буквенно-цифровых текстов в среднем составляет не бо­лее 0 ,5 .^

Среди универсальных методов, пригодных для обработки лю­бых типов знаков, следует выделить такие, как контроль спосо­бом дублирования и с помощью искусственно внесенной избыточно­сти, т .е . контрольных разрядов. К достоинствам метода дублиро­вания следует отнести его высокую эффективноеть (более 0 ,9 6 ) и простоту реализации, а к недостаткам - низкую экономическую эф­фективности или вообще неэффективность при малом числе коррек­ту р .0 Эффективность контроля с помощью искусственно внесенной избыточности может колебаться в широких пределах и может дости­гать, например, 0 ,9 0 -0 ,9 9 .

В настоящее время разработаны методы реконструкции в ос­новном только для несвязных текстов (их эффективность от 0 ,2 до 0 ,9 ) . Из этого следует, что для связных текстов сейчас выгоднее использовать не автоматическое, а ручное исправление искажений. Это значит, что в целом машинная корректура будет не автомати­ческой, а автоматизированной. Однако данный вывод не исключает возможности использования машинной реконструкции для несвязных текстов.

Из данного анализа методов мы вполне сознательно исключи­ли аппаратные методы машинной корректуры (эти методы, наиболее часто базируются на использовании контрольных разрядов или дуб­лирования), так как они требуют существенных затрат на выпуск специализированных устройств. Исходя из этого можно предполо­жить, что в будущем автоматизация корректуры будет происходить в основном за счет программных, а не аппаратных средств.

3. Характеристика обрабатываемых текстов. Характеризуя те­ксты, обрабатываемые в АИС "Ассистент", необходимо отметить, что все они имеют стандартизированную структуру. В них можно выде­лить следующие языковые единицы: графемы, морфемы, слова, сло­восочетания, предложения, сверхфравовые единства, блоки и дис­курс.Каждый такой текст включает четыре блока, которые содержат:

^ М е л ь н и к о в Ю.Н. Достоверность информации в слож­ных системах. М., 1978.

5 '

А в т о м а т и з а ц и я переработки текста в полиг­рафии. « . , 1977.214

первый блок - служебную, в основном цифровую., информацию; второй блок - комбинированные, т .е . синтаксически связные

и синтаксически несвязные, тексты (библиографическое описание); третий блок - несвязные тексты (ключевые слова); четвертый блок - связные тексты (реферат).Текст каждого блока может полностью соответствовать одно­

му полю (например, блок ключевых слов) или может быть сегмен­тирован на отдельные поля (например, поле названия работы, на­звания периодического издания, фамилии автора и т .д . ) .

Используя различные комбинации второго, третьего и чет­вертого блоков, на выходе системы могут получать различные до­кументы как в традиционном (бумажном), так и в машиночитаемом (на магнитных лентах) виде. В частности, в традиционном виде в рамках АЙС "Ассистент" издают бюллетени сигнальной информации (СИ) и реферативный журнал (РЖ).

Пример текста, обрабатываемого в системе "Ассистент", при­веден на рис.1 .

4 . Способ подбора нужной комбинации методов корректуры. В случае принятия решения об использовании для машинной коррек­туры универсальных методов обработки выбор конкретного метода является не особенно сложным (вначале определяют • необходимую эффективность корректуры, а далее подбирают метод, обеспечива­ющий такую эффективность). Значительно сложнее подобрать ‘ нуж­ные методы при комбинаторном способе обработки текста .6 Еще бо­льше усложняет такой подбор то, что текст, как, например, в на­шем случае (см. раздел 3 ), может быть сегментирован на поля. Учитывая приведенное для подбора нужных методов корректуры был использован следующий прием.

Каждому полю, обрабатываемому в системе, был присвоен при­оритет $ ( у = 1 ,2 ,3 ,4 ,5 ) . Для присвоения приоритетов использо­вался метод балльных оценок с весовыми коэффициентами. При этом

6 3 и н г е р И.С., К у ц и к Б.С. Обеспечение досто­верности данных в АСУП. М., 1974; К и т о в А.И., й н я к и- н а Т.П. Автоматизация контроля первичной информации в авто­матизированных системах обработки данных / / Цифровая вычисли­тельная техника и программирование. 1974. Вып.8. С .23-31.

215

ФАЙЛ ООО ГРАНКА МО

РЕН : Ш320УЯ СДФ(0010001 1.3132,736 (0010101 4.11,05.2227 (0200001 0 (025000) 1 (040000) 1(060000) УДК 661.322.007 (065000) 13.13.222.18(080001) АКК ЗУК II блочные выборки* Н оценки* К базы данных (10000!) Ра1чи РгавКапШ НагсЬ Ба1гакоге Т.(200000! Аппроксимация блочных аыборок при организации базданных(200010) АрргохШыКпо Ыоск ассевве» 1о баЦЬааеогоапиаНопз (21000!) Ы . Ргосевв. 1*11.(310000) 19 (320000) N 2 (451000) N1.(600001) 0.0.84 (700002) 75-79 (7000071 англ.(801000) 054290 (940000) 0020-0190(999000) Отмечается. что «из. проеитироаание БДпредставляет собой сложную задачу, облегчить решение которой может применение автоматизированных средств.Рассмотрены 3 версии подобных средств, в которых основное внимание уделено выбору путей доступа, обеспечиваюших выполнение запросов пользователей.(999001) Приводится сравнит. анализ преимуществ инедостатков зтнх подходов. Показано, что одни из них .вносит погрешность, а 2 других, хотя и позволяют получить точные оценки отличаются значительной вычислительной сложностью и, в силу этого, плохо приспособлены для целей моделирования, Предлагается аппроксимация ожидаемого числа блочныхдоступов, свободная от указанных ранее недостатков. Ил. 3. Библ. 14.(999900) АД. Белявский

Рио Л . Образец текста, обрабатываемого в АИС "Ассистент".

каж?(ое поле оценивалось по трем .параметрам, каждый из которых определял важность содержащейся в-поле информации для (а ) . .по­требителей, (б ) реализации информационного поиска и (в) выдачи документа из хранилища. Таким образом, было получено, что А -

5= У В - где А - множество всех полей, а Ь : - подмножество по-

3 ‘ \ м

лей у~того приоритета.

- о

В обобщенном виде множество всех полей приведено ниже в таблице (столбец 2 ) .

Исходя из важности выполняемых полями функций, было приня­то, что вероятность появления искажения после корректуры (г,-) для приоритета,/»! I должна равняться или быть меньше С(соответствующая минимальная допустимая достоверность (а^) рав­на ^ = 0 ,9 9 9 83й ), для приоритета ^ * 2 вероятность г2 ^ !х Ю “̂ ( ^ г * 0 ,9 9 9 58 ), для приоритета / * 3 вероятность г5 < 4x10“ ̂(с?з= 0 ,9 9 9 3 2 ), для приоритета у = 4 вероятность ^ 6x10“ *̂(й?/, = 0 ,997 48) и для приоритета у'= 5 вероятность г 5 <(й?5 = 995 8 0 ).

Теперь определим, какая эффективность контроля (Еку) необ­ходима для полей каждого подмножества Ъ - . Для этого в качестве исходного запишем неравенство:

( I )

где Д,- - достоверность информации после корректуры в полях того приоритета;

Рп - вероятность искажения знака в текстах после корректу­ры.

Поскольку

< - д , -то

■ >, 1 - ( 2 )

где - вероятность искажения знака в текстах до корректуры.Подставив вместо Ду значения с1у; получим минимальные зна­

чения необходимых эффективностей контроля. Теперь, базируясь на данных раздела 2, подберем такие методы контроля А/к у , которые обеспечивали бы такую же или большую эффективность контроля.

й В общем случае с1= \ - Р я \ ~ ^ - \ - 1 4е / У , где а - достовер ость, Р — вероятность искажения знака, /л - средняя длина искажения (по нашим расчетам 4 * 4 ,2 ) , г - вероятность появления искажения в текстах, & - количество искажений в тек­стах, а V - объем текста в знаках.

217

Однако подобрать для полей каждого приоритета (Ву) свой метод контроля оказалось невозможным, поскольку, например, по­ля приоритета 2 (см. нике таблицу, столбец 8) включают как бук-

•* вечные, так и цифровые тексты, а методы контроля для таких тек­стов (см. раздел 2) являются разными. Поэтому оказалось необ­ходимым разбить множество полей А на ряд подмножеств Сь так,

и '*чтобы А - V Си ,

ЛИ А ’где Сд - подмножество полей, обрабатываемых

Л-м методом контроля (Л в 1 ,2 ,3 . .Н). При этом было установлено три правила, в соответствии с которыми поля объединялись в под­множества : I ) поля, входящие в одно подмножество, должны обрабатываться одним методом контроля, а значит, должны вклю­чать однородную информацию (буквенную, цифровую или буквенно­цифровую); 2) в каждое подмножество должны входить в основном поля одного приоритета; 3 ) поля данного приоритета можно вклю­чать в подмножества полей с более высоким приоритетом, но не наоборот. В результате деления было получено семь подмножеств (Н = 7 ) (см. ниже таблицу, столбцы ! и 2 ).

С учетом сказанного для каждой группы полей Г на основа­нии данных раздела 2 был подобран такой метод контроля который обеспечил эффективность равную или большую Ек • (см. таблицу, столбцы 4 и 5 ). '

Что касается реконструкции искажений, то, исходя из вывог- дов раздела 2, было решено использовать не автоматическое, а ручное исправление искажений, эффективность (Ер) которого было принято считать Ер = 1 ,0 . Это значит, что в целом эффективность корректуры будет зависеть только от эффективности проводимого контроля

5. Расчет достоверности информации в блоке машинной кор­ректуры. Расчет достоверности информации для блока машинной корректуры АйС "Ассистент" проводился в виде задачи на оптими­зацию. Задача получила следующую формулировку:

218

д _ , _ Р̂ <

I ъ ■т а л . ;

._!_ д ма&а&пдд)уцЯкм1)Р{** ^ .2 Р.1.

VI <1Э В ,) •*

А ^ А-пип *Эг *■ Э- /ЕЛ * 0 »Т < л/э,

где Д - достоверность информации после корректуры;РА - вероятность искажения знака до корректуры;Р'• - частота 1-того поля на одну тысячу документов;2г- - длина г-того поля, количество знаков;

^к,Н - эффективность Л-го метода;- достоверность информации в подмножестве Ду полей / -

того приоритета;А т т " минимально допустимая достоверность информации на

выходе системы (принята равной Дт ^Лз 0,999 16, что соответствует г а 2x10"^);

Эр - годовой экономический эффект, ты с.руб.;Э - суммарная экономия от создания и внедрения блока за

год, ты с.руб.;Е - нормативный коэффициент экономической эффективности

(Е = 0 ,1 5 ) ;Л - единовременные затраты на создание и внедрение БМК,

тыс. руб. ;Т - срок окупаемости блока, годы.Указанная задача бьша запрограммирована на языке ФОРТРАН

и решалась на СМ ЭВМ. В ходе решения было установлено, что при указанных в таблице методах контроля и принятых ограничениях решение задачи о машинной корректуре существует. Это значит, что

219

создание блока машинной корректуры для АИС "Ассистент" возмож­но. При этом ориентировочный годовой экономический эффект со­ставит 39 тыс.руб., а срок окупаемости - 3 ,5 года.

6. Экспериментальная проверка комбинаторного метода кор­ректуры. Поскольку для системы было предложено использовать це­лый ряд методов контроля, то в первую очередь было решено оп­ределить, какое приращение достоверности информа;ии обеспечи­вает каждый метод контроля. Как показали расчеты, наибольшее приращение достоверности информации обеспечивает словарный ме­тод контроля (б2$ для СИ и 92$ для РЛС). Это значит, что именно данный метод является наиболее важным для АИС "Ассистент". Ис­ходя из сказанного, было решено экспериментально проверить пра­вильность проектного решения на базе именно словарного метода.

Для экспериментальной проверки указанного метода были раз­работаны политехнический (нл 29 тыо.с-аовойррв) я отраслевой (на 3 тыс. словоформ) словари русского языка.' В политехнический словарь была включена в основном общеязыковая и общенаучная лексика, а в отраслевой - лексика области научно-технической информации. Структура каждой записи в словарях явилась следую­щей :

ССС.. . С/Л1/7Т2/К1/К2/ГК//,

где ССС...С - буквенный код словоформы;Д1 - длина словообразовательной основы;Д2 - длина словоизменительной основы;К1 - код флективного класса;К2 - код словообразовательного класса;ГК - признак обобщенного грамматического класса.

Экспериментальная проверка на ЕС ЭВМ словарного метода кон­троля показала, что уже в разработанном виде он может быть ис­пользован для обработки СИ и потребует лишь незначительного усо­вершенствования для обработки РХ. В ходе проверки были также определены основные технологические характеристики словарного метода: а) покрываемость текстов - около 98$; б) эффективность контроля - 0,656 (для СИ) и 0,601 (для РК); в) скорость обра-

Разработка проводилась коллективом сотрудников ВИНИТИ.220

ботки текста - 30 слов за I секунду (имеется резерв для ее по­вышения); г) количество слов с искажениями в общем списке нео­познанных слов, выдаваемых для ручного контроля, - около 36$.

7. Архитектура блока машинной корректуры. Рекомендуемая для АИС "Ассистент" архитектура блока машинной корректуры пред ­ставлена в таблице. Для реализации методов контроля, перечис­ленных в этой таблице, необходима лингвистическая база данных, в которую должны входить:

а) массив словарей, включающий политехнический и отрасле­вые словари, а также словари-минимумы наиболее распространен­ных языков (на момент разработки суммарный объем словарей был равен 32 тыс. словоформ);

б) массив словников, т .е . списков ключевых слов или дес­крипторов, по отраслям (предполагаемый объем 10-20 тыс. запи­сей);

в) массив нормированных элементов, т .е . списков названий языков (не более 70), стран (150), городов (500), издательств (I тыс.), организаций (22 тыс.) и сериальных изданий (10 тыс.);

г ) массив фамилий (по отраслям);д) массив контролирующих функций;е) массив шаблонов.Для указанной в таблице архитектуры блока машинной коррек­

туры можно наметить следующие этапы ввода и обработки текста:предкорректура (присвоение ряду полей контрольных разря­

дов);запись текста на машинные носители информации;интеркорректура (контроль текста на ЭВМ);распечатка текста на фотонаборной машине с выделением ис­

кажений;посткорректура (ручное исправлением адресация искажений);запись исправленного текста на машинные носители информа­

ции;внесение правок в тексты с помощью ЭВМ.Образцы текстов, подвергнутых автоматизированной коррек­

туре, показаны на рис.2.

г?л

Основные элементы архитектуры блока машинной корректуры АИС "Ассистент

{000001) КОДЫ ФЛК: ? И; ОШИБКА В ПОД

Ш АКК АСУ

***?

' (р$0001}~АКК планирование производствах Н расписаниях КГАПХ К АСУ"{08)11(4 ***??— > планиро ? ванне 1

•(080001) АКК СУБДХ Н ВОКС системах Н реляционные 6ДК Н защите данных* К автоматизация учреждений {МШО} **???— > НОКС 1

) (080001) АКК программное обеспеченнеК Н раз Ь аботкаХ Н/ сложность* Н методы оценки /

(0ВШ0) * « ? ? - -> аботка }

(080000 АКК тревожная сигнализациях Н обнаружениеПРИСУТСТВИЯХ )&атчики

(ЙМ11В) ***??-*> Ндатчики ?

(ввОООИ АКК автоматическая защитах К ' днсплеиХ Н переметающаяся „мыиш’ Х Я вторжение (081110) **•??— > мышь 9

Р и с .2 . Образец автоматизированной корректуры поисковых образов документов (корректурными зна­ками показаны правки корректоров).8. Заключение. Расчет достоверности.информации для блока

машинной корректуры АИС "Ассистент" показал, что при установ­ленных ограничениях и комбинаторном методе контроля можно осу­ществлять автоматизированную корректуру обрабатываемых в сис­теме текстов с приемлемым качеством обработки. Эксперименталь­ная проверка наиболее важного для указанного блока словарного метода контроля подтвердила сделанный вывод.

Комбинаторный метод корректуры показал перспективность сво­его применения на практике, в частности для текстов, сегменти­рованных на поля. По-видшому, комбинаторный метод в модифици­рованном виде может быть применен для обработки и связных тек­стов, не сегментированных на поля. Для этого потребуется пред­варительно определить важность различных элементов текста (на­пример, знаков препинания, синтаксических связей и т.д.) для потребителей (читателей) информации.

(66000!) АКК измерительные преобразозателиХ Н рг аковкзХН восстановление сиги»лоз

223

О Г Л А В Л Е Н И Е

М а т е м а т и ч е с к а я и прикладная лингвистикав С.-Петербургском университете ................................. ^

Б о г д а н о в В.В. Деятельность в вербальном общении(С.Петербургский у н -т ) ..................................................... 14

Т е л е г и н а Г .В . Семантика и прагматика модусныхпредикатов: мнения и проблемы (Тюменский у н -т) . . . 22

Д и к а р е в а С.С. Инициатива в диалоге (Симферополь­ский у н -т ) .............................................. 30

З у б к о в а Т.И. О роли предлогов 6 предложении (На материале исследований детской речи и нарушений ре­чи при афазии ) (С.-Петербургский у н -т ) ................... 39

Т а б а н а к о в а В.Д. Прагматический аспект логиче­ского анализа текста словарного определения (Тюмен­ский у н -т) . . . . .......... ......................................................... 45

Л у б и н и н а Т.А. Семантическая структура предложе­ний с инфинитивом в функции подлежащего (на' мате­риале английского языка) (С.-Петербургский у н - т ) . . 50

К л и м о н о в В.Л. О ноизоморфизме маркированности всклонении русских существительных (АН Германии)... 59

А л е к с е е в П.М. О некоторых квантитативно-лингви­стических оппозициях (Рос. пед, у н -т) ....................... 66

Г е р д А,С. К вопросу о роли низкочастотных фактов влингвистическом исследовании (С.-Петербургский ун-т) 75

М а н а с я н Н.С. О двух статистических способах раз­личения типов текста (Ереванский политех.. ин-т) . . 98

Б у т о р о в В.Л. , Ш е р е м е т ь е в а С.О. Ча­стотные характеристики семантико-синтаксических признаков предикатной лексики в текстах формулы изобрете пя (С.-Петербургский у н -т )................................ ЮЗ

Р у с к о а а М.П. Статистические параметры имен суще­ствительных мужского рода множественного числа в болгарском языке ХУШ в. (С.-Петербургский у н -т) . . 134

22А

м а р у с е н к о М.А. Алгоритмизация проверки литера­турно-критической атрибуционной гипотезы (С.-Петер­бургский ун-т) .................................. . . .................................... 1*5

Г а й ш т у т К.М. Особенности номинаций и семантичес­кого развития в терминосистеме наименований видов деловых текстов (Тверской ун-т) ....................................... 160

Г р и н б а у м О.Н., М а р т , ы н е н к о Г.Я. Струк­туризация текста в компьютерной системе "ЛИНДА" (С.- Петербургский у н - т ) ......... . ..................................................... 171

О т к у п щ и к о в а М.И., К р е м н е в а Н.Д.,К и р и ч е н к о Н.Л., З а м б р ж и ц к и й В Х Функционально-семантическая информация в словарных процедурах для анализа текстов узкой предметной об­ласти (С.-Петербургский ун-т) ............................................ 181

В о I с к у н с к и й В. Г ., З а х а р о в В.П. Диало­говый отладочный комплекс (С.-Петербургский центр научно-техн. информации) ......................... 197

П а р т ы к о З.В. Комбинаторный метод автоматизациипроцессов корректуры (Львовский полиграф, ин-т) . . . 211

C O N T E N T

M a t h e m a t l c a l linguistics at S.-PetersburgUniversity.... ............................. 3

B o g d a n o v V.V. Activities in verbal communicati­on (S.-Petersburg Univ.) ................ ........ 14

T e l e g i n a G.V. Semantics and pragmatics of moduspredicates 1 opinions and problems (Tyumen Univ.) 22

D i k a r e v a S.S. Initiative in dialogue (Simfero­pol Univ.) ........................... ........... 30

Z u b k o v a T.I. On the role of prepositions in asentence (S.-Petersburg Univ.) ................. 39

T a b a n a k o v a V.D. A pragmatic aspect of the lo­gical analysis of a dictionary definition (Tyumen Univ.) ........................................ 43

D u b i n i n s T.A. The semantic structure of senten­ces containing an infinitive subject (in English sentences) (S.-Petersburg Univ.) ................. 50

K l i m o n o v V.D. On non-isomorphism of markednessin Russian noun declension (Academy of science. Germany) ............ •.......................... 51,

A l e k s e y e v P.M. On some quantitative linguisticoppositions (Ped. Univ.) ......................... 66

H e a r d A.S. On the problem of the role of low frequen­cy facts in linguistic investigations (S.-Peters­burg Univ.) ................................ 75

M a n a s y a n N.S. On two statistic ways of text typedifferentiation (Yerevan Polytechnical Institute) 98

B u t 0 r o v V.D., S h e r e m e t e v a S.O. Fre­quency characteristics of semantico-syntactic fea­tures of predicate words in invention formula texts (S.-Petersburg Univ.) .......... ................. 103

K u s k o v a M.P. Statistic parameters of masculinenouns in the plural in the Bulgarian language of the XVIII century (S.-Petersburg Univ.) ......... 134

226

M a r u s e n k o M.A. Compiling algorithms for check- . ing literary c r itic attribution hypothesis (S.-Pe­ters burg Univ.) ............ .................................... 145

G a i s h t u t K.M. Some characteristic features of nomination and semantic development in the term system of business text names (Tver. Univ.) . . . . . . 160

G r i n b a u m O.N., M a r t y n e n k o G.Ya. Struc- turalysation of text in a computer system "LINDA”(S. -Peters burg Univ.) ............ ................................ 171

O t k u p s h c h i k o v a M.I., K r e m n e v a N.D.K i r i c h e n k o N.L., Z a m b r z h i t s - k y V.L. Functional semantic information in dic­tionary procedures for narrow subject fie ld text analysis (S.-Petersburg Univ.) ................. ............ 181

V o y s k u n s k i V.G.; Z a k h a r o v V.P. Inter­active debugging complex (S.-Petersburg Centre of Sci.-Tech. In f.) .......... . 197

P a r t y k o Z.V. Combinatorial method of proof-read­ing automation (Lvov Bolygr. Inst.) ...................... 211