発話の「短い単位」を構成する動機付け: 情報構造の観点から

発話の「短い単位」を構成する動機付け: 情報構造の観点からInformation Structural Motivations for Short Utterance-Units

中川奈津子†‡

Natsuko NAKAGAWA†京都大学大学院人間・環境学研究科

Graduage School of Human and Environmental Studies, Kyoto University‡ニューヨーク州立大学バッファロー校言語学科

Department of Linguistics, State University of New York at Buffalo

AbstractThis paper investigates informational structural motivations for short utterance-units (SUU), which are iden-tified based on syntactic, prosodic, and pragmatic cues. We argue that units of information structure are oneof the main motivations for SUUs. More specifically, we show that there is an accent-phrase boundary (andpotential intonational boundary) between the topic NP and the focus predicate, while there is no boundarybetween the focus NP and the focus predicate. Finally we discuss information structural motivations for thisboundary from typological, discourse, and cognitive perspectives.

1 はじめに

本研究*1では、自然会話に観察される韻律的単位 ([1, 9])を構成する動機付けについて、情報構造の観点から考察

し、情報構造の単位が「短い単位」の主要な動機付けの

1つであると主張する。具体的には、トピック名詞句とフォーカス述部の間に

はアクセント句の境界が存在し、これが潜在的にイント

ネーション句の境界となり得ること、名詞句と述語が共

にフォーカスになっているときにはアクセント句の境界

がないことを音声産出実験によって確かめる (§3)。表 1は、文が 3モーラの名詞句と 2モーラの述語で構成される場合の韻律の予測を表したものである。角括弧は情報

構造の単位を表し、下付きの T と F はそれぞれトピック、フォーカスを表す。表 1 において*で示したトピック名詞句の直後の箇所には、ポーズ、語用論的マーカー

(e.g., 「ね」「さ」)、名詞の最後の母音の伸長など、「短い単位」の境界となりうる要素が現れうるが、名詞句と

述語が全体でフォーカスをなしている場合には、このよ

うな要素は現れえないことを示す。最後に、トピック名

詞句がそれ自体で「短い単位」となる動機付けを、議論

する (§4)。まず、トピック名詞句をそれだけで構成する

「短い単位」で発話することには、節連鎖上で有用な方

策であることを主張する。また、他の多くの言語におい

ても同様の機能と韻律的特徴を持った構文が存在するこ

とを見る。

まず次節において、本研究の背景について論じる。

2 背景

自然会話において韻律に基づき観察される単位に関する

初期の研究に [1] がある。[1] は、この韻律に基づく単位をイントネーション・ユニット (IU) と名付け、IUが何らかの認知的処理に対応する単位であるという立場に

立っていた。例えば、[1] は、1 つの IU につき 1 つまでしか新情報を入れることができないという仮説 (OneNew Idea Constraint Hypothesis) を提案した。しかし、この枠組みの問題点として、(i) IUの決め方がタグ付けを行う人によって揺れがあること ([6])、(ii) OneNew Idea Constraint Hypothesisの例外が多くあること、そもそも何を 1つの新情報とするかを決めるのが困難なこと ([5, 7]) などが指摘されて来た。

2.1 「短い単位」の認定

(i) の問題点の解決策として、[8] では、揺れのない明確な手続きによって認定する基準が提案されている。まず

*1 著者連絡先: [email protected]資料のダウンロードなど: http://www.acsu.buffalo.edu/~natsukon/

名詞述語

1 2 3 4 5[L H H H H]F[L H H]T * [L H]F

表 1 情報構造の単位に基づく韻律のスキーマ

モーラ F-value p-value

1 − 2 3.4387 0.067 .2 − 3 2.513 0.116 n.s.3 − 4 3.537 0.063 .4 − 5 6.978 0.009 **

表 2 情報構造による F0 の値の変化の違い

「長い単位」を認定し、長い単位を分割する形で音響的・

韻律的な切れ目に「短い単位」を認定する。具体的な手

順は以下である ([8], p. 15 ff.)。まず、0.1秒以上の休止が後続する箇所を音響的境界とする。それ以外の韻律的

な切れ目を以下のように決める。

1. 声の高さが上がって下がるまでを 1つとする単位に区切る。

2. それぞれの単位ごとに、声の一番高い部分と低い部分を同定し、ピッチレンジを算出する。

3. 隣接する単位のピッチレンジを比較して、後続単位のピッチレンジの方が大きい場合、そこに韻律的境

界があるとみなす。

2.2 情報構造とイントネーション

[5, 7] では、情報構造の単位が IUあるいは「短い単位」に相当しているという仮定のもと、問題点 (ii) を解決するための提案がいくつか行われた。

具体的な議論に入る前に、本研究が想定している情

報構造の基本概念を以下に示す。ここではトピックと

フォーカスという用語を特に用いる ([4] を特に参照)。トピックとは、会話の参与者が今それについて話してい

るところのものである。それに対してフォーカスとは、

トピックに関して付け加えられる情報である。今までト

ピック・マーカーとされてきたハ、ッテ、タラ、ケド、そ

れと入れ替え可能なゼロ助詞によって標示される名詞句

がトピックに相当し、格助詞と言われてきたガ、ヲ、あ

るいはそれと入れ替え可能なゼロ助詞によって標示され

る名詞句がフォーカスに相当すると想定している。*2 例

えば、(1) のように、「どうしたの？」の質問の答えとなるような文は、文全体がフォーカスであると考えられて

いる。そのような場合は、(1-A, A′) に見られるように、名詞句がトピック・マーカーであるハによって標示され

ると不自然な文となり、格助詞によって標示されると適

格な文となる。

(1) Q: どうしたの？A: [財布 {??は/が/Øf}落ちた]FA′: [花子ちゃん {??は/が } 本 {??は/を/Øf}

読んでる]F

一方、(2) のように、名詞句がすでに話題にのぼっていて、参与者がそれについて話している場合、名詞句はハ

で標示されるときに適格となり、格助詞で標示されると

きには不自然な文となる。

(2) Q: 財布どうなったの？A: [財布 {は/??が/Øt}]T [落ちたよ]FQ: 本どうなったの？A: [本 { は/??を/Øt}]T [花子ちゃん {??は/が

}読んでるよ]F

ここで、トピック・マーカーで標示された名詞句を T、格助詞で標示された名詞句を A、述語を Pとして、「短い単位」がどのような要素で構成されているかを表した

のが図 1である。wPはそれぞれ T、Aが述語 (P) と同じ「短い単位」に現れた割合、w/oPは述語とは別の「短い単位」に現れた割合を示している。図からわかるとお

り、トピック名詞句はフォーカス名詞句よりも述語と同

じ「短い単位」に現れることが少ない (chi-square test,p < .001)。[5, 7] では、特にそれ自体で独立した「短い単位」を構成するトピック名詞句に注目に注目し、その

ような名詞句は談話トピックの導入・あるいは再導入を

行っていると結論づけた。しかし、日本語では格助詞に

よって間接的にしかフォーカスを同定できないこと、ま

たゼロ助詞が出現した場合はタグ付けをする作業者が直

感に基づいてトピック・マーカーか格助詞のどちらと入

れ替え可能かを判断していたが実際はどちらも不自然な

例がかなり見られることなど、コーパスのみに基づく研

究の限界がわかった。

本研究では、文脈を完全にコントロールした条件下で

*2 述語もデフォルトではフォーカスであると考えられるが、述語のステータスはここでは問題にしない。なお、ゼロ助詞に関する詳しい議論はNakagawa and Sato (in preparation) で行う予定である。ドラフトは以下の URLから入手可能:http://www.acsu.buffalo.edu/~natsukon/paper/nakagawa110629 sui3 ZeroParticle.pdf

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

T A

wP

w/oP

図 1 Tと Aが述語と同じ「短い単位」に現れる割合

同一の文を、被験者に発話してもらい、名詞句がトピッ

クのときとフォーカスのときに韻律がどのように異なる

かを調べることでこの不足点を補った。

3 実験

3.1 方法

実験手順は以下である。

1. unidic からアクセント核がない 3 モーラの名詞(LHH) を集める (n=10)

2. 名詞とよく共起する動詞 (LH から始まる) を格フレーム辞書で検索する

3. 名詞が主語・目的語になる名詞-動詞のペアをそれぞれ作る (10x2=20)

4. それぞれの名詞がトピック読みとフォーカス読みで自然になるような文脈を作る (20x2=40)

5. 関東地方出身の大学院生・ポスドク 4名に文を発話してもらい、録音する (使用機器: Edirol R-09HR,MacBook Air)

6. Praatによって F0 を抽出する

刺激文の例は以下のようなものである。フォーカス読

みの名詞句 (3) では格助詞によって標示される文が適格

となり、トピック読みの名詞句 (4) ではハによって標示される文が適格となる。完全なミニマルペアにするため

に助詞は刺激文には入っていない。

(3) フォーカス読み: A と B は捨てられた動物を保護するボランティアをしている。保護した動物

はなるべく新しい飼い主を見つけて引きとって

もらうことになっている。B は昨日休みだったので、昨日の様子を聞こうとする。

B: 昨日どうだった？

A: [子犬 {??は/を/Øf}ゆずったよ]F

(4) トピック読み: A と B は昨日子犬が捨てられているのを見つけて、A が預かって拾って持って帰った。今日も Aは Bに会ったので、そのことを報告しようとした。

A: [子犬{は/??を/Øt}]T [ゆずったよ]FB: あ、そうなんだ。それならよかった。

(3), (4) に典型的に見られるように、フォーカス読みの文脈では話し手が何をしたかが問題になっているのに対

し、トピック読みの文脈では以前にその名詞句の指示対

象についての体験を参与者どうしで共有しており、それ

を思い出してもう１度話題にする、という設定になって

いる。

産出された文には、Praatで (5)のように番号を振り、スクリプトによってそれぞれの母音の中央の F0 の値を

取り出した。1から 3までは名詞句、4と 5は述語の最初の 2モーラを表す。

(5)1 2 3 4 5 –こいぬゆずったよ

3.2 結果

図 2 - 5は、フォーカス読み、トピック読みのそれぞれの文の F0 の平均を被験者ごとにプロットしたものである。

これらに関して、隣り合うモーラどうしの F0 の変化

の幅を求め、その幅がフォーカス読み、トピック読みに

よって差があるかどうかを調べた。具体的には、隣り

合うモーラの F0 の値の差を計算し、情報構造を主効果

(main effect) として ANOVA を用いて検定を行った。本来、被験者と刺激文を変量効果 (random effect) として検定に入れるべきであるが、数が十分にないので今回

は入れなかった。結果を表 2に示す。表 2 にあるとおり、1 番目から 2 番目へと、3 番目から 4番目のモーラへの F0 の変化は情報構造によって

120

140

160

180

200

v_label

pitch_value

T

TT

T

T

1 2 3 4 5

n=12 n=14 n=14 n=14 n=14

120

140

160

180

200

v_label

pitch_value

F

F

F

F F

1 2 3 4 5

図 2 被験者 1120

140

160

180

200

v_label

pitch_value

F

F FF

F

1 2 3 4 5

120

140

160

180

200

v_label

pitch_value

T

T TT

T

1 2 3 4 5

n=12 n=14 n=14 n=14 n=14

図 3 被験者 2

150

200

250

300

350

v_label

pitch_value

T TT

T

T

1 2 3 4 5

n=11 n=14 n=14 n=14 n=14150

200

250

300

350

v_label

pitch_value

FF

F F

F

1 2 3 4 5

図 4 被験者 3

150

200

250

300

350

v_label

pitch_value

F

F

F F

F

1 2 3 4 5

150

200

250

300

350

v_label

pitch_value

T

T

T T

T

1 2 3 4 5

n=12 n=14 n=14 n=14 n=14

図 5 被験者 4

Foc Top

-60

-40

-20

020

Context

F0 d

iffer

ence

bet

wee

n 3

and

4

図 6 3番目から 4番目のモーラへの F0 の変化

Foc Top

050

100

Context

F0 d

iffer

ence

bet

wee

n 4

and

5

図 7 ４番目から５番目のモーラへの F0 の変化

marginal に有意な差があることがわかった。一方、3番目から 4番目のモーラのへの F0 の変化は情報構造に

よって有意な差がない。また、4番目から 5番目のモーラへの F0 の変化は情報構造によって有意な差があるこ

とがわかった。すなわち、動詞の始めの 2 モーラの F0

の変化は、フォーカス読みにおけるよりも、トピック読

みにおける文の方が大きい。また、フォーカス読みにお

ける 3番目から 4番目のモーラへの F0の変化は、図 2, 3などを見ると下降しているように見えるが、全体的に有

意ではない (one sample t-test, t = −1.460, p = 0.150,図 6 も参照)。つまり、フォーカス読みにおいては名詞と動詞は 1つのアクセント句をなしているが、トピック読みにおいては名詞と動詞は異なるアクセント句を構成

すると言える。

また、このアクセント句の境界はイントネーション句

の境界になりやすい。例文 (3) と (4) を比較すると、語用論的マーカーである「ね」や「さ」はトピック名詞句

の後に来る場合は自然であるが、フォーカス名詞句の後

に来ると不自然である。(6)と (7)にこれを示す (文脈は割愛した)。

(6) フォーカス読み

B: 昨日どうだった？

A:??[子犬 {ね:/さ:}ゆずったよ]F

(7) トピック読み

A: [子犬]T {ね:/さ:}[ゆずったよ]FB: あ、そうなんだ。それならよかった。

より微妙な判断になるが、ポーズや母音伸長も同様に、

トピック名詞句の後では自然だが、フォーカス名詞句

の後では不自然である。語用論的マーカー、ポーズ、母

音伸長などは、韻律的な境界になりやすい。よって、ト

ピック名詞句の直後の方が、韻律的な境界となりやすい

と言える。

4 考察

トピックとフォーカスの間に韻律的な境界があることの

動機付けを、節連鎖と類型論の観点から議論する。

(8) は節連鎖の発話の例で、1行が 1つの「短い単位」

に対応している。節連鎖とは、(8) の二重下線部に見られるように、述語がいわゆる文末形をとらずに延々と節

が続く現象である。このようなときに、それだけで「短

い単位」を構成するトピック名詞句 (ここでは (8-b)) が現れやすい。この理由の 1つとして、この種のトピック

名詞句はかかり先が長いことが考えられる。(8) では、「うちの親」は dで「言いながら」の主語になった後、gで「入れるそばから」、i-jで「食べてるからさ」の主語にもなっている。また、これを引き継いで、mにおける別の話者 Aの発話「食べてんだ」の主語にもなっている。

(8) a. C: なんかね:b. C: うちの親 i

c. C: なかなかこれd. C: 醗酵しないわよ:とかØi言いながらさ:e. A: うんf. C: なんかg. C: Øi入れるそばからさ:またなんかh. C: 三時間後ぐらいとかにi. C: Øi食べてる

j. C: からさk. [...]l. A: じゃm. A: 醗酵し足りないままØi 食べてんだ

(Chiba 0932)

最後に、それだけで「短い単位」に現れるトピック名

詞句と、他の多くの言語に見られる主題化構文 (topical-ization construction, 特に [2] を参照) の共通性について述べる。[2] などが指摘するように、主題化構文は多くの言語に見られる。その特徴をまとめると、(9) のようになる。

(9) a. トピック名詞句が他の項に先行する

b. トピック名詞句はそれ自体で 1 つの一貫したイントネーション曲線を構成し、典型的

にはポーズがその後に後続する

c. 主題化構文はトピックを再導入する

d. 再導入されたトピックは後続談話において

重要なトピックである

(10)は英語、(11)はミナ語 (Volta-Niger, Niger-Congo)

の主題化構文である。(10) では韻律的境界はコンマで示されており、[3] によれば his carはそれ自体で一貫したイントネーション曲線を構成する。

(10) (Six year old girl, explaining why theAfrican elephant has bigger ears than theAsian elephant)The African elephant, it’s so hot there, sohe can fan himself. ([4], p. 193)

(11) のミナ語におけるトピック名詞句の ‘cat’ および‘snake’ も同様である。

(11) Edan

snakeo

3pl.sbj

dhu

bitena

habit

mE=a

people=q.polar

asEn=vı

cat=dimin

o

3pl.sbj

da

screamna

habit

apa=a

scream=q.polar

‘Will snakes bite people? Will cats meow?’(Mina: Elicited data)

このような現象が一般的に見られる理由として、[4]の提案する指示と役割の分離原則が働いていることが

あげられるかもしれない。具体的には述べられていない

が、指示対象を導入する発話と、その指示対象について

叙述する発話は別であるという原則である。主題化構文

についてこれを考えてみると、重要なトピックを再導入

する韻律的単位と、そのトピックについての内容を述べ

る単位が分かれていて、この原則がうまく当てはまるよ

うに見える。

5 まとめ

本研究では、韻律的単位の主要な動機付けの 1 つとして、情報構造の単位を提案した。これには節連鎖状の動

機付けがあるほか、類型論的に同様の現象が見られるこ

とについても指摘した。

謝辞

協力してくださった被験者の方に感謝します。また刺激

文の作成、データの解釈などに関して淺尾仁彦氏のコメ

ントが参考になりました。記してここに感謝します。

本研究は科研費補助金基盤研究 (B) 「発話単位アノテーションに基づく対話の認知・伝達融合モデルの構

築」からの助成を受けています。

参考文献

[1] Wallace Chafe. Discourse, Consciousness,and Time. Chicago University Press,Chicago/London, 1994.

[2] Talmy Givon, editor. Topic Continuityin Discourse. John Benjamins, Amster-dam/Philadelphia, 1983.

[3] Elinor. O. Keenan and Bambi Schieffelin. Fore-grounding referents: a reconsideration of leftdislocation in discourse. BLS, Vol. 2, pp. 240–257, 1976.

[4] Knud Lambrecht. Information Structure and Sen-tence Form: Topic, Focus and the Mental Represen-tations of Discourse Referents. Cambridge Univer-sity Press, Cambridge, 1994.

[5] Natsuko Nakagawa, Daisuke Yokomori, andYoshihiko Asao. Short intonation units as a ve-hicle of important topics. Papers in Linguistic Sci-ence, Vol. 15, pp. 111–131, 2010.

[6] 榎本美香, 石崎雅人, 小磯花絵, 伝康晴, 水上悦雄, 矢野博之. 相互行為分析のための単位に関する検討. 人工知能学会研究会資料, pp. 45–50. 人工知能学会研究会, 2004.

[7] 中川奈津子, 横森大輔. 発話の「短い単位」と情報構造の関係の予備的分析. 人工知能学会研究会資料,pp. 19–24. 人工知能学会研究会, 2010.

[8] 伝康晴, 丸山岳彦, 小磯花絵. 「長い単位」「短い単位」ラベリングマニュアル version 1.3b1. TheJapanese Discourse Research Initiative, 2011.

[9] 伝康晴, 小磯花絵, 丸山岳彦, 前川喜久雄, 高梨克也,榎本美香, 吉田奈央. 対話研究にふさわしい発話単位の提案とその評価 (1) ～短い単位～. 人工知能学会研究会資料, pp. 75–80. 人工知能学会研究会, 2009.

List of Abbreviations

Abbreviations used in this paper are listed below:

3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . third persondimin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . diminutivehabit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . habitual

pl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . pluralq.polar . . . . . . . . . . . . . . . . . . . . . . . . . . polar questionsbj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . subject

発話の「短い単位」を構成する動機付け: 情報構造の観点から

Documents

Transcript of 発話の「短い単位」を構成する動機付け: 情報構造の観点から