意味フレームの実在性 (黒田・中本・野沢) 1 - 認知言語学系研究室

意味フレームの実在性 (黒田・中本・野沢)
状況理解の単位としての意味フレームの
実在性に関する研究
1
(F10) 疫病の流行
(F11) 活動への打撃の発生
(F12) 発病
黒田 航 (通信総合研究所)
[email protected]
2.2 事例の意味タグづけとデータベース化
中本敬子 (京都大学教育学部)
参考までに意味タグづけの一例を挙げる.「中世ヨー
[email protected]
[email protected]てい
野沢 元 (京都大学大学院)
る訳ではない。」という事例は,次のような符号化か
[email protected]
ら<疫病の流行>フレーム (F11) と同定した.
LC
[中世ヨーロッパ, 意味役割:被害者, 意味ク
ラス:地域[+時間への言及あり]]を
1.
研究の目的
FrameNet (Baker, Fillmore and Lowe 1998) で提唱される
T
[襲った, [voice: active]]
RC
[ペスト, 意味役割:襲い手, 意味クラス:疫病]
意味フレーム semantic frames を「ヒトが理解可能な
のような伝染病が大流行している訳ではな
状況を定義する認知的構造体」として解釈し,この操
い.
作概念の有効性を検証する研究を行った.
Frame L1: 疫病の流行
Frame L2: 打撃[-human,-animate,-intentional,-concrete]
Frame L3: 自然災害の発生
2.
分析手法
作業手順は以下の通り,(i) コーパスからの事例の収
LC, T, RC は,それぞれ先行文脈 (Left Context),標的
集と,そのデータベース化,(ii) そのデータベースに
(Target),後行文脈 (Right Context) のことである.な
基づく人手解析,(iii) 二つの心理実験結果の多変量解
お,文脈は一文内に限っている.フレームのレベルは
析と,その人手解析の比較である.
L1-3 の三段階あり,L1 が最下位で,もっとも特定的
である.L1 が F1-F12 までの12個ある.L2 のフレー
2.1 コーパスからの事例の収集
ムは一般性が表現されるように [+/–human, +/–animate,
日英対訳コーパス (内山・井佐原 2003) から<襲う>の
...] によって素性表現されている.L3 は最大規模のグ
用例 {襲う, 襲い, 襲って, ...} をすべて収集し,用例の
ループの名称である.
一つ一つに FrameNet の定める方法に準拠して意味タ
グづけした.この際,用例が比喩的であるか否かの区
2.3 心理実験結果
別は,意図的に行わなかった.最終的に 416 例のタグ
次に,この人手分析の妥当性を心理実験 (カード分類
づけから12個の最下位意味フレームが同定された.得
課題と意味素性評定課題) の結果を比較し,確かめ
られた意味フレームの内訳は以下の通りである:
た.両実験で共通に合計36個の刺激文 (1フレームにつ
き3例) を使用した.素性評定課題は,被験者は次の15
(F01) グループ間抗争/紛争
(F02) 軍事侵略
(F03) 強盗
項目の素性に関する判断を 1 [まったくそう思わな
い]--5 [強くそう思う] の五段階のスケールで評定する
よう依頼した:
(F04) 虐待
(F05) 強姦
(1) 襲い手は生物である
(F06) 動物の他個への攻撃(捕食系)
(2) 襲い手は止むを得ず襲いかかった
(F07) 動物の他個体への攻撃(非捕食系)
(3) 被害は直接感じられる
(F08) (地震などの)大規模な異常気象
(4) 襲う相手はあらかじめ決まっていた
(F09) (高波などの)小規模な異常気象
(5) 襲い手は気象現象である
意味フレームの実在性 (黒田・中本・野沢)
2
(6) 襲い手は道具を使って被害を与える
F10c: エイズがアフリカの国々を襲った
(7) 襲い手の存在は感じ取れる
F11a: 大型の不況がその国を襲った
(8) 被害の規模は個人/個体を越える
F11b: 株価の暴落が市場を襲った
(9) 襲い手には生命感がある
F11c: 狂牛病問題が畜産業界を襲った
(10) 襲い手は集団をなしている
F12a: 言いようのない不安が彼を襲った
(11) 被害の受け手は死ぬこともある
F12b: 悪性のガンが働き盛りの彼を襲った
(12) 襲い手は目に見える
F12c: 突然の痙攣が少女の全身を襲った
(13) 被害は意図されたものである
(14) 襲い手は人間である
ただし,F[i][j] では [i] は最下位フレームIDを,[j] は
(15) 襲い手はあらかじめ襲う準備をしていた
刺激セットを表わす指標である.
評定のために被験者に提示した例文は,以下のような
次に第一段階の人手解析と行動指標データの多変量解
ものである.
析の結果がどれほど一致するかどうかを検討した.ク
ラスター分析,非計量多次元尺度法 (MDS),主成分分
F01a: 二人組の強盗がその銀行を襲った
析 (PCA) のいずれの多変量解析の方法でも,最下位
F01b: 外国人のグループが現金輸送車を襲った
フレームの分離に関して概ね同じ結果が得られてい
F01c: 覆面を被った男が銀座の宝石店を襲った
る.
F02a: 政治的に孤立した国が隣国を襲った
F02b: ドイツの戦車部隊がパリを襲った
F02c: テロリストの集団がアメリカ軍基地を襲った
F03a: 二人の組員が敵対する組長を襲った
F03b: 暴徒と化した民衆が警察隊を襲った
F03c: 森の西側の部族が北側の部族を襲った
F04a: 通り魔がその小学生を襲った
F04b: 5, 6人の少年たちが公園にいた浮浪者を襲った
4.
結論
以上のことから次のことが強く示唆される.(1) 意味
フレームは心理的に実在し,(2) その同定の目的のた
めに意味素性評定課題は有効な手法である.特に,ク
ラスター分類の下位構造は上位構造よりも安定してお
り,カード分類の課題依存性を考えると,意味素性評
定課題の結果の課題中立性は.意味フレームの同定と
F04c: 23歳の男性が通行人を次々と襲った
いう目的には好ましいと考えられる.また,多変量解
F05a: ストーカーがその女性を襲った
析の結果とコーパスに基づく人手解析と一致が高いこ
F05b: 無職の男が一人暮らしの若いOLを襲った
とから,(3) 意味フレームは,コーパスなどの言語
F05c: 店長がアルバイトの女子店員を襲った
データの人手分析からも同定可能であり,FrameNet
F06a: サメが傷ついたイルカを襲った
は到達可能なゴールを目指している.(4) 以上のこと
F06b: ライオンがインパラの群れを襲った
から,FrameNet の成果は今後,言語学のみならず,
F06c: ハイエナの群れが国立公園の監視員を襲った
状況理解の単位の体系的・網羅的記述という作業を通
F07a: スズメバチの大群が子供たちを襲った
じて,認知科学全体へ重要な研究資源を提供する可能
F07b: イノシシがキノコ狩りに来ていた男性を襲った
性が大きいことが示唆される.
F07c: 毒蛇が近づいてきた登山客を襲った
F08a: 大洪水が東海地方を襲った
F08b: 大型台風が日本列島を襲った
参照文献
F08c: 直下型地震が神戸の町を襲った
Baker, Collin F., Charles J. Fillmore, and John B. Lowe.
1998. The Berkeley FrameNet project. In Proceedings of
the ACL/COLING-1998, Montreal, Canada.
F09a: 突風がテレビのリポーターを襲った
F09b: 土砂崩れが民家を襲った
F09c: 鉄砲水が避難する住民を襲った
内山将夫・井佐原均. 2003. 日英新聞記事および文を対
F10a: 悪性のインフルエンザがわが国を襲った
応付けるための高信頼性尺度. 自然言語処理, 10 (4):
F10b: ペストがその町を襲った
201--220.