セマンティック・ウェブ上の語彙構築機構 - 大阪大学産業科学研究所

人工知能学会研究会資料
SIG-SWO-A802-06
セマンティック・ウェブ上の語彙構築機構
A vocabulary building mechanism over the Semantic Web
浅野
優1
田中
譲1
Yu Asano1, Yuzuru Tanaka1
1
1
北海道大学大学院情報科学研究科
知識メディア研究室
Meme Media Laboratory, Graduate School of Information Science and Technology, Hokkaido University
概要: 本論文ではセマンティック・ウェブ上に語彙を導入することの重要性について述べ,語彙
を構築するための機構を提案し,語彙構築例を示す.提案する機構は,語彙のベースとなる基本
語彙の要素を定義する仕組み,提案言語を用いて基本語彙を基に語彙を構築する仕組み,構築し
た語彙を用いて問合せを行う仕組み,語彙での問合せの記述をセマンティック・ウェブの問合せ
の記述に書き換える仕組みの 4 つから成る.また,語彙の要素である語には名辞とそれを修飾す
る形容辞の 2 つの品詞を与え,名辞と形容辞の組合せには論理演算子を語構成子として導入する
ことで,構築した語彙と語構成子の組合せにより複雑な概念を表現することが可能となる.
1. はじめに
本論文では,(1)セマンティック・ウェブ上への語
彙の導入の重要性,(2)語彙構築機能,(3)セマンティ
ック・ウェブ上へ語彙を導入するための機構, (4)語彙
構築例について述べる.
近年,ウェブリソースは文書や画像,音楽,動画に
とどまらず,ネットワークで繋がれたモバイル機器や
電化製品,環境の中に埋め込まれたコンピュータやセ
ンサーなども対象にする動きがある.今後も,この動
きが加速し,様々なものがウェブを介してアクセス可
能になり,今以上に多くのリソースがウェブ上に存在
することが予想される.そこで,それらの膨大なウェ
ブリソースを効率的に利用するための方法として,ウ
ェブリソースの意味内容情報をコンピュータに処理
させるセマンティック・ウェブがある.その研究は現
在も盛んに行われており,中心的な団体 World Wide
Web Consortium(W3C)による標準化も進められている.
その標準には,ウェブリソースの意味内容情報の記述
の た め の 構 文 で あ る Resource Definition
Framework(RDF)[3],RDF の記述に用いられる語彙を
定義するための RDF-Schema[4],OWL web ontology
language[5]と Semantic Web Rule Language[6],要求
1
連絡先:北海道大学大学院情報科学研究科知識メディア研究室
〒060-8628 北海道札幌市北区北 13 条西8丁目
E-mail:{asano, [email protected]
言 語 SPARQL Protocol and RDF Query Language
(SPARQL)[7]などがある.他にも,RDF によるウェブ
リソース間の関係記述のための語彙 Dublin Core[10]
や人と人の関係記述のための記述語彙 FOAF[11]など
詳細なリソースの意味内容情報の記述のための語彙
が定義されている.このセマンティック・ウェブ技術
が有用されている例には,Rich Site Summary(RSS)[8]
を用いたニュースサイトやウェブログがあり,タイト
ルや更新日時,URL,要約などの内容情報をメタデー
タとして付加することにより内容情報による検索を
可能にし,更新日時が新しい記事や興味のあるキーワ
ードが含まれる記事の自動収集ができる.このような
セマンティック・ウェブ技術の利用により,ユーザの
目的情報を人手なしに機械が自動的に収集可能にな
る.しかし,W3C が提案する技術では,プログラミ
ングに関する知識のない一般ユーザが自身の語彙を
定義し,標準の検索要求言語によりリソースアクセス
するのは困難である.その原因は,セマンティック・
ウェブリソースにアクセスするためのユーザフレン
ドリーなインターフェースが存在しないことにある.
上記の問題点に対して,本研究では,ある特定ドメ
インの一般的なユーザがセマンティック・ウェブ上の
リソースにアクセスするためのユーザフレンドリー
なインターフェースを提供することを目的とする.そ
の手段として,セマンティック・ウェブ上において語
彙の定義,問合せが可能な,セマンティック・ウェブ
06-01
の標準より高次の言語を提案する.目指す言語は次の
3 つの特徴を持つ.
(a) 語彙構築機能
(b) 語に品詞の概念を導入
(c) 自然言語表現に現れる曖昧性のない表現
自然言語の持つ特徴的な機能には柔軟な構文と豊富
な語彙の 2 つがあり,提案言語には,語彙の導入を行
う.語彙は,語の集合であり,次の 3 つの語彙構築機
能を持つ.
①対象や制約の概念を語で表す機能
②語の組合せで複雑な対象や制約の概念を表す機能
③語の組合せに対してラベルを与え,このラベルを新
たに語として用いることを許す機能
この語彙構築機能により,我々は使い勝手の良い語を
辞書的に定義することで語彙を構築し,高度なコミュ
ニケーションを行っている.例えば,「親の母親」に
「祖母」というラベルを与え,そのラベルの定義の説
明なしに語を使用できる.このように自然言語におけ
る語彙は豊富にすることができ,その語彙中から適切
な語を組み合わせた短い表現により様々なことを表
現することができる.また,語彙の要素となる語には
品詞の概念を導入する.例えば,「青いりんご」は形
容詞「青い」と名詞「りんご」の並置であり,形容詞
を用いて名詞を制約している.この品詞の導入により,
自然言語に近い形で制約を与えることができる.以上
の特徴を導入した言語により,プログラミングに関す
る知識のないユーザによる使用も期待できる.これま
での研究における計算機上への語彙の導入例には,関
係データベースへの導入[1]と Prolog への導入した
Vocalog[2]がある.
セマンティック・ウェブリソースにアクセスするた
めのインターフェースの研究には,Protégé[7]や法造
[14] な ど の 視 覚 化 支 援 ツ ー ル や CLOnE[13] や
GINO[12]の制限された自然言語を用いる語彙定義や
検索を行うシステム,オントロジーを基に作成した辞
書を用いて自然言語で問合せを行う ORAKEL[15]な
どがある.しかしながら,視覚化支援ツールは主語,
述語,目的語のトリプルで文を構成する RDF モデル
がベースとなっており,ユーザはそのトリプルを意識
して語彙の定義や検索要求言語を記述する必要があ
る.また,制約された自然言語では自然言語の構文の
概念は導入されているが,語彙の概念は導入されてい
ない.一方,ORAKEL も,辞書作成を行っているも
のの語彙構築の概念は導入されていない.そのため,
以上の方法だと自然言語のように語の組合せで概念
を表現できない.
2 章では(3)セマンティック・ウェブ上へ語彙を導入
するための機構,3 章では(4)語彙構築例について述べ
る.
2. 語彙構築機構
本章ではセマンティック・ウェブ上で語彙を構築す
るための機構を提案する.ここでは,W3C による標
準に基づいたセマンティック・ウェブがあると仮定し,
そのセマンティック・ウェブにはオントロジーとオン
トロジーを用いたリソースの情報,SPARQL とその処
理系も含む.まず,語彙構築に用いられる提案言語と
その言語を用いて基本語彙を基に語彙を構築する仕
組みについて 2.1 節で述べる.その後,提案する語彙
構築機構を構成する残りの 3 つの仕組みについて述
べる.2.2 節では図 2-1 に示すようにドメインエキス
パートが基本語彙の要素である基本名辞と基本形容
辞を定義することで基本語彙を抽出するための仕組
みを示す.2.3 節では 2.1 節と 2.2 節で示す方法により
構築された語彙を用いて問合せを行う仕組みについ
て説明する.また,語彙を用いた問合せの記述をセマ
ンティック・ウェブの問合せの記述に書き換える仕組
みを 2.4 節で示す.2.1 節で示す基本語からの語彙構
築と語彙を用いた問合せは図 2-2 にあるようにドメイ
ンユーザにより行われる.各ユーザに求められる知識
は,ドメインエキスパートにはドメインに関してエキ
スパートレベルの知識と本提案言語による基本語彙
の定義方法が必要あり,ドメインユーザにはドメイン
に関する一般的な知識と本提案言語による派生語の
定義方法と問合せ方法が必要である.
図 2-1 ドメインエキスパートによる基本語彙の抽出
図 2-2 ドメインユーザによる語彙構築と問合せ
2.1.
提案言語と語彙構築
本節では提案言語とその言語を用いた語彙構築に
ついて説明する.我々は提案言語を用いて自由に語彙
06-02
を構築することができる.語彙には基本語彙と派生語
彙の 2 つがあるが,本節では,基本語彙は 2.2 節で説
明する方法で与えられたものとし,それを基に派生語
彙を定義することにより語彙を構築する方法につい
て述べる.まず,派生語彙の定義方法について示し,
その後,派生語の定義で用いられる語構成子と名辞と
形容辞について述べる.
次のようなシンボルを用いて語彙の各要素を表す;
Δ : 語彙
BN : 基本名辞の集合
DN : 派生名辞の集合
N : 名辞の集合
BA : 基本形容辞の集合
DA : 派生形容辞の集合
AD : 形容辞の集合
A+ : アルファベット A から成る全ての文字列の集合
L: 全ての文字列と全ての数字から構成される定数の
集合.
F : 計算可能な関数
本論文で扱う語彙の要素である語には名辞と名辞
を修飾して制約を与える形容辞の 2 つの品詞がある.
自然言語の名詞と形容詞とは違うため,別名で呼ぶ.
派生語彙の要素である語には派生名辞と派生形容
辞の 2 つの型がある.各派生名辞は関数 derived_noun
を用いた次の定義式により,名辞,複数の名辞の組合
せ,または形容辞と名辞の組合せから成る名辞の集合
N の要素 n に新たなラベルを与えることで辞書的に定
義する.
derived_noun(new_noun) ≜ n. where n∈N
関数 derived_noun の定義域は派生名辞の集合 DN で
あり,値域は N である.上の定義では,新たに派生
名辞 new_noun を n のラベルとして定義している.こ
のように定義した派生名辞は派生名辞の集合 DN の
要素である.また,ここで用いる名辞の集合 N の詳
細はこの後で示す.
各派生形容辞は関数 derived_adjective を用いた次の
定義式により,形容辞,または複数の形容辞の組合せ
から成る形容辞 AD の集合の要素 a に新たなラベルを
与えることで辞書的に定義する.
derived_adjective(new_adjective) ≜ a. where a∈AD
関数 derived_adjective の定義域は派生形容辞の集合
DA であり,値域は AD である.上の定義では,新た
に派生形容辞 new_adjective を a のラベルとして定義
している.このように定義した派生形容辞は派生形容
辞の集合 DA の要素である.また,派生語彙 D は全
ての派生名辞と派生形容辞を要素とする集合であり,
次のように定義する.
D ≜ DN ∪ DA
上記で用いる形容辞の集合 AD の詳細は後で示す.
語構成子は,語彙の要素である複数の語または語と
定数を組み合せるために用いられる演算子の集合で
ある.語構成子には表 2-3 に示す 7 種類がある.
表 2-3 語構成子
名辞の単項演算子 Cn,形容辞の単項演算子 Ca,名辞
間の 2 項演算子 Cnn,形容辞間の 2 項演算子 Caa,名辞
と形容辞間の 2 項演算子 Can,複数の名辞間の多項演
算子 Cnnn,名辞と定数間の演算子 Cnc である.各演算
子には記述しやすいように記号を与える.例えば,名
辞と形容辞間の演算を行うための 2 項演算子の修飾
[email protected],名辞を形容辞で修飾するため
に用いる.これらの演算子は規則 2-4 で用いられる.
(ⅰ) N∪AD⊂Δ
(ⅱ) BN∪DN⊂N
(ⅲ) BA∪DA⊂AD
(ⅳ) ∀a1, ∀a2∈AD
[(a1+a2), (a1&a2), (a1:a2)∈AD]
(ⅴ) ∀n∈N, ∀a∈AD [a@ n∈N]
(ⅵ) ∀n1, ∀n2∈N
[(n1+n2), (n1&n2), (n1/n2), (n1<<n2)∈N]
(ⅶ) ∀n∈N, l∈L [(n, l)∈N]
(ⅷ) ∀n∈N [¬n∈N]
(ⅸ) ∀a∈AD [a-, ¬a, a+∈A]
(ⅹ) ∀n1, … , nk∈N [{n1, … , nk}∈N]
(ⅺ) ∀n1, … , nk∈N[f(n1, … , nk)∈N]
(ⅻ) ∀n∈N, ∀n’∈A+
[(derived_noun(n’) ≜ n) ⇒ (n’∈DA)]
(xiii) ∀a∈AD, ∀a’∈A+
[(derived_adjective(a’) ≜ a) ⇒ (a’∈DA)]
(xiv) 上記の (ⅰ)~(xiii)の有限回の適用によ
り得られる集合Δが語彙である.
規則 2-4 語彙
語彙は規則 2-4 の(ⅰ)~(xiii)の有限回の適用により
得られる集合である.(ⅰ) で示すように,語彙Δは
名辞 N と形容辞 AD の和集合である.(ⅱ)で示すよう
に,基本名辞 BN と派生名辞 DN は名辞 N である.ま
た,(ⅲ)で示すように基本形容辞 BA と派生形容辞 DA
は形容辞 AD である.形容辞の組合せは(ⅳ)で記述さ
れるように形容辞 AD の要素である.2 つの形容辞の
組合せに用いられる語構成子は和(+)と積(&)と合成(:)
である.例えば,形容辞 parent の合成 parent:parent は
grandparent を表現する.形容辞と名辞の組合せは(ⅴ)
06-03
にあるように名辞である.形容辞と名辞の組合せに用
いられる語構成子は修飾(@)である.例えば,名辞
[email protected] は parent の Name を表現する.また,合
成を用いた形容辞 a1:a2 による名辞 n の修飾 a1: [email protected]
[email protected].
a1@([email protected])
名辞の組合せは(ⅵ)の記述のように名辞である.2 つ
の名辞を組み合わせるための語構成子には,和(+),
積(&),group by(/),射影(<<)がある.例えば,同じ parent
を持つ person を名辞 Person/Parent で表す.(ⅶ)で示す
ように名辞と文字列の組も名辞である.例えば,名辞
(¬Gender, “male“)は Gender の値が”male”と equal であ
ることを表す.他にも notEqual,greater,smaller,
greaterOrEqual,smallerOr Equal,include による値の制
約が考えられるが,それらは形容辞の使用により可能
な制約であるため,ここでは equal の場合のみを考え
る.また,(ⅷ)で示すように名辞の否定も名辞の要素
である.その語構成子には記号¬を用いる.(ⅸ)に示
すように形容辞の逆,否定,推移閉包も形容辞の要素
で あ る . 例 え ば , 名 辞 (Gender, ”male”) は Gender
が”male”という値となることの否定を表現する.逆の
語構成子には記号―,否定には記号¬,推移閉包には
記号+を用いる.この時,a の推移閉包 a+は次のように
定義される.
a+ ≜ a + a:a + … + a:a: … :a + … .
例えば,形容辞 parent+ は ancestor を意味する.(ⅹ)
にあるように,名辞のリストは名辞である.例えば,
名辞{FirstName, LastName} は氏名を表現している.
また,(ⅺ)にあるように名辞の要素を引数とする関数
も名辞の要素である.その関数とは sum(x), max(x),
min(x) , count(x) な ど が 考 え ら れ る . 名 辞
count(Person/Parent)は同じ Parent を持つ人の人数を表
す.(ⅻ)で示すように,名辞の要素に与えられたラベ
ル n’は派生名辞の要素である.同様に(xiii)で示すよう
に,形容辞の要素に与えられたラベル a’は派生形容辞
の要素である.(xiv)にあるように,以上の(ⅰ)~(xiii)
の有限回の適用により得られる集合Δが語彙である.
本節で説明した語彙の構成は図 2-5 に示す.上記の
ように提案言語を用いた語彙構築では,語彙の機能で
ある語と語を組み合わせて複雑な対象や制約を表現
することを語と語構成子の組合せで実現している.ま
た,その組合せに新たなラベルを与えて新たな語をす
る機能を派生語の定義により実現している.もう 1 つ
の語彙の機能である,語により対象や制約を表す機能
は 2.2 節で説明する基本語彙の定義により実現する.
これにより,ドメインユーザが自由に自身の語彙を構
築することができる.また,語彙構築の基になる基本
語彙は有限集合であるのに対して,派生名辞と派生形
容辞の集合は,複数の語の演算のための語構成子の導
入により,可算無限集合である.そのため,名辞と形
容辞の集合も可算無限集合であり,語彙も可算無限集
合である.このように,有限個の要素からなる基本語
彙を基に,可算無限個の要素から成る語彙Δを得るこ
とができる.提案した語彙構築機構に用いている派生
語の定義は,基本語を基に定義した語を語構成子で組
み合わせ,それに新たなラベルを与える辞書的定義で
あり,全ての派生語を基本語と語構成子を組み合わせ
た表現で書換え可能である.この定義方法は,ロング
マン現代英英辞典が採用している,限られた基本語を
組み合わせで各語義を定義する方法と同様である.
図 2-5 語彙の構成
書き方の規則として,文字列を与える時はダブルコ
ーテーションマーク“”で囲う.また,変数は大文字
のアルファベットで始め,名辞は大文字,形容辞は小
文字で始める.
2.2.
基本語彙の抽出
基本語彙の抽出は基本語彙を構成する基本名辞と
基本形容辞を定義することにより行う.また,セマン
ティック・ウェブ上に構築可能な語彙を導入するため,
各基本語はセマンティック・ウェブの要素とマッピン
グして定義する.ここで語彙導入の対象とするセマン
ティック・ウェブに存在する全てのプロパティの集合
を記号 P で表す.
各基本名辞は関数 basic_noun を用いた次の定義式
を使ってセマンティック・ウェブに存在する 1 つのプ
ロパティと対応させて定義する.
basic_noun(new_basic_noun) ≜ p. where p∈P
関数 basic_noun の定義域は基本名辞の集合 BN であり,
値域はプロパティ集合 P である.上の記述は,新たに
基本名辞 new_basic_noun を p と対応させて定義して
いる.このように定義した基本名辞は基本名辞の集合
BN の要素である.
また,セマンティック・ウェブ上に語彙を導入する
上で必要になる基本名辞として特別に ID を導入する.
基本名辞 ID はセマンティック・ウェブでのリソース
の URI をその値として持つ.
06-04
各基本形容辞は関数 basic_adjective を用いた次の記
述を使って基本名辞間の制約として定義する.
basic_adjective(new_basic_adjective) ≜
[[email protected]_noun1 = X,
[email protected]_noun2 = Y,
r(X, Y)].
where basic_noun1, basic_noun2∈BN, X, Y∈variables,
and r∈R
関数 basic_adjective の定義域は基本形容辞の集合 BA
であり,
値域は BN×BN×関係 R のトリプルである.
上の記述は,語彙を W と仮定した時,新たに基本形
容辞 new_basic_adjective を,W の basic_noun1 の値と
W のコピーW’の basic_noun2 の値の間にある関係 r が
成立するという制約と対応させて定義している.全て
の関係 r を要素とする集合 R は,セマンティック・ウ
ェブの世界で定義されている全てのプロパティの集
合 P と比較演算子(equal(=), notEqual(!=), greater(>),
smaller(<),
greaterOrEqual(≥),
smallerOrEqual(≤),
include(⊇), notInclude(⊉))の和集合である.このように
定義した基本形容辞は基本形容辞の集合 BA の要素で
ある.また,基本語彙 B は全ての基本名辞と基本形
容辞を要素とする集合であり,次のように定義する.
B ≜ BN ∪ BA
上記の基本語彙の定義により,語彙が持つ 1 つの機能,
語により対象や制約を表す機能を実現している.
2.3.
問合せ
本節では 2.1 節で述べた提案言語を用いて問合せを
行うため仕組みを示す.提案言語の問合せ qv の構文
は,名辞とその値となる定数もしくは変数のペアの並
置である次のようなリストとする.
qv = {(n1, v1), (n2, v2), … , (nk, vk)}.
where n1, … , nk∈N, v1, … , vk∈L∪variables
ここで,語彙を用いて記述できるすべての問合せの集
合を Qv と定義する.また,提案言語の問合せ qv のセ
マンティクスは並置する名辞と定数もしくは変数を
満たす関係である.例えば,
「女性である人の名前 X」
という関係を Gender が”female”で,Name が X」であ
る関係として次のように記述する.
{(Name, X), (Gender, “female”)}
リスト内の順番に意味はなく,上の記述は次の記述と
同値である.
{(Gender, “female”) , (Name, X)}
また,「親」という制約を形容辞 parent と定義されて
いる時,
「女親の名前が Y である人の名前 X」という
関係を Name が変数 X で,Gender が female で,
[email protected] が変数 Y として次のように記述する.
{(Name, X), (Gender, “female”), ([email protected], Y)}
検索条件として更に複雑な制約を与えたい場合は,形
容辞を定義し,用いることで行える.例えば,「成人
女性の名前 X」は上記の名辞と定数もしくは名辞と変
数のペアで表現することはできない.しかし,形容辞
adult を名辞 Age を制約することで次の様に定義し,
用いることで解消できる.
basic_adjective(adult) ≜ [[email protected]=X, X>=20)].
形容辞 adult を用いた「成人女性の名前 X」の表現は
次の様になる.
adult@{(Name, X), (Gender, “female”)}
また,形容辞 under30 を次式で定義する.
basic_adjective(adult) ≜ [[email protected]=X, X<30)].
これらの複数の形容辞を組み合わせて用いることで,
「20 代女性の名前 X」を次の記述で表現できる.
adult&under30@{(Name, X), (Gender, “female”)}
2.4.
書換え規則
本節では語彙を用いた問合せを SPARQL を用いた
問合せに翻訳する書換え規則を示す.まず,各段階の
書換え規則の説明の前に,語彙での問合せを書き換え
る SPARQL について説明する.ここで対象にするの
は SPARQL のクエリ形式 SELECT である.SELECT
はクエリパターンにバインドされた変数のすべてま
たはサブセットを返すクエリ形式である.その問合せ
表現は SELECT 句と WHERE 句から成る.SELECT
句は変数の集合 VS で構成される.
一方 WHERE 句は,
トリプルの集合と OPTIONAL で囲われたトリプルの
集合と変数の制約の集合から成る.ここで,SPARQL
で記述可能な全ての問合せを QS とする.
提案する書換え機構は SPARQL の SELECT 句と
WHERE 句の 2 つの句への書換え規則を備える.
SELECT 句への書換え規則では,語彙を用いた問合せ
から変数を抽出する処理を行う.WHERE 句への書換
え規則は 2 段階に分かれており,1 段階目では語彙を
用いた問合せをリストと制約の組を要素とする集合
へ書換えを行う.2 段階目ではリストと制約の組を要
素とする集合を SPARQL を用いた問合せへ書換えを
行う.本論文では以上の書換えのための規則として関
数 T を提案する.関数 T の定義域は QV であり,値域
は QS である.関数 T は SELECT 句と WHERE 句への
書換えを行う関数 T1 と関数 T2 から成る.また,関数
T2 は 1 段階目の処理を行う関数 T21 と 2 段階目の処理
を行う関数 T22 から成る.関数 T21 と T22 はそれぞれ複
数の関数から成る.次に関数毎に処理内容と書換え規
則を示す.
語彙での問合せを SELECT 句へ書き換える関数 T1
の定義域は QV であり,値域は VS である.関数 T1 は,
Qv に含まれるペアのうち,まず名辞と変数のペアの
06-05
変数を取り出し,各変数を小文字にし,疑問符?を先
頭に付け,SELECT の後に並置する.例えば,{(Name,
X), ([email protected], “female”), ([email protected], Y)}は関
数 T1 の適用により次の表現が得られる.
SELECT ?x ?y
関数 T2 は関数 T21 と関数 T22 に分かれており,順に
述べる.関数 T21 の定義域は Qv×制約,値域はリスト
と制約の組を要素とする集合であり,2 つの引数をと
る.始めに与えられる引数は,第 1 引数に Qv,第 2
引数に true である.T21(Qv, true)は,付録 1:関数 T21
に示される,第 1 引数に AL,第 2 引数に C をとる複
数個の関数 t21(AL, C)から成る関数 T21 により評価さ
れる.優先順位は番号が小さい順に(1-1)>…>(1-11)
である.(1-1)と(1-2)は各派生語を基本語に書換えるた
めの規則であり,始めに適用され,入力された表現は
基本語と語構成子で表現される.また,名辞の和や積
は(1-5)の規則で書き換えられ,形容辞の和や積は(1-9)
の規則により評価される.また,(1-5)での名辞の否定
と(1-9)での形容辞の否定の書換え規則は,閉世界仮説
に 基 づ い た 書 換 え を 行 う . 例 え ば ,
¬Name, "Steven Spielberg" を 含 ん だ 表 現 al は
al − ¬Name, "Steven Spielberg"
が 真 , か つ
al − ¬Name, "Steven Spielberg" ∪
Name, "Steven Spielberg" が偽である時,真と評価
される.規則(1-7)により,形容辞に修飾された名辞を
名辞と制約に書換える.また,規則(1-10)により名辞
と定数のペアを名辞と変数のペアと変数の制約に書
換える.これにより,リストに含まれるペアは全て名
辞と変数のペアになる.最後に,規則(1-11)を用いて,
基本語を対象のセマンティック・ウェブに存在するプ
ロパティに書換える.
次に関数 T22 について示す.関数 T22 の定義域はリ
ストと制約の組を要素とする集合であり,値域は Qs
である.関数 T22 は付録 2:関数 T22 に示される複数の
関数 t21 から成る.優先順位は(2-1)から(2-9)まで小さ
い番号順である.まず,与えられた集合の要素である
リストと制約の組をリストと制約の論理積に書換え
る規則を(2-1)に示す.(2-1)の規則を評価後は,リスト
と制約の論理積を要素とする集合 S が得られ,各論理
積を E とし,その論理積の各命題はリストもしくは制
約である.同一のリストに含まれるペアは同一のサブ
ジェクトを持つ.そのため,(2-2)にあるように,
r, u1 , … , ui ∈ Vs, p1 , … , pi ∈ P,
p1 , u1 , … , pi , ui , ID, r ∈ Eの時,リスト内のペア
を変数rをサブジェクトとするトリプルに書換える.
続けて,(2-3)~(2-9)の規則を順に評価する.また,(2-8)
の規則で用いる関数 lower_case は与えられた引数を
小文字に書き換える書換えを行う.例えば,与えられ
た引数が X の時,lower_case(X)=x となる.
3. 語彙構築例
本章では前章で述べた提案言語と機構を用いた語
彙構築例を示す.語彙構築を行うためのベースとなる
セマンティック・ウェブとして DBpedia[16]を用いる.
DBpedia には多くの映画に関する情報が蓄積されて
いるため,映画に関する情報を用いた語彙構築例を示
す.DBpedia の映画に関する情報を記述するためのプ
ロパティには title,director,released,starring,runtime
などが用いられている.それらのプロパティは
http://dbpedia.org/property/で定義されている.以後,そ
の URI を省略して p:という表現を用いる.
プ ロ パ テ ィ の 集 合 P={ p:title, p:director, p:type,
p:released, p:starring, p:name, p:birthplace, p:music,
p:runtime, p:academyawards }が存在するとき,提案し
た語彙構築機構により,次のような語彙を構築できる.
<基本名辞>
basic_noun(Title) ≜ p:title.
basic_noun(Name) ≜ p:name.
basic_noun(BirthPlace) ≜ p:birthplace.
basic_noun(Runtime) ≜ p:runtime.
<基本形容辞>
basic_adjective(self) ≜
[[email protected]=X, [email protected]=Y, X=Y].
basic_adjective(actor) ≜
[[email protected]=X, [email protected]=Y, p:starring(X, Y)].
basic_adjective(director) ≜
[[email protected]=X, [email protected]=Y, p:director(X, Y)].
basic_adjective(musicDirector) ≜
[[email protected]=X, [email protected]=Y, p:music(X, Y)].
basic_adjective(sameBirthPlaceIncludeSelf) ≜
[[email protected]=X, [email protected]=Y,
X=Y].
basic_adjective(academyawards) ≜
[[email protected]=Y, p:academyawards(Z, Y)].
<派生形容辞>
derived_adjective(co-starring) ≜
actor―:actor & ¬self
derived_adjective(sameBirthPlace) ≜
sameBirthPlaceIncludeSelf & ¬self
また,構築した語彙を用いて次のような問合せを行
うことができる.
(問合せ 1)タイトルが“West Side Story”の映画の音楽
監督の名前 X.
{ (Title, “West Side Story”), ([email protected], X) }.
06-06
(問合せ 2)“Julia Roberts”と共演したことのある出演
者が出演する映画のタイトル X と監督の名前 Y と上
演時間 Z.
{ (actor:[email protected], “Julia Roberts”),
(Title, X), ([email protected], Y), (Runtime, Z) }.
(問合せ 3)アカデミー賞を受賞した映画のタイトル
X で,監督の名前が Y で,その監督の同郷の人の名
前が”Tom Hanks”.
academyawards@{ (Title, X), director@{(Name, Y),
([email protected], “Tom Hanks”)}} .
これらの問い合わせは,2.4 節で示した書換え規則の
適用により,SPARQL 表現に書換られ,その SPARQL
表現は既に開発済みの処理系により評価する.例えば
(問合せ 2)は次の SPARQL 表現に書き換えられる.
この時に WHERE 句の書換えに用いた規則は 2.4 節の
(1-2)(1-7)~(1-11), (2-1)~(2-9)である.
ィック・ウェブの問合せ記述に書き換え,セマンティ
ック・ウェブ上で評価することができた.また,語彙
の要素である語には名辞とそれを修飾する形容辞の 2
つの品詞を与え,語の組合せには論理演算子を語構成
子として導入したことで,語と語構成子の組合せによ
り複雑な概念を表現することが可能になった.
今後は,セマンティック・ウェブの更なる標準化が
進むと考えられる.それに伴い,現在までに書換えを
行えなかった推移閉包や group by などの語構成子の
ための書換え規則も随時追加する予定である.また,
語彙構築のための提案言語は自然言語との中間言語
としての使用も期待できるが,一方でドメインユーザ
が語彙構築を行う際は論理演算の知識を必要とする.
これはドメインユーザの負担とも考えられるため,そ
の負担を最小限にするための表現方法を用いること
についても考察する.また,名辞と形容辞の他に,他
の品詞の概念の導入も検討する.
参考文献
SELECT ?x ?y ?z
WHERE{
?t1 p:title ?x.
?t1 p:director ?t5
?t5 p:name ?y.
?t1 p:runtime ?z.
?t1 p:starring ?t2.
OPTIONAL{ ?t2 p:name ?t6.
FILTER(str(?t6)!=”Julia Roberts”) }
?t3 p:starring ?t2.
?t3 p:starring ?t4.
?t4 p:name ?t8.
FILTER(str(?t8)=”Julia Roberts”)}
[1]
Yuzuru Tanaka, Vocabulary Building for Database Queries,
Lecture Notes in Computer Science, Vol.147, pp. 215-232,
(1983)
[2]
後藤文太朗, 田中譲, Vocalog: 語彙を用いたジェネリ
ックな概念記述が可能な拡張論理型プログラミング
言語, 情報処理学会誌, Vol.33, No.4, pp. 512-520, (1992)
[3]
World Wide Web Consortium, Resource Description
Framework, http://www.w3.org/RDF/, (2004)
[4]
World
Wide
Description
Web
Consortium,
Language
RDF
Vocabulary
RDF
Schema,
1.0:
http://www.w3.org/TR/rdf-schema/, (2004)
[5]
World Wide Web Consortium, OWL Web Ontology
Language Overview, http://www.w3.org/TR/owl-features/,
提案言語での問合せと SPARQL での問合せの表現を
比較すると,SPARQL 表現はトリプルで書く必要があ
る上,XとYとZの他に t1~t8 の概念についても考慮
する必要がある.一方,提案言語は,語の組合せだけ
なので,余計な概念を考える必要がない.この様に語
彙導入により,語の組合せで複雑な概念を表現できる.
(2004)
[6]
World Wide Web Consortium, SWRL: A Semantic Web
Rule
Language
Combining
OWL
and
RuleML,
http://www.w3.org/Submission/SWRL, (2004)
[7]
World Wide Web Consortium, SPARQL Query Language
for RDF, http://www.w3.org/TR/rdf-sparql-query/, (2008)
[8]
RSS Advisory Board Members, RSS 2.0 Specification,
http://www.rssboard.org/rss-specification, (2007)
4. おわりに
[9]
本論文ではセマンティック・ウェブ上に語彙を導入
することの重要性について述べ,語彙を構築するため
の機構を提案し,語彙構築例を示した.提案した機構
により,語彙の基となる基本語彙の要素を既存のセマ
ンティック・ウェブのオントロジーとマッピングして
定義し,提案言語を用いて基本語彙から派生語彙を構
築し,構築した語彙を用いて問合せの記述をセマンテ
Dan Brickley and Libby Miller: FOAF Vocabulary
Specification 0.9, http://xmlns.com/foaf/0.1/, (2007)
[10] Dublin Core Metadata Initiative, DCMI Metadata Terms,
http://dublincore.org/documents/dcmi-terms/, (2008)
[11] Natalya F. Noy, Michael Sintek, Stefan Decker, Monica
06-07
Crubezy, Ray W. Fergerson, and Mark A. Musen, Creating
Semantic
Web
contents
with
Protege-2000,
Intelligent Systems, Vol.16, No.2, pp. 60-71 (2001)
IEEE
[12] Abraham Bernstein and E. Kaufmann, GINO - A Guided
Input Natural Language Ontology Editor, Lecture Note in
(1-4)
If a@ n1 , n2 ∈ AL, a ∈ AD, n1 , n2 ∈ N, then
Computer Science, Vol.4273, pp. 144-157 (2006)
AL, C
[13] Adam Funk, Valentin Tablan, Kalina Bontcheva, Hamish
t 21
AL − a@ n1 , n2
∪ [email protected] , [email protected] , C
Cunningham, Brian Davis and Siegfried Handschuh,
CLOnE: Controlled Language for Ontology Editing,
If a@ n1 , … , ni ∈ AL, a ∈ AD, n1 , … , ni ∈ N, then
Lecture Note in Computer Science, Vol.4825, pp. 142-155,
AL, C
(2007)
t 21
AL − a@ n1 , … , ni
∪ [email protected] , … , [email protected] , C
[14] Kouji Kozaki, Yoshinobu Kitamura, Mitsuru Ikeda and
Riichiro
Mizoguchi,
Hozo:
An
Environment
for
Building/Using Ontologies Based on a Fundamental
(1-5)
If n1 + n2 , u ∈ AL, n1 , n2 ∈ N, u ∈ Vs ∪ L, then
Consideration of“Role”and“Relationship ”, Lecture Note
AL, C
in Computer Science, Vol.2473, pp. 155-163, (2002)
[15] Philipp Cimiano, Peter Haase, and Jorg Heizmann, Porting
t 21
UNION
natural language interfaces between domains: an
AL −
n1 + n2 , u
∪
n1 , u , C
AL −
n1 + n2 , u
∪
n2 , u , C
experimental user study with the ORAKEL system,
If
Proceedings of the 12th international conference on
Intelligent user interfaces, pp. 180-189, (2007)
n1 & n2 , u ∈ AL, n1 , n2 ∈ N, u ∈ Vs ∪ L, then
AL, C
[16] Soren Auer, Christian Bizer, Georgi Kobilarov, Jens
Lehmann, Richard Cyganiak and Zachary Ives: DBpedia,
t 21
AL −
Lecture Note in Computer Science, Vol.4825, pp. 722-735,
n1 & n2 , u
∪
n1 , u , n2 , u , C
(2007)
If ¬n, u , id, r ∈ AL, n ∈ N, u, r ∈ Vs , then
付録 1:関数 T21
AL, C
(1-1)
If n′ , u ∈ AL, n′ ∈ DN, n ∈ N, u ∈ Vs ∪ L,
derived_noun n′ ≜ n, then
AL, C
t 21
AL −
n′ , u
∪
n, u , C
AL, C
t 21
AL −
a′ @n, u
∪
[email protected], u , C
AL, C
∪ n1 , n2 , C
,C
n, u , id, r , FILTER ! bound u
AL −
¬n, u
∪
id, r , C
n, u , id, r , FILTER ! bound u
where r is a fresh variable
If ¬n, l , id, r ∈ AL, n ∈ N, l ∈ L, r ∈ Vs , then
∈ AL, n1 , n2 ⊂N, then
AL − n1 , n2
t 21
∧ OPTIONAL
AL, C
t 21
¬n, u
If ¬n, u ∈ AL, id, r ∉ AL, n ∈ N, u, r ∈ Vs , then
(1-3)
If n1, n2
AL −
∧ OPTIONAL
AL, C
(1-2)
If a′ @n, u ∈ AL, a′ ∈ DA, a ∈ AD, u ∈ Vs ∪ L,
derived_adjective a′ ≜ a, then
t 21
t 21
AL −
¬n, l
,C
∧ OPTIONAL{({(n, v), (id, r) }, FILTER(str(v)! = l))}
where v is a fresh variable
If ¬n, l ∈ AL , id, r ∉ AL, n ∈ N, l ∈ L, r ∈ Vs , then
If n, nil ∈ AL, n⊂N, then
AL, C
t 21
AL − n, nil
AL, C
t 21
AL −
¬n, l
∪
id, r , C
∧ OPTIONAL{({(n, v), (id, r) }, FILTER(str(v)! = l))}
∪ n ,C
where r and v are fresh variables
06-08
(1-6)
If n1 ≪ n2 , u ∈ AL, n1 , n2 ∈ N, u ∈ Vs ∪ L, then
If a1 ∶ a 2 @n, u ∈ AL, a1 , a 2 ∈ AD, n ∈ N,
u ∈ Vs ∪ L, then
t 21
AL, C
AL −
AL, C
n1 ≪ n2 , u
∪
n1 , u , n2 , v , C
t 21
AL −
a1 ∶ a 2 @n, u
∪
a1 @ a 2 @n , u , C
where v is a fresh variable
(1-7)
If [email protected] , u ∈ AL, a ∈ BA, n ∈ N, n1 , n2 ∈ BN,
x, y ∈ Vs , u ∈ Vs ∪ L,
basic_adjective(a) ≜ [[email protected] = x,
[email protected] = y, r(x, y)], then
t 21
AL, C
∧
AL −
AL −
[email protected] , u
∪
[email protected] , u
∪
n1 , x , true
t 21
AL −
∧
[email protected] , u
n, u
∪
AL, C
∪
AL −
¬[email protected], u
,C
[email protected], u , id, r , FILTER ! bound u
If ¬[email protected], u ∈ AL, id, r ∉ AL, a ∈ AD, n ∈ N,
u, r ∈ Vs , then
AL, C
t 21
AL −
∧ OPTIONAL
¬[email protected], u
∪
id, r , C
[email protected], u , id, r , FILTER ! bound u
where r is a fresh variable
If ¬[email protected], l , id, r ∈ AL, a ∈ AD, n ∈ N, l ∈ L,
r ∈ Vs , then
n2 , y , true
n1 , x , C ∪ {r(x, y)}
t 21
∧ OPTIONAL
n2 , y , C ∪ {r(x, y)}
(1-8)
If [email protected] , u ∈ AL, a ∈ BA, n ∈ N, n1 , n2 ∈ BN,
x, y ∈ Vs , u ∈ Vs ∪ L,
basic_adjective(a) ≜ [[email protected] = x,
[email protected] = y, r(x, y)], then
AL, C
If ¬[email protected], u , id, r ∈ AL, a ∈ AD, n ∈ N, u, r ∈ Vs , then
AL, C
t 21
AL −
¬[email protected], l
,C
∧ OPTIONAL{({([email protected], v), (id, r)}, FILTER(str(v)! = l))}
where v is a fresh variable
(1-9)
If a1 + a 2 @n, u ∈ AL, a1 , a 2 ∈ AD, n ∈ N,
u ∈ Vs ∪ L, then
AL, C
If ¬[email protected], l ∈ AL , id, r ∉ AL, a ∈ AD, n ∈ N, l ∈ L,
r ∈ Vs , then
t 21
AL −
AL, C
a1 + a 2 @n, u
∪
a1 @n, u , C
UNION
¬[email protected], l
∪
id, r , C
∧ OPTIONAL{({([email protected], v), (id, r)}, FILTER(str(v)! = l))}
a1 + a 2 @n, u
∪
a 2 @n, u , C
(1-10)
If n, l , u ∈ AL, n ∈ N, l ∈ L, u ∈ Vs , then
If a1 & a 2 @n, u ∈ AL, a1 , a 2 ∈ AD, n ∈ N,
u ∈ Vs ∪ L, then
AL −
AL −
where r and v are fresh variables
AL −
AL, C
t 21
AL, C
t 21
t 21
AL −
n, l , u
∪
n, u ,
C ∪ FILTER str u = l
a1 & a 2 @n, u
∪
a1 @n, u , a 2 @n, u , C
If n, l ∈ AL, n ∈ N, l ∈ L, then
AL, C
t 21
AL −
n, l
∪
n, v ,
C ∪ FILTER str v = l
where v is a fresh variable.
06-09
(1-11)
If n, u ∈ AL, n ∈ BN, p ∈ P, u ∈ Vs ,
basic_noun n ≜ p, then
AL, C
t 21
AL −
n, u
∪
p, u , C
付録 2:関数 T22
(2-1)
If AL =
AL, C
If u1 , u2 ∈ Vs , c ∈ <, ≤, >, ≥ , u1 c u2 ∈ E, then
u1 c u2
t 22
FILTER u1 c u2
If u1 , u2 ∈ Vs , u1 ⊇ u2 ∈ E, then
u1 ⊇ u2
t 22
FILTER regex u1 , u2 , "i"
If u1 , u2 ∈ Vs , u1 ⊉ u2 ∈ E, then
p, u | p ∈ P ∪ {id}, u ∈ Vs , C = true, then
t 22
u1 ⊉ u2
t 22
FILTER ! regex u1 , u2 , "i"
AL
If u ∈ Vs , l ∈ L, c ∈ =, ! =, <, ≤, >, ≥ , u c l ∈ E, then
If AL =
AL, C
p, u | p ∈ P ∪ {id}, u ∈ Vs , C ≠ true, then
t 22
t 22
t 22
r, pj , uj
1≤j≤i
If u ∈ Vs , l ∈ L, u ⊇ l ∈ E, then
u⊇l
If u1 , … , ui ∈ Vs , p1 , … , pi ∈ P,
p1 , u1 , … , pi , ui ∈ E, then
pj , uj
v, pj , uj
1≤j≤i
E
t 22
E−
∈ E, then
id, r
t 22
p u1 , u2
t 22
u1 , p, u2
FILTER ! regex str u , l, "i"
e1 ∧ … ∧ ei
t 22
u2
E
t 22
t 22
u1
(2-7)
If s1 , … , si ∈ S, then
t 22
t 22
s1 ∪ … ∪ si
(2-8)
If u ∈ Vs , then
u
t 22
? lower_case(u)
E − u1 = u2
If u1 , u2 ∈ Vs , u1 ! = u2 ∈ E, then
E
e1 ∪ … ∪ ei
s p o.
s1 ∧ … ∧ si
(2-4)
If u1 , u2 ∈ Vs , u1 = u2 ∈ E, then
t 22
(2-6)
If s, o ∈ Vs , p ∈ P, s, p, o ∈ E, then
s, p, o
(2-3)
If u1 , u2 ∈ Vs , p ∈ P, p u1 , u2 ∈ E, then
FILTER regex str u , l, "i"
(2-5)
If e1 , … , ei ∈ E, then
where v is a fresh variable
If r ∈ Vs , id, r
t 22
If u ∈ Vs , l ∈ L, u ⊉ l ∈ E, then
u⊉l
t 22
FILTER str u c l
AL ∧ C
(2-2)
If r, u1 , … , ui ∈ Vs , p1 , … , pi ∈ P,
p1 , u1 , … , pi , ui , id, r ∈ E, then
pj , uj
ucl
E − u1 ! = u2
(2-9)
If S is given by evaluations of (2-1) – (2-8), then
S
06-10
t 22
WHERE S