PDFファイル - kaigi.org

The 26th Annual Conference of the Japanese Society for Artificial Intelligence, 2012
3E1-R-6-5
コミュニケーションに着目した Twitter フォローユーザ推薦
English title
北村 太一*1
Taichi Kitamura
*1
小川祐樹*2
Yuki Ogawa
太田敏澄*1
Hirohiko Suwa
Toshizumi Ohta
*2
電気通信大学
University of Elector-Communications
諏訪博彦*1
産業技術総合研究所
National Institute of Advanced Industrial Science and Technology
"Twitter", one of social media, is a service that users post daily "tweets" and the number of its users are spread increasing.
Hereby, various services and researches were in the public eye. Researches about "follow", one of Twitter's function that a
user can read other users' "tweet"(text), is no exception. However, a lot of these researches use method which recommend
followees by existing follow relation or affinity of tweets, and they do not call into account communications between users.
Whereat, we approached a method based on "involvement", density of communication between existing followee users, and
test a verification of the effect on our method better than existing method in our research.
1. はじめに
本論文では,Twitter フォローユーザ推薦手法として,関与ベ
ースに基づく推薦手法を提案し,その精度を評価することを目
的とする.Twitter は,2006 年に Obvious 社によって開始された
マイクロブログサービスである.Nielsen の調査によると,2011 年
11 月現在の日本国内における Twitter ユーザ数は 1320 万人と
日本国民の約 1 割が利用している計算になる.Twitter では,
他者を「フォロー」(follow)することにより,情報収集やコミュニケ
ーションが出来る.「フォロー」とは他者のツイートを購読する機
能であり,A が B をフォローしている場合は「B は A のフォロー
(following または followee)」「A は B のフォロワ(follower)」と呼
ぶ.Twitter ユーザは,仲間内でのコミュニケーションや著名人
へのアクセス,情報発信・収集等,様々な目的に応じて Twitter
を利用している.[富士通総研 10]
鳥海らは,Twitter ユーザの利用特性について①「広く浅いコ
ミュニケーションツールとして利用」,②「特定ユーザ間のみのコ
ミュニケーションツールとして利用」,③「コミュニケーションツー
ルとして利用せず」の 3 パターンに分類し,パターン①が全体
の 40%以上を占めていることを報告している[鳥海 11].友人・
知人間のクローズドなコミュニケーション(パターン②)も含めると,
コミュニケーションツールとして Twitter を利用するユーザは多く,
そこで生成されるコミュニケーションネットワークには重要な意味
があると考えられる.
Twitter におけるフォローユーザ推薦は,Twitter 公式「おす
すめユーザー」などのサービスとして存在するほか,各種研究も
なされている.これらの研究では,コンテンツベースフィルタリン
グ及び協調フィルタリングを用いて推薦を行いっている.一方
「おすすめユーザー」は,「フォロー情報等に基づく」フォロー推
薦を行なっている.しかしこれらはユーザ間関与(リプライ等のコ
ミュニケーション)を考慮に入れておらず,コミュニケーションツ
ールとして Twitter を利用している場合,被推薦ユーザにとって
フォロー価値の低いユーザ(著名人等のアカウント)が推薦され
る場合がある.
そのため,本研究ではリプライ等のユーザ間関与に基づく 2hop ユーザ推薦モデルを提案し,1-hop 目と 2-hop 目の双方に
ユーザ間関与を用いた手法と,どちらか一方にユーザ間関与を
連絡先:諏訪博彦,電気通信大学,〒182-8585 東京都調布
市調布ヶ丘 1-5-1,042-443-5727,[email protected]
用いた手法を提案し,それぞれの手法と既存手法を比較し,そ
の有効性を検証する.
本論文において「関与」とは,フォローユーザへのコミュニケ
ーションと定義する.即ち,リプライ(reply)[email protected]
含むツイートである.但し,公式リツイート(retweet; RT)は文章を
フォロワに広めるのみで RT 元とのコミュニケーションが存在しな
いので,「関与」から除外する.一方,非公式 RT はユーザ自身
のコメントを RT 元の文章に付記するものであり,RT 元ユーザと
のコミュニケーションがあるものとみなして「関与」に含めるものと
する.
2. 関連研究
本章では、関連研究について述べる
2.1 Twitter のフォロー関係に関する研究
Golder らは,twitter におけるユーザ同士の結びつき方につ
いて,2-hop の非対称ソーシャルグラフ 32=9 通り(図 1)に対して
どのような条件でフォローが為される傾向にあるかを述べている
[Golder10].
図 1:2-hop の非対称ソーシャルグラフ (Golder et al.より)
被験者 A に対して,様々な結びつきである C を推薦し,その
結果を比較している.評価実験の結果,(A⇔B→C),(A→B⇔
C),(A⇔B⇔C)の 3 パターンが有効という結果となり,推移性
-1-
The 26th Annual Conference of the Japanese Society for Artificial Intelligence, 2012
(→:フォロー関係)及び相互性(⇔:相互フォロー関係)の双方
が有効であることを示している.また,フォロワ(←)と相互フォロ
ー(⇔)の両関係を持った(A⇔B←C)(A←B⇔C)では逆効果で
あることが示されている.なお,フォローを推薦するときに用いた
ものは共通のフォロー・フォロワ(図 1 の B)の数のみでツイート
の中身を用いていない.
2.2 Twitter のフォロー推薦手法に関する研究
Hannon らは,Twitter のフォロー推薦に関する研究として,コ
ンテンツベースフィルタリング(Content-Based Filtering; CB)と,
協調フィルタリング(Collaborative Filtering; CF)及び,その両者
を組み合わせたハイブリッド推薦手法を用いた Twitter フォロー
ユーザの推薦手法の研究を行なっている[Hannon10].
CB は,コンテンツ同士の内容・説明の類似性をベースとして
推薦を行う手法で,情報推薦で一般的な推薦手法の一つであ
る.被推薦ユーザ(A)及びそのフォロー・フォロワ(B)のツイートの
類似度,および B とそのフォロー(C)のツイートを計測することに
より,ツイート内容の近い 2-hop ユーザ(C)を推薦する手法であ
る.
一方 CF は,ユーザのプロファイルや行動履歴をベースに推
薦する手法で,こちらも情報推薦において一般的な推薦手法の
一つである.被推薦ユーザと類似した嗜好を持つコンテンツが
推薦されるので,類似した嗜好を持つユーザが多ければ多いほ
ど推薦精度が上がる.Hannon らは,フォロー推薦に CF を適用
する上で,被推薦ユーザ(A)のフォロー・フォロワ(B)によって最
も多くフォローされている 2-hop ユーザ(C)を推薦する手法を採
用している.これにより CB では追跡困難な嗜好・属性変化への
追随が行えるといったメリットがある.
さらに,Hannon らは,CB と CF の両者を組み合わせたハイブ
リッド推薦手法を提案し評価している.その結果,被験者実験に
おいてハイブリッド推薦手法が最も良い結果であったことを報告
している.しかし,被推薦ユーザ(A)のフォロー・フォロワ(B)への
関与および B のフォロー(C)に対する関与については触れられ
ておらず,特に CF を用いた場合は各フォローユーザが均等に
扱われるという問題点がある.
2.3 Twitter 公式推薦システム「おすすめユーザー」
Twitter には,フォローユーザを推薦する「おすすめユーザー」
という推薦システムがあり,「おすすめユーザー」は大きく分けて
2 種類に大別される.
第一に,「芸能・文化」「音楽」「スポーツ」等ジャンル別に著名
人・有名企業のアカウントを列挙し,Twitter を始めたばかりのユ
ーザに推薦する仕組みである.これらのアカウントは Twitter 運
営元である Twitter Inc.の追加した著名人・有名企業アカウント
である.この推薦手法は,Twitter を著名人のプライベート及び
最新のニュース等に関する情報収集や著名人とのリプライ等に
よるコミュニケーションを欲するユーザに対しては有用であると
考えられる.一方で,友人・知人あるいは「オタク」など趣味・嗜
好の類似した Twitter ユーザとのコミュニケーションに利用する
ようなユーザに対しては有用性は低いものであると考えられる.
第二に,Twitter ユーザのフォロー情報などに基づいて他ユ
ーザをフォロー推薦する仕組みである.Twitter Inc.では推薦ア
ルゴリズムを明らかにしていないが,フォローやフォロワの多くが
フォローを行なっているユーザが優先的に推薦されるようになっ
ている.そのためユーザは,フォロワの多い有名人を中心に推
薦されることとなり,コミュニケーションツールに Twitter を利用す
るユーザに対しては,有効な推薦がなされていない.なお,ここ
で「有名人」はフォロワが 10000 人を超えるユーザ,オピニオンリ
ーダなど特定分野・属性に関する情報発信力の強いユーザとし,
著名人・企業には限らない.
2.4 Twitter のリプライ機能を用いた研究
田沼らは,特定分野に関する情報をツイートするユーザを,
Twitter 機能の一つである“リプライ”に着目して発見する手法を
提案している[田沼 11].この研究はユーザ間コミュニケーション
を基にした研究で,特定分野に関するツイートのリプライが多け
れば多いほど発見精度が上がることを報告している.アカウント
発見に関して,「分野に関するワードを含む割合の高いアカウン
ト(core アカウント)を発見する手法」と「core アカウントのリプライ
に着目し,同様の分野に関するワードがリプライ内で含まれる割
合を用いる手法」の 2 手法を統合することにより,core アカウント
であるユーザ自身のツイートの形態素解析結果では発見が困
難な「特定分野に濃いユーザアカウント」を発見できることを報
告している.
2.5 関連研究まとめ
2.1~2.3 節の研究・システムはフォローユーザ間のコミュニケ
ーション(=ユーザ間関与)を推薦に用いておらず,被推薦ユー
ザにとって関係性の薄いユーザが推薦されることがある.一方,
2.4 節の研究ではフォロー推薦ではないが,リプライというユー
ザ間関与を用いてユーザを発見する手法を提案している.本論
文では田沼ら[7]の考え方を一部踏襲し,ユーザ間関与に基づ
くフォローユーザ推薦手法を提案する.
3. 関与に基づくフォローユーザ推薦
2 章で述べた通り,Hannon らや Golder らの手法では,フォロ
ーユーザに対する被推薦ユーザの関与については考慮されて
おらず,フォロー及びフォロワとの繋がりなどで趣味・嗜好の異
なるユーザが推薦される可能性がある.そこで本研究では,ユ
ーザのフォローへの関与を考慮したユーザ推薦を行う.ユーザ
A がフォローユーザ B に関与を示して入れば A と B の関係が
密であることが予想される.また,B とそのフォローC との間にも
同様のことが考えられる.この場合において,A にとって未知な
2-hop ユーザ C を推薦する.
また,ここでは A から B 及び B から C へのフォロー・関与に
ついてのみ注目し,逆方向(C から B 及び B から A)のフォロ
ー・関与については考慮しないものとする.これは,他のユーザ
を「フォロー・関与している」ことはそのユーザに対して関心や興
味を持っていることを意味するのに対し,他人に「フォロー・関与
されている」ことは逆に関心や興味を示されていることである.即
ち被推薦ユーザの関心や興味ではない.よって,A-B 間及び
B-C 間ではそれぞれ A,B が B,C に「フォロー・関与されてい
る」だけの関係を排し,「フォロー・関与している」という関係のみ
を利用することとする.これにより推移性(transitivity)を担保する
ことができる.
提案手法の概要を図 2~4 に示す.図 2(提案手法 1)および
図 3(提案手法 2)は,A-B 間と B-C 間の一方にユーザ間関与,
他方にフォロー関係を利用したモデルである.提案手法 1 では
2-hop 目の B-C 間,提案手法 2 では 1-hop 目の A-B 間に関与
を利用している.図の矢印は,フォローを示す.例えば"A→B"
は,A が B をフォローしていることを意味する.一方図 4 は,AB 間と B-C 間の双方にユーザ間関与を利用したモデル(提案
手法 3)である.
この関与を測る指標として,"関与度合"を導入する.これは,
あるユーザに対してどれくらいの関与を示したか数値化するも
ので,単位ツイートあたりの関与(公式 RT [email protected])数で定
-2-
The 26th Annual Conference of the Japanese Society for Artificial Intelligence, 2012
義 す る . A か ら 見 た B へ の 関 与 度 合 は w(ab) と 表 記 し ,
100tweet あ た り 7 つ の @tweet で あ れ ば , 関 与 度 合 は
w(ab)=0.07 である.提案手法 1 では A からのフォローが認めら
れる B からの関与度合の総和の多寡をユーザ推薦に用いる.
一方提案手法 2 では,A から B への関与が認められる(即ち
w(ab)が 0 でない)B からのフォロー数の多尐をユーザ推薦に用
いる.
定義し,A→B 間にフォロー関係があれば f(a,b)=1,なければ
f(a,b)=0 とする.
表 1 に提案手法と既存手法を整理する.提案手法 1 は A-B
間についてはフォロー関係を用い, B-C 間の関与を考慮して
推薦する手法(フォロー・関与型)である.提案手法 2 は,A-B
間は関与を考慮,B-C 間はフォロー数で推薦する手法(関与・
フォロー型)である.提案手法 3 は,A-B 間・B-C 間共に関与を
考慮する手法(関与・関与型)である.なお,すべての手法にお
いて,B は A のフォロー,C は B のフォローに限定する.既存
手法は,関与を考慮せず A-B 間・B-C 間共にフォロー数を考慮
する手法(フォロー・フォロー型)である.
図 2 提案手法 1 (B-C 間に関与利用)
図 5 提案手法 3 における関与度合及び関与スコア
表 1 既存手法と提案手法
概要
図 3 提案手法 2 (A-B 間に関与利用)
関与A→B 関与B→C
提案手法1
(フォロー・関与型)
f(a,b)=1におけるΣ w(bc)の大きい
Cを推薦(2hop目は関与)
提案手法2
(関与・フォロー型)
Σ f(b,c)(但しw(ab)>0)の多い
提案手法3
(関与・関与型)
既存手法
(フォロー・フォロー型)
-
○
○
-
関与スコアでCを推薦 (ユーザ間
関与で推薦)
○
○
f(a,b)=1かつΣ f(b,c)の多い
Cを推薦. (フォロー数で推薦)
-
-
Cを推薦(1hop目は関与)
(○:関与考慮 -:関与考慮せず)
4. 実験
4.1 実験目的
図 4 提案手法 3 (関与のみを用いた推薦手法)
A-B 間及び B-C 間の双方に関与を用いている提案手法
3(図 4)では,A から見て C は,複数のユーザ B を介して繋がっ
ている場合も考えられるので A-B 間の関与度合と B-C 間の関
与度合の積を,C と繋がっている各々の B に対して合算させた
値で表す多尐で比較を行う.(図 5)
推薦に用いる指標を"関与スコア" (Involvement Score)と呼び,
提案手法 1 での関与スコアは IS(1) ,提案手法 2 では IS(2) ,
提案手法 3 では IS(3) と表す.それぞれの定義は以下の通りで
ある
IS(1) = Σw(bc)
(and f(a,b)=1) …(1)
IS(2) = Σf(b,c)
(and w(ab)>0) …(2)
IS(3) = Σw(ab)・w(bc)
…(3)
図 5 の関与スコアは,提案手法 3 における C1,C2,...,Ci の関
与スコア(IS(3))を表している.また B から見た C への関与度合
を w(bc),A→B 間及び B→C 間のフォロー関係を f(a,b),f(b,c)と
3 種類の提案手法がどのような特徴を持っているかを検証す
るために,1-hop 目(A-B 間)にフォロー数,2-hop 目(B-C 間)に
関与を用いた推薦手法「フォロー・関与型」(図 2,提案手法 1),
1-hop 目(A-B 間)に関与,2-hop 目(B-C 間)にフォロー数を用い
た「関与・フォロー型」(図 3,提案手法 2),1-hop 目(A-B 間),2hop 目(B-C 間)共に関与を用いた「関与・関与型」(図 4,提案手
法 3),1-hop 目(A-B 間),2-hop 目(B-C 間)共にフォロー数を用
いた「フォロー・フォロー型」である既存手法を用いて比較する.
4.2 データセット
被推薦ユーザ A 集合として,任意の 11 人(フォロー数:14 人
~252 人 平均 109.45)を抽出した.ユーザ A 集合の年代は 20
代 9 名,30 代 2 名であり,性別は全て男性である.各ユーザ A
について,フォロー情報(ユーザ B 集合及びユーザ C 集合)及
びツイート(ユーザ A のツイート,ユーザ B 集合のツイート)の収
集を行った. 収集期間は 2011/12/19~2011/12/22 で,ツイート
に関しては,それぞれ最新 100 ツイートを収集している.ユーザ
A 集合,ユーザ B 集合の全フォローは延べ 571466 件である
(ユーザ B 集合: 1204 ユーザ,ユーザ C 集合:570262 ユーザ).
但し,ユーザ C 集合には B 集合のフォローを全て収集したため,
ユーザ A 集合及びユーザ B 集合と重複するユーザも存在する.
-3-
The 26th Annual Conference of the Japanese Society for Artificial Intelligence, 2012
4.3 実験方法
表 1 で示した 4 種類の推薦手法を比較するための実験を行
う.既存手法では,ユーザ B 集合からより多くフォローされてい
る上位 10 人となるユーザ C 集合を推薦する.提案手法 1 では,
B-C 間の関与度合の上位 10 人となるユーザ C 集合を推薦する.
提案手法 2 では,A-B 間の関与が存在するユーザ B 集合によ
ってフォローされているユーザ C 集合のうち,ユーザ集合 B か
らより多くフォローされている上位 10 人となるユーザ C 集合を
推薦する.提案手法 3 では,関与スコアの上位 10 人となるユー
ザ C 集合を推薦する.評価手法は 10 分割交差検証法を用い
た.
5. 実験結果
評価実験の結果を表 2 に示す.F 値,精度,再現率ともに提
案手法 2(関与・フォロー型)が最も高く,既存手法(フォロー・フ
ォロー型),提案手法 1(フォロー・関与型)と続き,提案手法 3
(関与・関与型)は,F 値,精度,再現率ともに最も悪い数値とな
っている.つまり,A-B 間は関与を重視し B-C 間はフォロー数を
考慮して推薦する関与・フォロー型が他の 3 手法よりも良い結
果となっている.一方で,提案手法 3(関与・関与型)が,既存手
法(フォロー・フォロー型)より精度・再現率ともに低い結果となっ
ている.
表 2 各手法における精度・再現率及び F 値
推薦パターン
提案手法1
(フォロー・関与型)
提案手法2
(関与・フォロー型)
提案手法3
(関与・関与型)
既存手法
(フォロー・フォロー型)
F値
精度
再現率
0.057
0.053
0.063
0.118
0.115
0.123
0.035
0.032
0.039
0.087
0.084
0.091
ある場合,ユーザ A とユーザ C の繋がりはほとんどないこととな
る.このため,推薦精度が低下したものと考える.
7. おわりに
本論文では,Twitter フォローユーザ推薦手法として,関与ベ
ースに基づく推薦手法を提案し,その精度を評価することを目
的とした. 2hop 先のユーザを推薦する手法として,1hop 目,
2hop 目共にユーザ間関与を用いる手法と,どちらか一方にユ
ーザ間関与を用いる手法を提案している.既存手法を含め,4
つの手法について,評価実験を行ったところ,1hop 目に関与を
利用し,2hop 目にフォロー関係を利用する提案手法 2(関与・フ
ォロー型)が最も良い結果となることを確認している.
今後は,より被験者数を増やし,被験者の特性を考慮したう
えで各提案手法の精度の比較を行うことで,各被験者の特性に
合った推薦手法の発見を行いたい.
参考文献
[富士通総研 10] 富士通総研: Twitter(ツイッター)利用状況
調 査 ~ 若 年 層 と 40 代 で 異 な る 利 用 目 的 ~ ,
http://jp.fujitsu.com/group/fri/report/cyber/research/twitter/,
2010 年 3 月発表.
[鳥海 11] 鳥海不二夫, 神谷達幸, 石井健一郎: Twitter にお
けるつぶやきを用いたユーザの特性分析, 情報処理学会,
第 7 回 ネットワーク生態学シンポジウム, pp.1234-1237,
2011.
[Golder 10] Scott A. Golder, S. Yardi: Structural Predictors of
Tie Formation in Twitter: Transitivity and Mutuality, 2010
IEEE Second International Conference on Social Computing,
socialcom, pp.88-95, 2010.
[Hannon 10] John Hannon, Mike Bennett, Barry Smyth:
Recommending Twitter Users to Follow Using Content and
Collaborative Filtering Approaches, RecSys '10 Proceedings
of the fourth ACM conference on Recommender systems, pp.
199-206, 2010.
[田沼 11] 田沼勇輝,鈴木政巳,小林亜樹: Twitter における特
定分野に「濃い」アカウントの発見手法, DEIM Forum 2011
A10-4,2011.
6. 考察
評価実験によって,提案手法 2(関与・フォロー型)で最も良
い結果が確認されている.一方で提案手法 3(関与・関与型)で
は最も悪い結果が確認されている.また,提案手法 3 ほどでは
ないが,提案手法 1(フォロー・関与型)も既存手法(フォロー・フ
ォロー型)より悪い結果となっている.
提案手法 2 で推薦されるユーザは,被推薦ユーザ A がコミュ
ニケーションを取っているユーザ B 集合から,多くフォローされ
ているユーザである.被推薦ユーザ A 関与度合いが強い人の
多くがフォローしているユーザを推薦することができ,推薦精度
の向上が図られたものと考える.
一方,提案手法 3 で推薦されるユーザは,被推薦ユーザ A
がコミュニケーションを取っているユーザ B 集合のユーザが,多
くコミュニケーションをとっているユーザである.このため,ユー
ザ A と仲の良いユーザ B の親友であるユーザ C が推薦される
こともある.この時,ユーザ A とユーザ C が同一のコミュニティに
所属していれば問題ないが,ユーザ A とユーザ B の関係が大
学の研究室仲間,ユーザ B とユーザ C の関係が幼馴染などで
-4-