講義資料 - CRAFT 東京工業大学 理財工学研究センター

イノベーションマネジメント研究科
技術経営専攻
金融リスク・マネジメント
第3講:市場リスク(1)
東京工業大学イノベーションマネジメント研究科
中川 秀敏
E-mail: nakagawa@mot.titech.ac.jp
Office Hour : 13:00-14:30, every Tuesday, at W9-105
※講義資料は、講義前日の午後5時までにはアップするので事前に
http://www.craft.titech.ac.jp/~nakagawa/dir2/lecture.html#TIT2006_1
から各自でダウンロードして用意すること。
Agenda
• 今回の問題について
• データの扱いに関する注意
• Value at Risk
• 復習:統計学の基礎
– 推定と検定のお話(詳しくは扱わない)
2
今回の問題(前回の続き)
• TOPIX(東証株価指数)の「リスク」を過去の
日次データを用いて計測する。
• Value at Risk を算出する
– 現在価値が1億円のTOPIX連動型の投資信託について、
10日(2週間)後に95%の確率で起こりうる最大損失額は?
3
前回の内容を受けて・・・
• TOPIXの日次リターンを確率変数と見なす
• さらに、TOPIX日次リターンが「正規分布」に従う
と仮定する
– このとき、「平均」と「分散(or 標準偏差)」という2つの
パラメータを決める必要がある
• 実際のTOPIX日次データから「平均」と「標準偏
差」を求める方法を考える
– 過去何日分のデータを用いるべきか?
– 10日間リターンについての「平均」や「標準偏差」はど
う考えるべきか?
4
データの扱いに関する際の注意
• 何日分の過去データを用いて推定するかによっ
て推定値は変わる
– 特に、「平均」は過去の推移に大きく依存し、将来に対
してあまり当てにならない
• 月次や年次のパラメータを推定するときに、直接
月次リターンや年次リターンのデータを用いると、
データ数が少なくなる
※詳しいことは山下智志「市場リスクとVaR」を参照のこと
5
データの扱いに関する際の注意
• 観測データに重み付けをする方法
– 現時点に近いデータほど重要と考えて、過去に遡るにつれてデー
タのウェイトを小さくする方法
現時点を t として、xt , xt −1 , L , xt − N という過去データ
に対して、平均µˆ , 標準偏差σˆを以下の条件を満たす
ウェイトw1 ,L , wN を用いて次のように定義する:
µˆ =
N
N
∑w x
∑w
i t −i ,
i
i =0
N +1
σˆ 2 =
N
= 1, wi > wi +1 > 0
i =0
N
∑ w (x
i
t −i
−µˆ ) 2
i =0
– 指数加重移動平均法(λが小さいほど過去の影響を小さくとらえ
る)
wi = λi (1 − λ )
(0 < λ < 1)
6
データの扱いに関する際の注意
• 保有期間の変換
– Box-Car法:N日収益率の計算に重複しないN日分のデータを利
用する
– Moving-Window法: N日収益率の計算に重複を許してN日分の
データを利用する
・・・
– ルートt倍法: N日収益率のボラティリティを日次ボラティリティの
N
倍として計算する
・・・
7
データの扱いに関する際の注意
• 仮に、ルートt倍法で年次ボラティリティを計算する場合は、
年間の取引営業日数が約250日なので、次のように変換
することになる(252 とか別の数字を使うこともある)
σ annual = σ daily × 250
– 年次リターンの場合は、Box-Car 法やMoving-Window法を直接
使うことは困難
• データ数が十分でない場合には、ブートストラップ法など
のランダム・サンプリングなどを利用することがある
– ブートストラップ法:データセットから重複を許してランダムにサン
プルを抽出し、新たなデータセットを作る。この操作を繰り返し多
数のデータセットを作り出し、各データセットで統計量を計算して
その分布を調べることで、推計誤差を把握することが可能となる
8
データの扱いに関する際の注意
• 平均リターン(期待収益率)は過去データから推定するの
ではなく、別のモデルを作って当てはめることが多い
– 過去のデータから将来のリターンのトレンドを予測するのは非常
に困難
– 例えば、過去のTOPIXリターンとマクロ変数(金利や為替レート、
物価指数など)との関係を分析し、回帰分析モデルで予測する方
法
TOPIXのリターン = β 0 + β1 × マクロ変数1
+ β 2 × マクロ変数2
L + β K × マクロ変数K
– さらに個別の株式リターンなどは、CAPMから得られる期待リター
ンを利用することもある
9
データの扱いに関する際の注意
• ボラティリティもARCHやGARCHといった時系列モデル
を用いて推定する場合もある。
xt = µ t + ε t , µ t : 期待リターン, ε t∼N (0, σ t2 ):誤差項,
p
ARCH( p )
σ t2 = a +
∑
ai ε t2−i
i =1
p
GARCH( p,q) σ t2 = a +
∑
i =1
q
ai ε t2−i +
∑
biσ t2−i
i =1
ARCH: AutoRegressive Conditional Heteroskedasticity
GARCH:Generalized ARCH
10
Value at Risk(VaR)の計測
• Value at Risk とは?
• 主な計測手法
– 分散共分散(デルタ)法
– モンテカルロ・シミュレーション法
– ヒストリカル・シミュレーション法
11
Value at Riskとは?
• Value at Risk(VaR)とは
– ある保有期間後に、ある一定の確率(信頼水準)で想
定される資産の最大損失額
– 例えば「α%-N日VaR」と言えば、『N日後にα%の確
率で被る可能性のある最大の損失額』を意味する。
(αとしては、95や99が一般的)
– 金融機関にとっての国際的自己資本規制ルール(BIS
規制)では、金融機関が(市場性のある)保有資産の
リスク資産額を算出する時の指標として認定
(BIS規制では、α=99, N = 10を指定)
※規模の小さい金融機関では、保有資産額に資産別に決められ
たリスク掛け目を掛けてリスク資産額としている場合もある
12
Value at Risk
• VaR の数学的な定義を書くと以下のようになる
X : 資産の変化額(正であ れば利益、負であれば 損失)
α :信頼水準(小数表示 とする)
このとき、水準 α の Value at Risk は以下で定義される
VaR α ( X ) := inf {m ∈ R | P ( m + X < 0) ≤ 1 − α }
特に、 X ∼ N ( µ X , σ X2 )のときは
VaR α ( X ) := σ X × NORMSINV (α ) − µ X
となる。
※ NORMSINV (•) は標準正規分布の逆関 数
13
リターンが正規分布に従う場合
• 日次リターンXが平均μ、標準偏差(ボラティリティ)σの
正規分布に従い、現在の資産価値が1億円とすると、
– 1日後に99%の確率で起こりうる最大損失額
• 後述する分散共分散法の場合
※ 2.33 = NORMSINV (0.99)
1億円 × {2 .33 × σ − µ }
1日−99%VaR
– 10日後に99%の確率で起こりうる最大損失額
• 分散共分散法&ルートt倍法(+期待リターンも単純にt倍)の
場合
{
1億円 × 2 .33 × 10σ − 10 µ
}
10日−99%VaR
14
日次リターンが正規分布に従う場合
例えば、μ=0.001, σ=0.03 のとき、前ページの1日−99%VaR
は
1億円 × {2 .33 × 0 .03 − 0 .001 } = 689 万円
μ=0.1%, σ=3% の正規密度関数
14
ボラティリティ
12
平均
10
8
6
μ-2.33σ
4
2
0
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
ここの面積が0.01
15
分散共分散(デルタ)法
• 個々の資産の将来のリターン(価値)の分布に正規分布
を仮定し、ポートフォリオ全体のリターンの標準偏差を計
算するために、分散共分散行列を用いてリスクの合成を
行う方法。
– 「共分散」については次回。今回は単一資産を考えているので、
そのボラティリティだけを考えればよい。
• 本質は、ポートフォリオ収益率の分散(標準偏差)の計算
(長所)
– 単純な行列計算なので、計算量が比較的少なくてすむ。
– ポートフォリオ理論との親和性もあり、理論的背景も確立してい
る。
(短所)
– 正規分布でない場合やリスクファクターとリターンの関係が非線
形の構造をもつものには、理論的には適用できない。
16
モンテカルロ・シミュレーション法
• 将来のリターンの分布に何らかのパラメトリックな分布
(正規分布に限らず)を仮定し、その分布に従う疑似乱数
または準乱数を発生させるシミュレーションにより、仮想
的な将来のリターンのシナリオを多数作成し、その全体
の中で下位(100−信頼水準)%に相当する実際のデー
タを利用して、その時点での VaR を算出する方法。
(長所)
– パラメトリックな方法だが、分布は特に問わず、原理的には複雑
な多次元分布にも対応できる。
(短所)
– 計算負荷が大きい(最近はハード性能の向上で問題は少なくなっ
ている)。
– 乱数の性能に注意を払う必要がある。
17
ヒストリカル(・シミュレーション)法
• 過去に起こったデータ・サンプルを集め、全体の中で下
位(100−信頼水準)%に相当する実際のデータを利用
して、その時点での VaR を算出する方法。(過去が繰り
返すという考え方)。
(長所)
– ノンパラメトリックな方法なので、データさえあればどのような場
合にも利用できる。
– 計算量も少ない
(短所)
– 過去に生じたケースしか扱えないので、比較的サンプルの抽出
期間にリターンが安定していると、リスクを過小評価しがち。
– データが少ないと異常値に振り回されるおそれがある。
18
最近の動向
• 欧米ではヒストリカル・シミュレーション法を採用
している大手の金融機関が多くなっている(吉藤茂
「図説金融工学とリスクマネジメント」P.74)
• 日本でもヒストリカル・シミュレーション法が主流
になっているように思う
(安藤美孝「ヒストリカル法によるバリュー・アット・リスクの計測:市場価格変
動の非定常性への実務的対応」日銀金融研究所「金融研究」2004.11などを
参照)
19
小演習
• TOPIXの終値データを用いて
1. 分散共分散法(この場合、単にTOPIXリターンに正規分布を仮
定)によって、95%, 99%, 99.9%の各水準について10日VaRを求
めよ
2. ヒストリカル法によって、95%, 99%, 99.9%の各水準について10
日VaRを求めよ
3. 分散共分散法とヒストリカル法の結果を比較・考察せよ
ただし、
– 過去何日分のデータを用いて算出したかも比較してみよ
– 保有期間10日に対するデータの扱いについても比較してみよ
20
統計学の基礎
•
推定と検定のお話
(参考:東北大学統計グループ「これだけは知っておこう!統計学」有斐閣ブッ
クス)
21
推定のお話
• あるデータ集合を何かしらの確率変数Xの
標本値の集合と見なし、その確率分布を
考えることは自然な考え方
• かしこまった言い方をすると、上のような考
え方は観測している対象の「モデル」を与
えることを意味する
22
推定のお話
• ただし、確率分布を最初から完全に特定すること
はできず、一般にはある未知数を含んだ形で
「○○分布」ということだけ仮定する。
– 例えば、あるデータ集合が「正規分布」に従うと仮定で
きても、「平均」と「標準偏差」を与えないと完全に特定
されたことにならず、一般にこの2つを最初は未知数
と考える
– このような未知数のことを「パラメータ」や「母数」と呼
ぶ
• 最終的にはパラメータを与える必要がある
23
推定のお話
• 推定とは、データ集合から適当な方法を用いて、
モデルとなる確率分布のパラメータの値を決める
こと
• 推定には「誤差」がつきものであることに注意
– パラメータの推定値≠パラメータの真の値
– 区間推定という考え方
• 推定する方法はいくつかあり、問題に応じて使い
分けられたりする。
– 最尤法、最小2乗法、モーメント法など
24
推定のお話
• 例:視聴率調査
– ある番組の視聴率を調査したい。視聴率 p が
ここでのパラメータとなる。
– 400世帯をサンプルとして、28世帯がその番組
を視聴したことがわかった。
– p の最も自然な推定値は
28
pˆ =
= 0.07 = 7%
400
25
推定のお話
• 例:視聴率調査(つづき)
– 一方で日本全体には数千万(?)の世帯があ
り、7%という視聴率がどの程度確からしいか問
題になる。
– 実は真の視聴率は95%の確率で、
4.5%∼9.5% の区間に含まれていることが計算
で求められる。
(区間推定の結果は、このように確率(信頼水
準とよばれる)の設定の仕方で変わる)
26
推定のお話
• 信頼水準95%における平均の信頼区間
x − 1.96
s
n
< µ < x + 1.96
s
n
標準誤差
µ:母平均, n : データ数(十分多い)
x : 標本平均, s : 標本標準偏差
※ 1.96 = NORMSINV (0.975)
27
推定のお話
• 先の視聴率調査の場合
0.07 − 1.96
0.07(1 − 0.07)
< p < 0.07 + 1.96
400
0.07(1 − 0.07)
400
0.045 < p < 0.095
28
検定のお話
• 一方、観測対象について、何らかの仮説を立て
それをデータを用いて肯定的に主張したいと考
えることも一般的である
– 株価リターンは正規分布に従う
– 自己資本比率が低い企業は倒産しやすい、などなど
• しかし、データを用いて、このような仮説が100%
成り立つと断定することは難しい。
• そこで何らかのルールに従って、仮説が妥当か
どうかを調べる方法論が必要になる
29
検定のお話
• 検定とは、仮説が正しいかどうかをデータを用い
て判定すること
– 自分が主張する仮説を否定する「帰無仮説」を考える。
自分が主張したい仮説は「対立仮説」とする。
– 帰無仮説が正しいという仮定のもとで計算された統計
量の値について、そのような値が観測される確率が非
常に小さいとき(実際は有意水準と呼ばれる確率の基
準を与えて、それと比較する)、帰無仮説は「棄却」さ
れると言う。
30
検定のお話
• 「帰無仮説」はそもそも棄却したい仮説であり、め
でたく「帰無仮説」が検定によって棄却されると、
その「対立仮説」すなわち自分が主張したかった
仮説が採択されるという理屈になる。
– その意味で検定の問題の設定は難しい
– 2種類の誤りに注意
• 第1種の過誤:「帰無仮説が正しい」にもかかわらず、「正しく
ない」としてしまう誤り
• 第2種の過誤:「帰無仮説が正しくない」にもかかわらず、「正
しい」としてしまう誤り
31
検定のお話
• 例:再び視聴率調査
– ある番組の視聴者年齢層を調査した。
– 20代と50代それぞれ400人について調査したところ、
20代でその番組を見たのが40人で、50代では28人で
あった。
– それぞれの年齢層での視聴率を単純に推定すると、
20代が10%で、50代が7%となる。
– この結果だけで、この番組は50代よりも20代に人気が
ある(より多く視聴されている)と言えるだろうか?
32
検定のお話
• 例:再び視聴率調査(つづき)
– そこで次のような統計的検定を行う
• 帰無仮説:20代と50代での当該番組の視聴率は同じ
• 対立仮説:20代の方が50代よりも当該番組の視聴率は高い
– 検定のための統計量を計算してみると、帰無仮説の
もとでそのような統計量が観測される確率(p値と呼ば
れる)は6.4%となり、5%の有意水準では帰無仮説は
棄却されない→この番組が20代の方に人気が高いこ
とは言えない
– もし、50代の視聴者が24人(視聴率の推定値6%)だと、
p値は1.9%となり、帰無仮説は棄却される。
33
検定のお話
• 2群の比率の片側検定(例:視聴率調査)
– 仮説の設定
p 20 : 20代の視聴率, p50 : 50代の視聴率
H 0 : p 20 = p50 (帰無仮説)
H 1 : p 20 > p50 (対立仮説)
– 検定統計量
t=
p20 − p50
 1
1 


p (1 − p )
+
 n20 n50 
p : 20代と50代合わせた視聴率
n20 : 20代サンプル数
n50 : 50代サンプル数
34
検定のお話
• 2群の比率の片側検定(例:視聴率調査)
– p値の算出
p値 = 1 − NORMSDIST (検定統計量の絶対値)
– 例の場合
t=
0.10 − 0.07
= 1.521
1 
 1
0.085(1 − 0.085)
+

400
400


p値 = 1 − NORMSDIST (1.521) = 0.064 > 0.05
帰無仮説を棄却できない
35