海外の非営利組織事業評価の動向に関する情報収集 平成27年3月

海外の非営利組織事業評価の動向に関する情報収集
平成27年3月
一般財団法人CSOネットワーク
代表理事
今田 克司
海外の非営利組織事業評価の動向にかかる情報収集
目次
1
目的
2
評価の潮流概観
2.1. 評価に対する意識の広がり
2.1.1. 評価の要請と能力形成の広がり
2.1.2. 評価専門家以外の評価観の変化
2.1.3. EvalPartners と国際評価年
2.2. 評価の二本柱「説明責任」と「学び」、第三の柱の形成
2.2.1. 「学び」の復権
2.2.2. 第三の柱:マネジメント・ツールとしての評価
2.2.3. 変化の理論
2.3. インパクト評価の「王道」と対抗軸の動き
2.3.1. インパクト評価
2.3.2. 展開評価
2.4. その他の潮流
2.4.1. データ革命
2.4.2. 数値化による可視化という意識
2.4.3. ソーシャルインパクト分析との接点
2.4.4. 評価のカントリー・オーナーシップと参加
3
考察:日本の非営利組織評価への活用
4
結論
<資料編>
ヒアリング一覧
1
非営利組織の事業評価に関わる海外の動向調査
1
目的
本調査は、科学研究費調査 基盤(B)
「公共の境界領域の評価~政府、企業と
非営利組織の輪郭~」(田中弥生)の一環として行われたものであり、海外の非営
利組織の事業評価に関わる動向を把握することを目的としている。ここでは、
特に、評価において国際的な影響力を持つ米国と英国に着目した。その結果か
ら、本科研費調査で開発している評価方法の国際的な位置関係を確認すること
としたい。また、その内容は、日本の非営利組織においても有益な情報を有する
ことから、非営利関係者や評価関係者にも還元したい。
2
評価の潮流概観
今回の海外動向調査において、評価の潮流(トレンド)として大きく抽出することが
できたものとして、3点あげておきたい。1) 評価に対する意識の広がり、2) 評価の目
的としての学びの復権とマネジメント・ツールとしての評価の台頭、3) インパクト評
価の対抗軸としての展開評価への注目、である。本項では、この3点について紹介し、
加えてその他の潮流についても触れる。
2.1. 評価に対する意識の広がり
2.1.1. 評価の要請と能力形成の広がり
評価がプロの仕事として確立したのはここ 20 年程のことだが、
特に 2000 年代以降、
公的資金投入におけるバリュー・フォー・マネー(Value for Money [VfM]、投資に対す
る価値の最大化)の流れが強くなり、それに呼応するように評価の要請が強化され、そ
の結果評価にそれまで以上の資金がつぎ込まれるようになった。
開発援助の分野においては、USAID(米国国際開発庁)、DfID(英国国際開発庁)など
の援助機関が VfM を打ち出し、それに呼応するように大手の国際 NGO が評価を強化し
ていった。途上国においては、国際 NGO から資金提供を受ける現地 NGO に評価の波が
伝播する形でトリクルダウンが起こり、評価の要請が広がって行った。
評価の要請は広まっても、それがすぐに評価の能力形成につながるわけではない。そ
こで、途上国国内での評価の能力強化の必要性が言われるようになり、アジア、アフリ
カ、ラテンアメリカなどの地域ごとの評価専門家機関(VOPEs = Voluntary Organizations
of Professional Evaluators)を通じて評価のプロの養成が行われるようになっていった。
2.1.2. 評価専門家以外の評価観の変化
以上のようなドナー側の動きと評価専門家の増大は、今回の調査以前の段階でもある
程度把握できていたが、今回の一連のヒアリングのなかから、評価に対する注目が他に
2
も広がりつつあることが浮き彫りになった。
評価に特に注目しているのは、他ならぬ事業実施主体だが、これは後述の「役に立つ」
評価の文脈につながっている。評価者以外が評価の重要性に気付き、視点や手法を事業
運営に取り入れるようになってきており、もはや評価は評価専門家の専管事項ではなく
なりつつあるということだ。
しかし一方で、評価の理解者が少ないという現実も厳然と存在している。今回ヒアリ
ングを行った欧州連合の開発援助機関 EuropeAid や国連開発計画(UNDP)で運用して
いる資金量に対して、評価に投入されている人員や資金は決して十分とは言えない 1。
米国の民間財団における評価の意識を捉えたものとして、Center for Evaluation
Innovation (CEI) が 2013 年に発行した調査報告書がある。これを見ると、調査に参加
した 31 財団のうちの 50%が、助成金に対する評価への資金投入が増加したと回答して
おり、評価の必要性を意識している財団が増加傾向にあることがうかがえる 2。
2.1.3. EvalPartners と国際評価年
途上国を中心に VOPEs を通じた評価者養成の機運が高まるのと同時に、上記の流れ
に乗って、CSO の評価能力強化の必要性が言われるようになり、UNICEF(国連児童基
金)と IOCE (International Organization for Cooperation in Evaluation) が共同で、2012
年に EvalParters (国際評価パートナーシップ・イニシアチブ)を設立した
3。
EvalPartners の目的は、世界各国において CSO の評価能力と政策・世論形成能力の強化
を図り、その結果として国レベルの政策が客観的な事実に基づいて形成されるようにな
ることとある。EvalPartners では特に公平性(equity)とジェンダーの平等、社会正義
の実現に力を入れると、設立の際に採択されたチェンマイ宣言に記されている 4。
EvalPartners が母体となって、国連ミレニアム開発目標(MDGs)から持続可能な開
発目標(SDGs)へと交代する年であり、新たな開発目標へのモニタリングの機運の高ま
りが見られる 2015 年を国際評価年と定めた。これは、2013 年 9-10 月、ブラジルで開
催された第3回国家評価能力国際会議において決定したもので 5、これを受けて 2014
年 12 月には、国単位での評価能力構築を推進する国連総会決議が承認されている 6。
開発援助関連の事業に年間 90 億ユーロ規模の助成を行う機関 EuropeAid の本部の評価室は 17 人のス
タッフを抱えるのみで、事業単位の評価はおもに国レベルの担当官が行うが、事業評価の弱さが指摘され
ているという。また、全体の複数年計画策定過程においても、評価の必要性に関する内部の理解は十分と
は言えないという。詳しくは資料編ヒアリング一覧のヒアリング1を参照。
一方、UNDP では国別、テーマ別、地域/グローバル単位で事業評価を行っているが、独立評価室
(IEO)は、スタッフ 20 人(評価専門家 10 人)の小さな事務所。国ごとおよび地域(Regional Bureau)
ごとに M&E(モニタリングと評価)の担当官をおいているが、専門性にバラツキがあり、全体の底上げ
が課題となっているという。詳しくは資料編ヒアリング一覧のヒアリング5を参照。
2 http://www.evaluationinnovation.org/sites/default/files/Benchmarking%20Evaluation%20in%20
Foundations.pdf
3 http://mymande.org/evalpartners/the-international-evaluation-partnership-initiatives
4 http://www.ioce.net/en/PDFs/Chiang%20Mai%20Declaration%202012.pdf
5 http://www.nec2013.org
6 http://www.unevaluation.org/mediacenter/newscenter/newsdetail/105
1
3
このような流れのなかで、評価のための環境整備を加速させるためのツールキットも
作成され、CSO による評価を充実させていこうという動きがグローバルなレベルで結実
しつつある 7。
2.2. 評価の二本柱「説明責任」と「学び」、第三の柱の形成
なぜ評価をするのか。この質問に対する答えは、伝統的に「説明責任を果たすため」
と「学んで改善に役立てるため」の2つであったといえる。これを評価の二本柱と呼ん
でみよう。通常、前者のために行うのが総括評価(summative evaluation)であり、後者
のために行うのが形成評価(formative evaluation)である。
2000 年代以降、この二本柱における力点は、
「説明責任」の方に大きくシフトしてい
った。評価に熱心な先進国政府において、おもに国に台所事情から、さきの VfM のかけ
声が高まっていったためである。今回ヒアリングをした開発援助の国際機関、欧州連合
の援助機関(EuropeAid)と国連開発計画(UNDP)はともに、ドナーからの VfM の圧力
には答えなければならないと感じていた。また、今回のヒアリングには含まれていない
が、文献調査や筆者の経験からいっても、開発に携わる国際 NGO に対する VfM の圧力
も同様に強くなっている。開発援助のように、先進国の国内に支持基盤をもたない分野
に対しては、いかに効果的に国民の税金が使われたかを証明せよとの圧力が強くなるの
は至極当然のことと言えよう。
2.2.1. 「学び」の復権
ところが今回の一連のヒアリングで見えてきたのは、二本柱のもうひとつである「学
び」の復権とでも言える事態だ。これはなぜだろうか。
「説明責任」を果たすためにも、
資金は効率良く使われなければならない。しかし、評価という作業から事業実施者が学
ぶことがなければ、改善は望むべくもないというのもあたり前のことだ。EuropeAid の
事業評価においても、説明責任一辺倒から、最近、活用特に学びや改善のための活用の
ための評価という位置づけが見直されつつあるという。その一環で、特に助成相手が
CSO の場合、EuropeAid 側が評価するのではなく、CSO 自身が適切に評価できるような
力量を身につけてもらう方に力点をシフトしてきているという。DfID においても、同様
の動きが見られるようだ。
2.2.2. 第三の柱:マネジメント・ツールとしての評価
しかし今回の一連のヒアリングで「学び」の復権よりも強く、多くの面接者が指摘し
ていたのが、評価とマネジメントの接近とでも言える事態だ。
総括評価、形成評価に加え、「実用重視」の評価という評価目的を打ち立てたのはパ
http://www.mymande.org/sites/default/files/toolkit/UNICEF%20NY_Advocating%20for%20Evaluation_
Web_1.pdf
7
4
ットンだが 8、その流れを汲んで、
「役に立つ評価」という視点から評価をマネジメント
に直結させようという動きが加速している。CSO の世界にパフォーマンス主義、成果主
義を浸透させようという考えが、評価のもつ実用性をフル稼働させようとしていると見
立ててよいだろう。
この流れは、後述するデータ革命、特に今やリアルタイムで事業の現場からフィード
バ ッ ク を 得 ら れ る よ う な 技 術 が あ る こ と に 着 目 し て い る 。 KPI(Key Performance
Indicators)をしっかり作り、フィードバックから即学びや改善に結びつけることで、評
価が生きてくる。中間評価、事後評価といったある特定のタイミングにとどまらず、評
価と改善が事業運営の不断のサイクルに組み込まれるのだ。
そうであれば、より活用すべきは外部評価ではなくむしろ内部評価だ。そして、それ
は事業実施者の評価能力が問われるということを意味する。評価の専門家は外部にいて、
評価のユーザとしての事業実施者が事業の始まりから終わりまで外部の専門家のアド
バイスを受けながら事業を二人三脚的に実施するという姿は、まさにパットンが実用重
視の評価で説いたことであり、これをうまく回すことによって、評価は使われる評価と
なる。
このように、評価の知見をマネジメントに取り入れようという動きは特に英米の開発
NGO のあいだで顕著に見られる。英国の NGO のアンブレラ組織 BOND や、米国の
InterAction は、そういった動きの牽引役にもなっている。BOND には、Effectiveness チ
ームという NGO の事業の有効性や妥当性を考えるチームがあり 9、InterAction には
Evaluation and Program Effectiveness Working Group (EPEWG) というワーキンググルー
プがある
10。どちらにおいても、効果(Effectiveness)という単語がキーワードになっ
ているが、評価の有効活用によって事業効果の向上を企図している。
この関連で、上述の VfM についても、BOND は、DfID などからの圧力の強いことを
念頭に、英国 NGO としてどう振る舞うべきかの指針を出している
11。基本的なスタン
スとして、NGO は、政府から一方的に VfM の考え方を押し付けられるのではなく、そ
の概念を正しく運用し、事業ごとの VfM を比較することで事業の改善につなげ、さらに
評価をうまく活用することで VfM の推進者として自らを位置づけられるようにしなけ
ればいけないと説いている。評価の活用が、VfM のかけ声で一方的に守勢に立たされて
しまうことを防ぎ、自ら VfM の推進者として実践を示していくという攻めの姿勢に転
じることを可能にするのだ。
2.2.3. 変化の理論
評価がマネジメント・ツールなのであれば、事業マネジメントの核である事業の形成
過程に評価の知見が活用されなければならない。評価の世界で評価可能性のアセスメン
8
マイケル・クイン パットン(2001)『実用重視の事業評価入門』(清水弘文堂書房)
http://www.bond.org.uk/effectiveness
10 http://www.interaction.org/work/monitoring-evaluation
11 http://www.bond.org.uk/effectiveness/value-for-money
9
5
トと呼ばれる場面だが、今回のヒアリングで、複数の面談者がこの重要性を指摘してい
た。
さらに、今回の 11 件のヒアリングを通じて、もっとも多く聞かれたことばのひとつ
が変化の理論(Theory of Change)であろう。変化の理論自体は、変化の理論センター
というウエブサイトもあり
12、決して新しい概念ではないが、DfID
ナー・機関も含め、その有効性に注目しているようだ。
や UNDP などのド
変化の理論センターは、変化の理論について、1)長期的目的を達成するための条件、
事業の結果、アウトカムなどの構成物を抽出し、2)構成物の間の関連を矢印でつなぎ、
3)変化の道として図式化したものと規定している
13。インプット→活動→アウトプット
→アウトカム→インパクトという典型的なロジックモデル 14も変化の理論の一種と言え
るが、変化の理論の特徴は、直線的因果関係をベースに論理構築をするロジックモデル
よりも柔軟に事業のアウトプットやアウトカムを設定できる点だ。したがって、矢印の
方向は一様ではないし(逆進もあり)、複数の構成物から矢印が同じ目的や事象に向か
って出ていたりもする。また通常、事象に関わるステークホルダーの存在や関わりの程
度を明示化することで、事業実施過程において、どのステークホルダーといついかにど
う関わるべきなのかを示唆するツールにもなる。
変化の理論は、後述する「発達評価」との関連性も大きい。従来のロジックモデルの
応用が効かないような分野、すなわち直線的因果関係が描きにくく、環境の変化や不確
定性の要素を勘案しなければならない複雑な事象でより力を発揮する。ガバナンス、能
力強化、組織の変化、政策形成などがそういった分野に当たり、こういった分野での事
業が特に開発援助の場面で増えてきたことも、変化の理論の台頭と無縁ではない。ただ
し、一部に言わせれば、社会的事象に直線的因果関係が描けるものの方がむしろ例外で、
ようやく評価の意識がそのことに気づいただけ、ということかもしれない。
2.3. インパクト評価の「王道」と対抗軸の動き
筆者は、2009 年にエジプトのカイロで開かれたインパクト評価の国際会議に出席し
たことがある。その場でもっとも印象に残ったのが、数値化と統計的処理を駆使したイ
ンパクト評価を評価の「王道」と位置づける“主流派”とそれを必ずしも万能とは見な
い一派との覇権争いであった。
今回の一連のヒアリングでも、この対立は色濃く評価の世界を彩っている印象を残し
た。
2.3.1. インパクト評価
念のため記しておくが、ここで言うインパクト評価は、DAC5項目のインパクトの評
12
13
14
http://www.theoryofchange.org
http://www.theoryofchange.org/what-is-theory-of-change/
プログラムセオリー、ログフレームなどの呼び名で呼ばれることも多い。
6
価ではなく、ネット・アウトカム、すなわち、事業の介入以外の影響を排した純アウト
カムを測定する一連の評価手法のことである。RCT(ランダム化比較試験)を筆頭に、
さまざまな実験的手法が開発されており、「科学的」アプローチとして評価の「王道」
を歩んでいる。
インパクト評価という手法自体は、以前より存在していたが、2006 年に Center for
Global Development が「いつ我々は学ぶのか?」というペーパーを発表し、社会開発の
分野でたくさんの資金が投じられているにもかかわらず、科学的知見がほとんど得られ
ていないことに疑問を呈した 15。インパクト評価によってそれまでの開発のやり方を変
えようと提唱する文書で、これを契機にインパクト評価に向かう流れが加速していった。
以来、世界銀行、DfID、ゲイツ財団など、開発資金を多くもつ影響力のある機関が推
進していることもあり、評価の世界における主流派の立場から動いていない。インパク
ト評価を推進するネットワークとして、3ie(インパクト評価国際イニシアチブ)が存在
する 16。
政策決定者の客観指標、量的指標志向は強くなっており、今後もその方向に変化の兆
しは見られない。また、インパクト評価は因果関係を証明する手段だから、「なにをし
てこうなった」とプラスまたはマイナスの原因を特定できることが、政策の説明責任達
成にとって大きな力となる。
このようなアプローチに対して「社会は実験室ではない」と反発する向きがあるのは
当然だろう。また、インパクト評価はほかの評価手法に比べてコストが高くなりがちと
いう理解があり、果たしてその投資に見合う評価結果が出せるのかを疑問視する声も根
強い。さらに、インパクト評価を推進する立場からも、実験的・統計的手法による厳密
な因果関係の確立から貢献度の測定にまで間口を広げようという、いわばインパクト評
価再考を促した文書が出ている。これは、英国評価学会会長を務めるなど評価の世界で
は重鎮のエリオット・スターンが 2012 年に DfID の委託で書いた「インパクト評価の
デザインと方法の範囲を広げる」というペーパーで、インパクト評価にまつわる論争に
一石を投じたものとして知られている 17。
とはいえ、評価の精緻化は因果関係の確立によってなされると考える思想は評価の世
界に強く根を張っており、評価手法の革新も多く、「王道」の地位はしばらくゆるがな
いだろう。
2.3.2. 展開評価
インパクト評価が評価のひとつの世界観(世界は操作可能、予測可能で物事の原因は
還元可能)を表しているとすれば、その対極にある世界観(世界は操作困難、予測困難、
“When Will We Learn – Improving Lives through Impact Evaluation,”
http://www.cgdev.org/publication/when-will-we-ever-learn-improving-lives-through-impact-evaluation
16 http://www.3ieimpact.org/
17 “Broadening the range of designs and methods for impact evaluations,”
http://r4d.dfid.gov.uk/Output/189575/
15
7
原 因 は 特 定 困 難 )を 体現 し て い る 評 価 の体 系が あ る 。 展 開 評 価( Developmental
Evaluation)の名の下にこの世界観が多くの評価専門家の信任を勝ち得ていることが、今
回の一連のヒアリングで明らかになった 18。これはそもそもパットンが 1994 年から提
唱している評価の考え方だが、2011 年に一冊の書物にまとめてことで、体系化の証と
なったものだ 19。
端的にいって、展開評価とは、パットンが「実用重視」の流れで開発した評価の類型
で、特に複雑な事象において目標設定や介入の仕方が単純には決められないような事業
の評価用に開発された。単なる一手法ではなく、より高レベルの評価の枠組み、類型で
ある。複雑な事象に対し、ロジックモデルなどの単純な因果関係の評価図式では評価が
難しいとの意識は従来からあり、それが変化の理論の主流化へとつながっているのだが、
変化の理論等のツールも含め、評価作業の全体に一貫したアプローチを採用したものと
いえよう。
展開評価の主唱者たちは、いわゆる複雑系の理論(complexity theory)に展開評価の
理論的支柱をおいている。また、前述の総括評価や形成評価との比較で語ることが多い。
これは、以下のように図式化できる。
図1:事業の発展段階と適した評価
事業の骨格ややり
事業の活動、実施者、背景は、
方が
•
すでに確立し
いるか
•
ている
•
結果もある程
ど んな評 価が 適して
事業の活動はすでに確立している。あまり
総括評価
変化は予定されていない。
•
度予測可能
実施者には「どうやればうまくいくか」の
経験値がある
•
事業の成果や価値を体系的に捉える用意が
できている
•
•
まだ改善の余
•
事業の主要な要素はまだ形成途上
地あり
•
実施者は方法や活動を改訂中
基準づくりの
•
成果はだんだん予測可能になりつつある
過程
•
事業が行われている背景もだいたいわかり
形成評価
つつある
•
発展中
•
実施者はまだ異なる方法や活動の実験中
18
展開評価
Developmental Evaluation という用語を耳にして、すでに日本語への訳語があるか少しチェックしてみ
たが、見つからなかった。途上国で実施される事業についての評価ではないので、開発評価では誤解を生
むし、発達心理学系統の評価でもないので、発達評価としても混乱のもとになるだろう。あとは「発展」
か「展開」あたりが考えられるが、状況の変化に応じて事業を展開させていくのと同様に、評価の展開さ
せていくというおおよその含意であるため、展開評価としてみたい。
19 Michael Q. Patton (2011), Developmental Evaluation: Applying Complexity Concepts to Enhance Innovation
and Use, New York: The Guilford Press. http://www.guilford.com/books/Developmental-Evaluation/MichaelQuinn-Patton/9781606238721 参照。
8
•
生成中
•
「どうやればうまくいくか」についても不
確定要素が大きい
•
事業を進めるうえでの新たな疑問や課題、
機会等が出てきている
Hallie Preskill & Tanya Beer (2012), Evaluation Social Innovation (FSG & Center for Evaluation Innovation)より
一部改訂
展開評価が脚光を浴びてきたもうひとつの流れに、米国民間財団を中心に 2000 年代
後半からブームになった戦略的フィランソロピーの動きとそれに対する反発がある。こ
の頃から米国の大手財団は、それまでより財団としての優先順位に基づいたアウトカム
やインパクトを前面に打ち出した選択的な助成活動を行うようになった。戦略的な投入
をすれば、それに見合った社会的リターンが見込めるはずで、それまでフィランソロピ
ーがそのような成果を出せていなかったのは、戦略的な発想に欠けていたからであると
いう考え方で、フィランソロキャピタリズム(philanthrocapitalism)の名前で知られた
流れになった。
しかし、結局のところ、社会は「機械」のようには動かず、そもそもの目標設定や介
入と結果の組み立てに対して予想外の事態が多く持ち上がった。展開評価は、そういっ
た反省をももとに、複雑な社会に見合ったプログラム構築や評価のためには、違った手
法が必要ということで注目されているのだ。上記の図で示したように、生成中(emergent)
な事態に対応すべく開発された評価の考え方といってよい。
展開評価に関しては、実際にどう評価を行い、評価者の役割は何かなど、まだ未知数
の部分も多い。しかし、「世界は操作困難、予測困難」の世界観に立つ評価の専門家に
とって、今後大きな思想的バックボーンを提供していくことはまず間違いないと考える。
展開評価の枠組みのなかに位置づけられる手法のひとつとして、Outcome Mapping
手法から派生した Outcome Harvesting が編み出されている。Outcome Harvesting は、
あらかじめ特定された目的をもとに事業のアウトカム達成度を見るのではなく、「起き
たこと」を綿密に拾い上げていくことで、その「起きたこと」と事業の関連を見ていこ
うとするものである 20。
2.4. その他の潮流
2.4.1. データ革命
今回のヒアリングで、複数からデータ革命の話題が出た。従来、評価においての悩み
の種の一つはいかにデータを取得するかだったが、ICT 革新によって、データは容易に
20 Outcome Harvesting については、以下など参照。http://www.outcomemapping.ca/resource/outcomeharvesting#inline_en
http://betterevaluation.org/resource/overview/OutcomeHarvesting
http://aea365.org/blog/ricardo-wilson-grau-on-outcome-harvesting/
9
手に入るようになってきている。特に、1) 事業の参加者や受益者がデータの自主的な
発信源となることをソーシャルメディアが可能にしていることと、2) データを時間が
経ってではなく、リアルタイムで発信・集積・分析できるようになったことは、特にマ
ネジメント・ツールとしての評価という位置づけや今後の展開評価の進化を予測するう
えで、大きな意味合いをもつ。
こういった観点から見て注目すべき動きは多い。Feedback loop といったキーワード
で検索するとたくさん事例が出てくるが、それらはほとんどがここ数年のものだ 21。ま
た、Feedback Lab 22 や Accountability Lab 23 といった、ともに Lab という命名からわ
かるような「実験室」的試みもある。前者は、事業の受益者のフィードバックをリアル
タイムで事業実施者等に還元する仕組みを模索しており、後者は、同様の試み(受益者
に限らず市民一般からのフィードバック)を説明責任のテーマでしている。
ただし、統計的手法もないままやみくもにデータを集める向きもあり、信頼できるデ
ータを取るには専門性が必要だということが熟慮されていないという声も聞かれてお
り、これは今後の課題だろう。
2.4.2. 数値化による可視化という意識
評価の量的手法と質的手法に関していえば、教科書的な答えは、どちらが優位という
ことはなく、評価の目的や分野、種類によって使うべき手法が変わってくるとなる。で
きれば、両方を生かす混成手法が好ましいというのが正解だろう。
ここ数年の DfID の動きを見ると、上述したようなインパクト評価に対する一定の見
直しとともに、一時の数値主義一辺倒ではなく、量的と質的の混成手法を推奨する傾向
があるという声が今回のヒアリングで聞かれた。とはいえ、政策決定者の量的指標志向
は全般的にこれからも弱まることはないだろうから、市民は、自分たちが大切だと思う
問題を数量化して示す必要がある。
そこでひとつ注目したいのが New Economics Foundation (NEF)による、市民が関心あ
る領域で問題を可視化する手段としての測定・数量化の役割に注目・実践している一連
の活動だ。評価に関連する分野として、NEF では、2006 年頃より、National Accounts of
Well-being(一種の幸福度指標)を開発している。社会の発展の度合いを経済指標以外
の指標で見る試みとして、イギリスではある程度浸透しており、これを使った測定を行
う自治体も増えている 24。SROI(社会的投資リターン)もそうだが、数量化(あるいは
貨幣価値換算)の際に、多くのステークホルダーが関与し、その過程と結果にオーナー
シップを持つことで、普及が加速している。
21 例えば Reboot のナイジェリアでの活動など。http://reboot.org/2015/02/13/how-to-listen-so-thatpeople-talk/
22 http://feedbacklabs.org
23 http://accountabilitylab.org/learn-AboutUs.html
24
http://www.neweconomics.org/publications/entry/national-accounts-of-well-being
10
2.4.3. ソーシャルインパクト分析との接点
日本においては、企業やベンチャー・フィランソロピスト、投資家の間で関心が高ま
っているソーシャルインパクト関連の動き 25に敏感に反応し、グローバルな動きと同じ
速度で情報共有がされている感がある。そこで、今回のヒアリングでもこういった動き
とより伝統的な評価の世界の接点について質問してみたが、反応はまちまちであった。
一部は、こういった民間セクター主導の動きには評価の専門家は鈍感だと言う。これは、
伝統的な評価の世界がおもに政府系の資金で成り立っていることに起因するのではな
いかという見解だ。一方で、インパクト投資等の流れは、いかに測定を効果的にやるか
という点においてこれまでの評価の知見に注目し、少なくともここ数年活用してきてい
るという声も聞かれた。また、昨年ぐらいより、企業の社会活動評価の流れに評価の世
界が注目するようになってきており、昨年の米国評価学会(AEA)の大会では、ソーシ
ャルインパクトや SROI に関するセッションがいくつか見られたが、これは新しいこと
だ、という感想もあった。
こういったなかで、評価の経験と民間セクターの動きをうまくハイブリッドさせて注
目されているものに、FSG と Aspen Institute による Collective Impact Forum(CIF)があ
る 26。コンサル会社である FSG が企業の戦略づくりで培った知見と、システムの変化が
いかに起こるかの研究などを題材に構想が練られたもので。大きな規模でシステムの変
化を起こそうと思ったら、組織単体ではなく、より大きな単位でビジョンの共有、測定
指標の共有などが起こらないといけないという発想から成り立っている。
CIF で体現しているような組織という点でなく地域コミュニティのような面での変化
を起こしそれを測定するという発想は、じつは評価の世界の特に展開評価の発想に近い。
実際、複雑な社会変化を起こすために面的な発想と、ビジョンや指標の共有を前提とし
て複数の事業を同時に進めようという試みは、地域研究などの分野においては伝統的に
行われており、これを評価という土俵で実践することは、これまで多く議論されてきた
テーマを評価という新しい皮袋に入れる試みと捉えられるのかもしれない。
2.4.4. 評価のカントリー・オーナーシップと参加
2005 年の援助効果パリ宣言以降、開発援助の世界では援助を受ける側のカントリー・
オーナーシップが言われている。そして昨今は「カントリー」は政府だけでなく CSO や
市民が含まれることが当然視されている。その流れで、評価についてもローカル・オー
ナーシップが言われ始めている 27。データ革命がリアルタイムのフィードバックを可能
にしていることとあいまって、「現場の声」を直接事業に反映させることを規範としよ
うとする機運が高まっている。
25 例えば Social Impact Analyst Association(http://www.siaassociation.org)といった情報交換の仕組みも
立ち上がっている。
26 https://www.collectiveimpactforum.org
27 例えば、InterAction は、今年(2015 年)に入って、Local Ownership in Evaluation を発行している
(http://www.interaction.org/sites/default/files/Local%20Ownership%20in%20Evaluation%20-%20FINAL.
pdf)
11
これは評価の国単位での能力強化とも呼応する動きで、それ自体は好ましい。しかし
一方、評価への参加には時間と手間がかかり、
「現場」の声としては、
「生活していくの
がやっとなのだから、参加はいいからどうすればうまくいくのか教えてくれ」といった
声も聞かれているようだ。参加には常にこういった問題が内在するため、事業実施者お
よび評価者には状況に応じた判断が求められる。
3
考察:日本の非営利組織評価への活用
以上、今回の海外動向調査から浮き彫りになった事業評価の潮流について概観してみ
た。さて、このような海外の状況から、日本の非営利組織が学ぶべきことはなんだろう
か。これについては、「評価を非営利組織の力にする研究会」等の議論を通じてより深
めて論じるべき点を明らかにしていきたいが、ここでは以下の4点について言及してお
きたい。
3.1. マネジメント・ツールとしての評価
「役に立つ評価」という視点から評価をマネジメントに直結させようという動きが加
速しているのは日本の非営利組織にとっても示唆に富む。リアルタイムのフィードバッ
クによる改善、KPI 重視、内部評価重視といった一連の視点の応用によって評価と改善
が事業運営の不断のサイクルに組み込まれる姿というのは、日本の非営利組織も目指す
べき姿ではないだろうか。
その際、評価専門家が多くの非営利組織にとって遠い存在である現状を鑑みるに、評
価の専門家と評価のユーザとしての事業実施者が事業の始まりから終わりまで二人三
脚で協力するというのは、どのような形で構想できるのだろうか。また、そもそも外部
評価の役割をいかに捉え直せばよいのだろうか。事業実施者の評価リテラシーを上げる
ことは必要かつ有用だが、外部者として評価者が関わる重要性も大きい。評価のすべて
の機能を団体が内在化してしまうのではなく、評価に関しては内外の役割分担をうまく
図ることが成功の鍵になるのではないだろうか。
3.2. 変化の理論
変化の理論の有用性に関しては、すでに研究会でも意識してきたが、事業の入口の段
階で単線系(linear)でない変化の道を描くことの重要性は大いに納得できる。ただし、
日本の非営利組織においてはそもそもロジックモデルを構築したことがない場合も多
く、いきなり複雑な変化の道を描くことは難しいかもしれない。一定のトレーニング・
モジュールを作成して、能力強化を体系化していくことを構想すべきではないだろうか。
3.3. 展開評価
12
上述したように、展開評価についてはその運用面でまだ未知数も多い。しかし、多く
の日本の非営利組織は今後特に発展中、生成中の社会課題と向き合って事業を行ってい
くことが多くなることが予測され、この評価体系のポテンシャルは大きいと考える。加
えて、日本の評価専門家集団を巻き込みながら、この評価体系の普及を図って行くべき
だろう。
3.4. 数値化による可視化
データ革命の活用は言わずもがなだが、市民は、自分たちが大切だと思う問題を数量
化することによって世の中に示していく必要があるという見解には賛同する。数値化は
効果的なコミュニケーションの手段であり、的確な数値の提示は非営利組織の主張に説
得性を増すことができる。また、多くのステークホルダーが関与し、その過程と結果に
オーナーシップを持たせることで、普及を加速させるという手法は日本の非営利組織も
採用すべきだろう。評価の世界で編み出されているこれら量的手法の試みを参考にしな
がら、日本の非営利組織の発信力の強化が模索できるのではないかと考える。
4
結論
今回の海外調査を通して、現在の世界の評価地図をある程度把握することができた。
今後は、それをいかに日本の非営利組織に還元し、日本の非営利組織における評価文化
を根づかせる動きに結びつけるかを、「評価を非営利組織の力にする研究会」などを通
して考察していくことになる。また、展開評価の動向などに関して、日本の評価専門家
集団とも情報・意見交換したいと考えている。
事業評価に関しては、アウトカムやインパクトをいかに測るかに多くが関心を払って
きており、その流れは今後モ続くであろうが、近年、知識の生成、共有、管理といった
評価の活用が見直されてきているという。学びとは得た知識をいかに共有、管理し、そ
れを実践に役立てるかによってその価値が決まる。日本の非営利組織における評価文化
の普及とは、まさにその意味での学びを流通させていく営みになっていくのであろう。
13
非営利組織の事業評価に関わる海外の動向調査
(資料編)
情報収集一覧
以下、文献による先行研究の把握および質問項目に関する検討を田中研究室と行いヒア
リングおよびホープページ等で情報収集を行った。
ヒアリング1
機関・団体
面談相手
Evaluation Unit, Directorate General for Development and Cooperation
(DevCO)– EuropeAid
Catherine Pravin,
[email protected]
Juergen Lovasz,
[email protected],
Chef d’unite adjoint,
Catherine Pravin のアシスタント
[email protected]
面 談 の ポ イ 1)DevCO/EuropeAid および EC の評価について
ント
•
DevCO/EuropeAid は EC のなかで開発援助関連の事業に年間 90
億ユーロ規模の助成を行う機関。拠出先には国連機関等の国際機
•
関、途上国政府、CSO などが含まれ、事業が実施されるのは EU
の拠点のある 125 の国・地域にのぼる。
評価に対する意識が高まったのは 2000 年以降。EU 議会が監査
室を通してプレッシャーを強めてきたのが 2005 年。「説明責任
を果たす」ことが評価の一大目標になった。
•
本部の評価室は 17 人のスタッフを抱えるのみで多くはできない
ので、事業レベルの評価やより日常的な ROM(Result-Oriented
Monitoring)は国の担当官が中心で行い、本部では戦略レベル(57 年のサイクルで戦略プランが作られている)の評価に徹してい
る。
•
ここ数年、一番大きなレベルである戦略評価と、ROM のあいだ
の事業評価の弱さが指摘され、その改善のために尽力している。
•
これを受けて、評価についての意識や基本的やり方等を徹底する
ため、指導文書を作成したり、トレーニング機会を提供したりし
て、評価能力の向上に努めている。昨年、Evaluation Matters と
題したガイダンス文書を作成した(1)。
14
•
評価では、助成事業の設定されたアウトカムやインパクトに対す
る貢献度を適切に測ることと事業実施のプロセス評価の両方に力
を入れている。
•
一番最近では、2014-2020 年の7年計画が作られた。評価室から
も、おもに評価可能性のアセスメントの観点から計画作成に関わ
ったが、評価の必要性に関する内部の理解は十分とは言えない。
2)評価の潮流について
2.1. 説明責任と学び
•
DevCO の評価では、説明責任を果たすことが主眼とされてきた
が、最近、活用、特に学びや改善のための活用のための評価とい
う位置づけが見直されつつある。
•
その一環で、特に助成相手が CSO の場合、EC 側が評価するので
はなく、CSO 自身が適切に評価できるような力量を身につけても
らう方に力点をシフトしてきている。
2.2. 国際評価年
•
国連等が中心になって、2015 年の国際評価年として数々の啓発
活動を企画している。2015 年は欧州開発年(European Year of
Development)でもあるので、この2つを抱き合わせた開発の分
野における評価の重要性に関する啓発事業をいくつか持つ予定
だ。
参 考 文 書 / (1)https://ec.europa.eu/europeaid/node/71167
リンク
15
ヒアリング2
機
関・
団体
New Economic Foundation(NEF)
面談 Olivier Vardakoulias
相手
[email protected]
面談 1)NEF の取り組みについて
のポ •
評価に関連する分野として、NEF では、2006 年頃より、National
イン
Accounts of Well-being を開発している。社会の発展の度合いを経済指標
ト
以外の指標で見る試みとして、英国ではある程度浸透しており、これを使
った測定を行う自治体も増えている(1)
。
•
関連で、地域からの資源流出を抑えることを念頭に、Plugging the Leaks
というイニシアチブも始めた(2)
。
•
これらの試みで、NEF は、市民が関心ある領域で問題を可視化する手段
としての測定・数量化の役割に注目し、実践している。
2)評価の潮流について
2.1. 量的志向
•
政策決定者の客観指標、量的指標志向は強くなっており、今後もその方向
は変わらないだろう。だからこそ、市民は、それを利用して自分たちが大
切だと思う問題を数量化して示す必要がある。
•
数量化の際に、多くのステークホルダーが関わり、その過程と結果にオー
ナーシップを持つことが重要だ。
•
数量化は必要な流れだが、SROI のような貨幣価値化は必ずしも進むべき
方向ではない。社会や環境の価値を万人が合意できるような経済的価値に
は転換できないからだ。
•
また、社会は実験室ではないので、RCT(ランダム化比較試験)の手法に
はどうしても限界がある。それにその種の評価には多大な資金がかかり、
果たしてその投資に見合う結果が出せるのか疑問だ。
3)その他
•
Social Impact Analyst Association(3)など、ソーシャルインパクト測定
のコミュニティのネットワーク化も進んでいる。NEF も含め、社会課題
の測定に関しては多くの人の知見を動員して大きな流れを作っていくべき
だ。
参考 (1)http://www.neweconomics.org/publications/entry/national-accounts-of-
16
文書 well-being
/リ (2)http://www.neweconomics.org/publications/entry/plugging-the-leaks
ンク (3)http://www.siaassociation.org
17
ヒアリング3
機関・団 Overseas Development Institute
体
面談相手
Simon Hearn
面談のポ 1)本人および ODI について
イント
•
[email protected]
ODI は英国の開発シンクタンクとして知られている。特に調査研究
と政策形成のつながりを強めることを志向する研究事業が多い。
•
Hearn 氏は、ODI の職員として、事業計画の手法として知られてい
る Outcome Mapping(OM) コミュニティのコーディネーターをここ
7年務めている(1)。OM は、評価の手法としてもその有効性が認
識されるようになってきている。
2)評価の潮流について
2.1. インパクト評価について
•
ODI では、インパクト評価に関するペーパーなども多く出してお
り、分野の進展のために積極的に発信している。RCT(ランダム化
比較試験)がうまくいくかどうかは、入口の段階での評価可能性の
アセスメントの役割が大きい。
•
インパクト評価は、世界銀行、英国国際開発庁(DfID)
、ゲイツ財団
など、開発資金を多くもつ影響力のある機関が推進しているため、
相変わらず評価の主流の立場を動いていない。
•
ただし、ここ数年の DfID の動きを見ると、量的手法と質的手法を両
方生かす混成手法を推奨する傾向があるようだ。また、変化の理論
など、評価をより精緻な論理の組み立てのもとに展開することに注
意を払っていると見受けられる。
•
こういった、実験的・統計的手法による厳密な因果関係の確立から
貢献度の測定にまで間口を広げようという、いわばインパクト評価
再考を促した文書として、Elliot Stern が 2012 年に DfID の委託で書
いたペーパーが知られている(2)
。
2.2. 開発 NGO の動き
•
英国の開発 NGO のアンブレラ組織 BOND や、米国の InterAction の
動きは注目に値する。BOND には、Effectiveness チームという NGO
の事業の有効性や妥当性を考えるチームがあり(3)、InterAction
には Evaluation and Program Effectiveness Working Group (EPEWG)
というワーキンググループがある(4)。
18
•
評価を事業の改善のために活用とするこれらの試みのなかから、「現
場の声」を聞き、フィードバックを事業に反映させるという機運が
高まっている。
•
VfM (Value for Money)についても、BOND は、DfID などからの圧力の
強いことを念頭に、英国 NGO としてどう振る舞うべきかの指針を出
している(5)
。基本的なスタンスとして、NGO は、政府から一方的
に VfM の考え方を押し付けられるのではなく、その概念を正しく運
用し、事業ごとの VfM を比較することで事業の改善につなげ、さら
に評価をうまく活用することで VfM の推進者として自らを位置づけ
られるようにしなければいけないと説いている。
2.3. 変化の理論(Theory of Change)
•
DfID が変化の理論に注目しているのは、従来のログフレーム的なア
プローチが環境の変化や不確定性にうまく対応できていないことを
見たものといえる。
•
ログフレームも変化の理論の一種だと見ることができるが、変化の
理論を活用ことでより柔軟に環境の変化に対する対応を構想するこ
とができる。
•
ガバナンス、能力強化、組織の変化、政策形成など、従来のログフ
レーム的なアプローチが成立しにくい分野でのプログラムが増えて
きたこともこの流れと関係している
•
こういった環境が変化するなかで事業を実行しているときのアウト
カムについて考える手法のひとつとして、Outcome Harvesting が編
み出されている。Outcome Harvesting は、あらかじめ特定された目
的をもとに事業のアウトカム達成度を見るのではなく、「起きたこ
と」を綿密に拾い上げていくことで、その「起きたこと」と事業の
関連を見ていこうとするもの(6)
。
2.4. 変化は遅い
•
評価の専門家集団が存在し、ひとつの産業として成立しているせい
か、時代の流れに比べて変化は遅い。
•
例えば、企業やベンチャー・フィランソロピー、投資家の間で関心
が高まっているソーシャルインパクト関連の動きに対しても、評価
学会等の反応はあまり勢いがない。これは、評価の世界がおもに政
府系の資金で成り立っていることに起因するのではないか。
•
同様に、緊急人道支援の分野では ALNAP が中心になって評価の仕組
みを確立しており(7)
、その分野と開発を中心とした評価の世界の
交わりもあまりないようだ。
2.5. EvalPartners
19
•
そんななかで、EvalPartners が中心になって途上国の CSO の評価能
力を高めようと尽力しているのは注目に値する。なかでも、2015 年
を国際評価年と位置づけて様々なイベントが企画されている。
参考文書 (1)http://www.outcomemapping.ca
/リンク
(2)“Broadening the range of designs and methods for impact
evaluations,” http://r4d.dfid.gov.uk/Output/189575/
(3)http://www.bond.org.uk/effectiveness
(4)http://www.interaction.org/work/monitoring-evaluation
(5)http://www.bond.org.uk/effectiveness/value-for-money
(6)Outcome Harvesting については、以下など。
http://www.outcomemapping.ca/resource/outcome-harvesting#inline_en
http://betterevaluation.org/resource/overview/OutcomeHarvesting
http://aea365.org/blog/ricardo-wilson-grau-on-outcome-harvesting/
(7)http://www.alnap.org
20
ヒアリング4
機関・団体
面談相手
Keystone Accountability
David Bonbright
[email protected]
Chief Executive
面 談 の ポ イ 1)本人について
ント
•
Bonbright 氏は、Keystone Accountability の代表として、変化の
理論、事業受益者フィードバックなどで概念の普及、ツールの開
発を行っており、財団や国際機関に一定の影響力をもっている。
筆者とは旧知の仲。
2)評価の潮流について
2.1. マネジメント・ツールとしての評価
•
評価は役に立たなければ意味がない。その点で、注目すべきは
CSO の世界にパフォーマンス主義、成果主義を浸透させようとし
ている一派だ。
•
例えば、Performance Imperative(1)
。CSO のハイパフォーマン
スのための「7つの条件」を提示しているが、そのなかには「学
びの文化」
、
「内部のモニタリングと改善」
、「外部者による評価」
が含まれている。
•
例えば、Giving Evidence(2)。著者の Caroline Fiennes は、通
常、評価は「やりすぎ」で要らない情報がたくさん出ていると指
摘する。
•
マネジメント・ツールとしての評価を浸透させるには、もっと内
部評価をやらなければいけない。現状は、やらされている外部評
価が多い。
•
むしろ必要なのは、KPI をしっかり作り、リアルタイムでフィー
ドバックを得て、それを即学びや改善に結びつけることだ。ICT
革新で、リアルタイムのフィードバックは可能になっている。
•
こういったことを推奨するために、Feedback Lab を立ち上げた
(3)
。
参 考 文 書 / (1)http://leapofreason.org/performance-imperative/about-pi/
リンク
(2)http://www.tinyspark.org/podcasts/poor-data-caroline-fiennes/
(3)http://feedbacklabs.org
21
ヒアリング5
機関・団体
面談相手
Independent Evaluation Office,
UNDP (United Nations Development Programme)
Fumika Ouchi
Evaluation Advisor
面 談 の ポ イ 1)本人について
ント
•
[email protected].org
1998 年から国連機関等で評価の仕事に携わっており、世界銀行
研究所、国連麻薬犯罪事務所(UN Office on Drug and Crimes)
、
国際原子力機関(IAEA)
、現在の国連開発計画(UNDP)独立評
•
価事務所(Independent Evaluation Office, IEO)と歴任している。
UNDP では国別、テーマ別、地域/グローバル単位で事業評価を
行っているが、IEO は、スタッフ 20 人(評価専門家 10 人)の小
さな事務所。UNDP の指示系統に組み込まれるのではなく、直接
理事会に報告する機構になっている。
2)UNDP の評価について
•
UNDP では国別プランを 4-5 年のサイクルで作成するが、その評
価に関して National Reference Group (NRG)をつくり、政府、ド
ナー、受益者、CSO などに入ってもらってプランの妥当性等を審
議してもらう。NRG を評価の一連のプロセスに巻き込むことに
よって、サイクルの最初から最後までステークホルダーとの協議
の場が保たれるようになった。
•
UNDP では国ごとおよび地域(Regional Bureau)ごとに M&E
(モニタリングと評価)の担当官をおいているが、専門性にバラ
ツキがあり、全体の底上げが課題となっている。
3)評価の潮流について
3.1. インパクト評価について
•
ドナー(DfID=英国、SIDA=スウェーデンなど)からのプレッシ
ャーは強い。ただし、UNDP のプログラムの性格として、i) 単体
ではなく他の国連機関や他の機関と共同事業をやっている場合が
多く、UNDP の貢献度を抽出するのが難しい、ii) ガバナンス関
連のプログラムが多いので、インパクト評価がしやすい種類の事
業ではない、などの理由であまり普及していない。
•
ただし、GEF (Global Environment Facility) においては RCT(ラ
ンダム化比較試験)を活用するようになってきている。
22
3.2. 変化の理論(Theory of Change)の活用が奨励されるようになっ
てきている。
•
従来のログフレームと違い、事象が単線系(linear)でなく複雑
系(complex)であることにより対応しているから。また、事象
に関わるステークホルダーの存在や関わりの程度を明示化するこ
とで、どのステークホルダーといついかに協議すべきなのかを示
唆してくれる。
•
UNDP において NRG の手法が主流化していったのが 2012 年頃。
関連して、世銀や国際機関は参加型評価を多用するようになって
きている。
3.3. 評価に関する関心が全般に高まっている。
•
評価者以外が評価の重要性に気付き、視点や手法をプログラム運
営に取り入れるようになってきており、もはや評価は評価者の専
管事項ではなくなりつつある。
•
その意味でも、評価のトレーニングの需要は高まっており、その
重要性は増している。国連機関では、IPDET のトレーニングをよ
く活用している(1)。
参 考 文 書 / (1)http://www.ipdet.org
リンク
23
ヒアリング6
機関・団体 UNEG (United Nations Evaluation Group)
面談相手
Jin Zhang
[email protected]
UNEG Programme Specialist
面 談 の ポ 1)UNEG について
イント
•
国連機関における評価を横断的に扱い、情報交換、規準の設定、評
価能力の底上げなどを担う機関として、1984 年に前身の‘Inter-
Agency Working Group on Evaluation が設立。2003 年に UNEG と改
名。
•
現在の活動の指針は 2005 年に作成された「規範(Norms)」および
「規準(Standards)」文書に規定されている(1)
。
•
昨年(2014 年)
、重点分野として人権とジェンダーの平等に配慮し
た評価に関するガイダンス文書を作成した(2)
。
2)国際評価年について
•
2013 年 9-10 月、ブラジルで開催された第3回国家評価能力国際会
議において、2015 年を国際評価年とすることが決定した(3)。こ
れを受けて、2014 年 12 月には、国単位での評価能力構築を推進す
る国連総会決議が承認されている(4)。
参 考 文 書 (1)
/リンク
http://www.uneval.org/document/detail/21#
http://www.uneval.org/document/detail/22
(2)http://www.uneval.org/document/guidance-documents
(3)http://www.nec2013.org
(4)
http://www.unevaluation.org/mediacenter/newscenter/newsdetail/105
24
ヒアリング7
機 関 ・ En Compass, LLC
団体
11426 Rockville Pike, Suite 229, Rockville, MD 20852
米国メリーランド州
面 談 相 Tessie Catsambas
手
President
面 談 の 1)本人について
ポイン •
ト
[email protected]
個人コンサル会社 En Compass LLC の代表。評価分野で 25 年の経験。特
に質的評価や AI(Appreciative Inquiry)の専門家。米国評価学会(AEA)に
面談を打診して紹介された。
•
•
下記の EvalPartners に関して、2012-14 の3年間、AEA の代表として、
IOCE に参画し、EvalPartners の設立に関わった。
本人の略歴は(1)
。
2)評価の潮流について
2.1. 評価のプロ化の確立と広がり
•
評価がプロの仕事として確立したのはここ 20 年程のことだが、「科学的」
とされる手法と組織論・経営論との関連で成長してきた。
•
公的資金投入における Value for Money (VfM、価値の最大化)の流れが強
くなり、評価の要請も強化され、その結果評価に多くの資金がつぎ込まれ
るようになった。
•
国際開発の分野において、USAID(米国国際開発庁)、DfID(英国国際開発
庁)などの援助機関が VfM を打ち出し、それに呼応するように大手の開発
NGO が評価を強化し、それが途上国の NGO にも伝播する形でトリクルダ
ウンが起こり、評価の要請が広がって行った。
•
同時に、途上国国内での評価の能力強化の必要性が言われるようになり、
アジア、アフリカ、ラテンアメリカなどの地域ごとの評価専門家機関
(VOPEs = Voluntary Organizations of Professional Evaluators)を通じて評価
のプロの養成が行われるようになっていった。
2.2. EvalPartners と国際評価年
•
上記の流れに乗って、CSO の評価能力強化の必要性が言われるようにな
り、UNICEF(国連児童基金)と IOCE (International Organization for
Cooperation in Evaluation) が共同で、2012 年に EvalParters (国際評価パ
ートナーシップ・イニシアチブ)を設立した(2)。EvalPartners の目的
は、世界各国において CSO の評価能力と政策・世論形成能力の強化を図
り、その結果として国レベルの政策が客観的な事実に基づいて形成される
25
ようになること。EvalPartners では特に公平性(equity)とジェンダーの
平等、社会正義の実現に力を入れると、設立の際に採択されたチェンマイ
宣言に記されている(3)
。
•
EvalPartners が母体となって、国連ミレニアム開発目標(MDGs)から持
続可能な開発目標(SDGs)へと交代する年であり、新たな開発目標へのモ
ニタリングの機運の高まりが見られる 2015 年を国際評価年と定めた
(4)
。
•
このような流れのなかで、Catsambas 氏も共編者となって、評価のための
環境整備を加速させるためのツールキットを作成するなど、CSO による評
価を充実させていこうという動きがグローバルなレベルで結実しつつある
(5)
。
2.3. 変化の理論や評価可能性のアセスメントなど、事業の入口で評価の視点を
入れた介入を行うことの有効性に関する認識が高まっている。
2.4. RCT(ランダム化比較試験)など、評価の「科学」的運用を比較優位と捉え
る潮流は強く、そういった手法に資金も集まりやすい。
参 考 文 (1)http://www.encompassworld.com/blog/authors/tessie-tzavaras書 / リ catsambas
ンク
(2)http://mymande.org/evalpartners/the-international-evaluationpartnership-initiatives
(3)
http://www.ioce.net/en/PDFs/Chiang%20Mai%20Declaration%202012.pdf
(4)
http://mymande.org/evalyear/Declaring_2015_as_the_International_Year_of_Eval
uation
(5)
http://www.mymande.org/sites/default/files/toolkit/UNICEF%20NY_Advocating
%20for%20Evaluation_Web_1.pdf
26
ヒアリング8
機
The Evaluators’ Institute
関・ The George Washington Univ.
団
体
面
談
相
手
面
談
の
ポ
Ann Doucette
Director
[email protected]
1)本人および TEI(The Evaluators’ Institute)について
•
Ann Doucette 氏は、TEI のディレクターで、評価と保健政策の専門家。医
療、学校関係の評価事業でのアウトカム測定の経験が豊富(1)。
•
イ
TEI は ジョージ・ワシントン大学にあり、1996 年に始動。現在数種類の
認定評価士コースを開講している。姉妹機関として、他機関と連携して評
価事業を行う The Midge Smith Center for Evaluation Effectiveness がある
ン
ト
(2)
。
2)評価の潮流について
2.1. ソーシャルメディア等を通じたデータ取得
•
従来、評価においての悩みの種の一つはいかにデータを取得するかだった
が、ICT 革新によって、データは容易に手に入るようになってきている。
これはまさにデータ革命の名にふさわしい。
•
ただし、統計的手法もないままやみくもにデータを集める向きもあり、信
頼できるデータを取るには専門性が必要だということをよく知らなければ
いけない。
2.2. 量的方法重視と質的方法重視の意見の相違
•
評価の世界ではこれが一番の対立点だが(イデオロギー対立と言ってもよ
い)
、今も解消していない。
•
量的方法では、やはり RCT(ランダム化比較試験)やそれに準ずる実験的
手法への信仰は強い。私見では、2000-08 年のブッシュ政権時代に公立学
校が RCT で評価を行うことを義務化し、その流れが今も続いていると考え
ている。
•
質的方法では、MSC(Most Significant Change)、AI(Appreciative Inquiry)、
CAI(Critical Appreciate Inquiry、AI が「何が起きたか」に注目するのに対
し、CAI は「何が起きなかったか」に注目する)など、手法の改善が見ら
れている
27
•
評価の専門家が増えるにつれ、量的、質的を問わず手法を増え、手法過多
とでも呼べる現象が起こっているのではないか。
2.3. 展開評価(Developmental Evaluation)
•
注目すべき動きに、展開評価がある。これは、パットンが「実用重視」の
流れで開発した評価の種類で、特に複雑な事象において目標設定や介入の
仕方が単純には決められないような事業の評価に適している(3)
。
2.4. ソーシャルインパクト評価の流れへの注目
昨年ぐらいより、企業の社会活動評価の流れ(インパクト投資等)に評価の世
界が注目するようになってきている。昨年の米国評価学会(AEA)の大会では、
ソーシャルインパクトや SROI に関するセッションがいくつか見られたが、こ
れは新しいことだ。
2.5. その他の新しい動き
•
政治学の分野で活用されていた process tracing が評価の世界で注目さ
れ、評価専門家が使うようになってきている。事業の結果から政策決定の
有効性をトレースする手法。
•
事業評価に関しては、アウトカムやインパクトをいかに測るかに多くが関
心を払ってきたが、近年、知識の生成、共有、管理といった評価の活用が
見直されてきていると思う。
参
(1)https://tei.gwu.edu/about-tei
考
(2)https://tei.gwu.edu/about-mscee
文
(3)Michael Quinn Patton, 2011, Developmental Evaluation, New York: The
書
/
リ
ン
ク
Guilford Press (http://www.guilford.com/books/DevelopmentalEvaluation/Michael-Quinn-Patton/9781606238721)
Developmental Evaluation については、ほかに以下参照
http://betterevaluation.org/plan/approach/developmental_evaluation
https://www.scribd.com/doc/8233067/Michael-Quinn-Patton-DevelopmentalEvaluation-2006
http://www.fsg.org/tabid/191/ArticleId/708/Default.aspx?srpush=true
http://tamarackcommunity.ca/downloads/vc/Developmental_Evaluation_Primer.
pdf
http://mcconnellfoundation.ca/assets/Media%20Library/Publications/DE%202
01%20EN.pdf
28
ヒアリング9
機関・団体
面談相手
FSG
Hallie
Preskill,
Managing [email protected]
Director(在シアトル)
Jennifer
Splansky
Juster, [email protected]
Director, Collective Impact
Forum (在サンフランシス
コ)
コンタクト先
Dane
Smith,
Managing
([email protected])
アシスタント
Director
Rany Chin ([email protected])
面談のポイ 1)FSG と Aspen Institute による Collective Impact Forum (CIF)につい
ント
て
•
FSG では、企業の戦略づくりで培った知見と、システムの変化がい
かに起こるかの研究などを題材に、CIF 構想を練った。大きな規模
でシステムの変化を起こそうと思ったら、組織単体ではなく、よ
り大きな単位でビジョンの共有、測定指標の共有などが起こらな
いといけないと考えたため。
•
従って、FSG には、Preskill 氏のような評価の専門家もいるが、CIF
はむしろ FSG の戦略ワークから出てきたもの。
2)CIF の実際の運用について
•
現在はまだ試用段階で、いくつかのケーススタディーを集めてい
る。
•
すでに、なにがシステムの変化を促すか、重要な要因は見えてき
ている。それには、責任あるリーダーシップ、適切なネットワー
ク、緊急意識の共有、適切な資源などが含まれる。
参考文書/ CIF に関しては、FSG のホームページに各種資料が存在する。
リンク
https://www.collectiveimpactforum.org
29
ヒアリング10
機
関
・
団
Aspen Planning & Evaluation
The Aspen Institute
体
面
談
相
手
David Devlin-Foltz
Executive Director
面
1)本人について
談
•
Aspen Institute で長く評価、特にアドボカシー評価の分野で活動してお
り、開発した Advocacy Progress Planner は知られている(1)。
の
ポ
イ
2)評価の潮流について
ン
2.1. ビッグデータの影響
ト
[email protected]
•
ICT 革新で、データを時間が経ってではなく、リアルタイムで取れるよう
になったことは大きい。
•
これを評価に関連する動きに結びつけようとしているもので注目すべきも
のに Feedback Lab (2)や Accountability Lab (3)がある。ともに
Lab という命名からわかるように「実験室」的試みで、前者は、事業の受
益者のフィードバックをリアルタイムで事業実施者等に還元する仕組みを
模索しており、後者は、同様の試み(受益者に限らず市民一般からのフィ
ードバック)を説明責任のテーマでしている。
2.2. 展開評価(Developmental Evaluation)
•
事象が複雑なのにログフレームなどの単純な因果関係の評価図式が主流と
いう評価の現状に一擲を投じた功績は大きい。
2.3. 企業のソーシャルインパクト
•
インパクト投資等の流れは、いかに測定を効果的にやるかという点におい
て評価の知見に注目し、少なくともここ数年活用している。
3)その他
•
Collective Impact Forum について。組織単体ではなく、地域とかを面で見
てそこに共通のビジョンや評価手法を適用しようとする発想は、Aspen の
30
なかでおこなれている Voices from the Field の一連の仕事の功績が大きい
(4)
。
•
2005 年のパリ宣言以降、カントリー・オーナーシップが言われ、昨今は
「カントリー」は政府だけでなく CSO や市民が含まれることが当然視され
ている。その流れで、評価についてもローカル・オーナーシップが言われ
ており、それ自体は好ましい(5)
。しかし一方、評価への参加には時間と
手間がかかり、
「現場」の声としては、「生活していくのがやっとなんだか
ら、参加はいいからどうすればうまくいくのか教えてくれ」といった声も
聞かれているようだ。
参
(1)http://planning.continuousprogress.org
考
(2)http://feedbacklabs.org
文
(3)http://accountabilitylab.org/learn-AboutUs.html
書
(4)http://www.aspeninstitute.org/publications/voices-field-iii-lessons-
/
challenges-two-decades-community-change-efforts
リ
ン
ク
(5)例えば、InterAction は、今年(2015 年)に入って、Local Ownership in
Evaluation を発行している
(http://www.interaction.org/sites/default/files/Local%20Ownership%20in%2
0Evaluation%20-%20FINAL.pdf)
31
ヒアリング11
機
関
・
Center for Evaluation Innovation
団
体
面
談
相
手
Julia Coffman
Director
面
1)本人について
談
•
[email protected]
アドボカシー評価、政策評価、システム評価などの分野の専門家。特に米
の
国民間財団とのつながりが強く、先進的な財団と共同で評価の革新につい
ポ
て発信している(1)
。
イ
ン
2)評価の潮流について
ト
2.1. 戦略的フィランソロピーの反動
•
2000 年代後半ぐらいから、米国の大手財団は戦略的フィランソロピーのか
け声のもと、アウトカムやインパクトをそれまでより前面に打ち出した選
択的な助成活動を行うようになった。しかし、社会は「機械」のようには
動かず、いろいろな所で軋轢のもとになった。
•
その反動が今起こっている。複雑な社会に見合ったプログラム構築や評価
のためには、違った手法が必要ということで注目されているのが展開評価
(Developmental Evaluation)の流れ。
2.2. 評価の「王道」と対抗軸の関係
•
評価の「王道」は依然として RCT(ランダム化比較試験)に代表されるよ
うなインパクト評価。VfM(Value for Money) の目からは、政策決定者の構
想通りの結果が効率良く出たかで事業の善し悪しが判断される。
•
一方で、より開かれた視点で、起きている事象から学び、それを体系化し
ようとする試みは評価の主流にはならないが、確かな一派を形成してい
る。
3)その他
CEI では、財団の評価に関する情報交換のための「評価ラウンドテーブル」を定
期的に開催しており(2)
、その関連で、財団の評価の動向に関して出版物を出
している(3)
。
32
参
(1)http://www.evaluationinnovation.org/about-us/staff
考
(2)http://www.evaluationroundtable.org
リ
(3)例えば、
ン
http://www.evaluationinnovation.org/sites/default/files/Benchmarking%20Eval
ク
uation%20in%20Foundations.pdf
33