統計量にはどういう必然性があるか

最近刊行されたぼくの本が、二冊とも増刷になった。
7月に刊行された黒川信重先生との共著『21世紀の新しい数学』技術評論社は刊行1ヶ月で増刷、8月に刊行された単著『世界は2乗でできている〜自然にひそむ平方数の不思議』講談社ブルーバックスは、なんと、刊行2週間で増刷になった。

特に後者は、企画から約20年たってやっと日の目を見た本なので、とても嬉しい。さらには、もしも科学に興味のある中高生が手にしてくれているのなら、なおさら嬉しいのだけど、さすがにそれはわからない。この本については、前々回(来週、新著『世界は2乗でできている』が刊行されます。 - hiroyukikojimaの日記)は全体の内容の紹介を、前回(新著が刊行されました!+おまけ(山本義隆先生の思い出) - hiroyukikojimaの日記)は物理方面の内容の紹介をしたので、今回は統計学方面の内容について紹介しようと思う。わずか1つの章に過ぎないが、本書では統計学を解説している。
 数学・物理に加えて、統計学を仕込んだのは、統計学がまさに2乗計算満載だからだ。それで、第7章は「ピアソンとカイ2乗分布」と題して、統計学の秘訣を伝授することにしたのであ〜る。
 実はちょうどこの本を書き上げた頃に、日経新聞から「やさしい統計学」という連載をオファーされた。これは、これまで「やさしい経済学」として連載をしていたコーナーを、統計学を題材にしようという日経の新企画であった。担当編集記者のかたは、拙著『完全独習 統計学入門』ダイヤモンド社を読んで、ぼくに皮切りの連載を依頼してくださった。連載は、7月18日〜8月2日に全11回で掲載された。連載の全体の7割は、『完全独習 統計学入門』の内容から、残る3割は、『世界は2乗でできている〜自然にひそむ平方数の不思議』の第7章の内容から解説を行った。
完全独習 統計学入門

完全独習 統計学入門

この統計学の入門書は、(自分でいうのもなんだが)いろいろ斬新な試みをしている(詳しくは統計学の面白さはどこにあるか - hiroyukikojimaの日記参照)。統計学の手法を図形的なイメージ化してもらうために、あえて「確率」を捨て、母集団を単なる「データの集合」として図形化した。こうすることで、標本からの統計量と母集団の統計量とを「同一に」扱うことができるようになった。それによって、記述統計(データの特徴をあぶり出すこと)と推測統計(母集団のパラメーターを推定すること)が、同時並行的に解説できるようになった。
この際に、最も悩んだのが、「分散をどう定義するか」という問題だ。標本分散は、普通の教科書では、偏差(=データから平均値を引いたもの)の2乗の和を(データ数から1を引いた数)で割り算する。そして、その正の平方根をとったものが標本標準偏差と定義される。問題は、データ数から1を引くことをどう説明するかだ。(数理統計学でない)普通の統計学の教科書では、「そうやるもの」「それは定義」と天下りで押しつける。しかし、ぼくは自分の教科書ではそれをしたくなかった。確率概念を抜いているので、説明しにくい上、記述統計との間で齟齬を起こすことになるからだ。それで、ぼくの本では標本分散を、単にデータ数で割る方法で定義したのだ。(ちなみに、この解説方法は、ホーエルの本で試みられている)。
案の定、日経の連載をしているとき、読者からこの点についての質問が来た。その質問も、「わかっているが念のために」という感じではなく、「理由も知らずに、そう暗記していて、それと違うから指摘してきた」という雰囲気だった。
この標本分散の問題を説明するには、結局、「統計量にはどういう必然性があるか」という、いわゆるreasoningの問題に触れざるを得ない。データ数から1を引いた数で割る分散は、不偏分散と呼ばれ、「何回も繰り返して平均をとると、母集団の分散(母分散)に近づく(要するに、期待値が母分散になる)」という不偏性を持たせたものである。つまり、そういう必然性を課した推定量ということなのである。
一方、不偏性でなく、「最尤性」を重んじる推定量もある。「最尤性」というのは、「母集団を特定の確率モデルに特定した場合に、観測された標本たちが生起する確率が最も大きくなるようなパラメーターを表す推定量」ということである。日経の連載では、次のような例を挙げた。
今、「できごとAが起きる・起きない」だけが結果となる不確実現象を考えよう(2項分布)。10回試行して、そのうち4回Aが起き、6回起きなかったとする。そのとき、「Aが起きる確率」pを推定したいなら、それはp=4÷10=0.4と推定するのが自然だろう。これは平均値という統計量である(起きたら1を、起きなかったら0を記録して、平均をとったもの)。この平均計算の必然性は、最尤性によって与えることができる。パラメーターpを0から1まで動かしたとき、「10回試行して、そのうち4回Aが起き、6回起きない」ということが起きる確率が最も大きくなるのはp=0.4のときだからだ。(2項分布の確率をpで表し、微分してみればわかる)。これが最尤推定量の「思想」なのである。つまり、「世の中で起きていることは、最も観測されやすいこと」、言い換えれば、「世の中で観測されることは、最も平凡なこと」、そういう「思想」なのだ。
 分散については、例えば、母集団を正規分布とした場合、(データ数から1を引いた数)で割るのではなく、データ数そのもので割る分散のほうが、母分散の最尤推定量になるのである。つまり、最尤性を必然性として課すなら、偏差の2乗の合計をデータ数そのもので割るという自然な計算が、母分散の推定量として定義されるべき、ということになるのだ。日経の連載では、統計量の必然性としてこの「最尤性」を採用し、その最も簡単な前述の2項分布のケースを解説しておいた。なので、先ほどの読者からの質問にも、簡単に答えることができたのだ。
ぼくの統計学の教科書『完全独習 統計学入門』ダイヤモンド社は、基本的に、この「最尤性」を念頭に置いて解説を繰り広げた。もちろん、確率モデルを抜いているので、表だって打ち出しているわけではないが、全体としてこの「思想」を隠し味として練り込んであるのである。
 そして、この「最尤思想」を全面に打ち出して統計学を解説したのが、『世界は2乗でできている〜自然にひそむ平方数の不思議』の第7章である。ここでは、数学者ガウスが、最尤思想を使って、観測誤差の分布は正規分布である「べきだ」とした考え方を解説した。非常に奇妙で、ある意味で飛躍した論法なのだが、最尤原理の萌芽となった重要な研究なのである。重要であるにもかかわらず、これを解説した本はほとんど見かけない。他に、ピアソンのカイ2乗分布による適合度検定の理論(これもみごとな2乗計算)なども紹介しているし、統計物理における最尤原理のあり方にも触れているので、お楽しみいただきたい。この第7章を読んだうえで、『完全独習 統計学入門』ダイヤモンド社をお読みいただけば、ぼくがこの本に塗り込めた隠し味もより深く味わうことができること請け合いだ。