ベンフォードの法則

統計学

ベンフォードの法則とは

ベンフォードの法則(Benford’s law)とは、数値データの先頭桁(一番左の数字)が特定の確率分布に従うという法則です。1938年にアメリカの物理学者フランク・ベンフォードが提唱しました。

世の中にはいろんな数字が存在します。その数字の先頭桁の数字は一様になるのではなく、特定の偏りになるとした法則です。

 

法則うさぎ
法則うさぎ

世の中に存在する数字には法則があるんだ!

イトケン
イトケン

一律に存在する気もするけどね。実際はそうじゃないんだわ。

 

 

世の中の数字、最初の1桁だいたい「1」説

例えば、あるデータセットに含まれる数値が次のようになっていたとします。

123
245
37
891
634

これらの数値の先頭桁は、それぞれ1, 2, 3, 8, 6になります。そして、ベンフォードの法則に従うと、1から9までの数字の先頭桁の分布は、次のようになることが予測されます。

「1」→ 約30.1%
「2」→ 約17.6%
「3」→ 約12.5%
「4」→ 約9.7%
「5」→ 約7.9%
「6」→ 約6.7%
「7」→ 約5.8%
「8」→ 約5.1%
「9」→ 約4.6%

先頭桁の数字が1~9まで均一になるのかと思いきや、なんと世の中の数字の30%は「1」であるという事実。どうしてこんな偏りが生まれるのでしょうか?

世の中の数字には数としての成長を示すものがあります。(対数的成長)
例えば震度1よりも震度4のほうが大きな地震です。数字が大きくになるにつれてその規模も成長しています。しかし、地震の発生頻度は震度1が高く、震度4は低い。つまり、数字が大きいほど出現率が低くなるということです。
経済成長率や人口増加率、川の長さ、モニュメントの大きさなど、同じように数字が大きいほど希少になるので、このような偏りが生まれるという説があります。

他にも単位の問題であるとか、多重確率分布の問題であるとか、これまでベンフォードの法則は様々な観点で説明されてきました。

 

 

自然な数字かどうか

ベンフォードの法則は、さまざまな分野で応用されています。

会計監査
会計データや財務データにおいて、数字の捏造や不正を検出する手法としてベンフォードの法則が利用されています。もしデータが法則から大きく逸脱している場合、そのデータに異常がある可能性が高くなります。

自然現象の研究
科学の分野でも、ベンフォードの法則が利用されています。例えば、地震の震度や川の流量など、自然現象のデータがベンフォードの法則に従うかどうかが調査されることがあります。

経済データ分析
経済データの先頭桁の分布を分析することで、経済の動向やパターンを読み取る研究が行われています。ベンフォードの法則を用いることで、経済指標の信頼性やデータの正確性を検証することが可能です。

ベンフォードの法則は、数値データの先頭桁の分布に関する興味深い法則です。その規則性を活用することで、データの異常やパターンを検出するための強力なツールとなることがあります。経済や科学、会計など、さまざまな分野でベンフォードの法則が活用されており、データ解析において重要な役割を果たしていることがわかります。

(参考文献)
鈴木貴博「米大統領選は不正だらけ」根強い都市伝説を裏付ける奇妙な証拠 ダイヤモンドオンライン(2020)
Frank Benford . “The law of anomalous numbers”. Proceedings of the American Philosophical Societ(1938)

コメント

タイトルとURLをコピーしました