2019/03/04の話:同様に確からしいってなんだ?


■「同様に確からしい」は「等確率」ではだめか?」

以前Twitterにて次のような疑問を投げかけました.

“「同様に確からしい」という言葉は煩わしい.「等確率」ではだめだろうか?”

個人的に「等確率」と呼ぶことになにかしらの問題点があるだろうということは何となく感づいてはいましたが,確率論に触れた経験がほとんどない私にとっては,それがよくわかりませんでした.

そこで,数学では「確率」というものがどう定義されているのかをちょっと調べました.以下には個人的な見解もあり,それが誤っている可能性もあるので,そのときはツッコミしてください.

■「確率」と「同様に確からしい」

まず,直感的にはある事象 $ A $ の確率は,全事象 $ X $ の大きさに対する $ A $ の大きさの割合を表すものと考えられます.例えば,コインの表がでる確率というものは,
\begin{equation}
\frac{\sharp\jb{表}}{\sharp\jb{表,裏}}=\frac 12
\end{equation}
になります.しかしあくまでコインに偏りがない場合です.

では偏りがないとき,表の確率も裏の確率も同程度であるとなぜいえるのでしょうか?  $ 1/2 $ という確率は「表が出るのも裏が出るのも同様に確からしい」という仮定の下で導きだされる値ですが,しかしそもそも確率を計算しなければ「同様に確からしい」とは言い切れないのではないか? 深く考えるとそのような循環的思考に陥ってしまいます.

「同様に確からしい」という仮定の下で確率が定義されるのか,それとも確率がすでに決まっている上で「同様に確からしい」という言葉が定義されるのか?

「同様に確からしい」という用語を確率を使って定義することができないのなら,いったい「同様に確からしい」はどう数学的に定義すればいいのか?

確率論に疎かった私には,この辺りが疑問として残っていました.そこで,基本に立ち返り,数学的な確率の定義を調べました.結論から言うと「確率」は数学的に明快な定義が与えられていましたが,「同様に確からしい」という語は純粋数学的な用語ではない,人間的解釈に依存した言葉なんじゃないかと思えてきました.

■ 確率の数学的定義

確率という概念は実は,ものすごく簡潔に定義されています.次のような感じです.


【確率の定義】
全測度が $ 1 $ の測度空間 $ (\Omega,\mathcal F,\mu ) $ を確率空間と呼び, $ A\in\mathcal F $ に対する $ \mu (A) $ の値を $ A $ の確率と呼ぶ.


定義はたったこれだけです.これを見ると,確率を定義するために「同様に確からしい」という言葉はでてきていません.ただ,この定義はいわゆる「数学語」で書かれているため,本当にそうなのかはもう少し吟味して見なければわかりません.

まず $ (\Omega,\mathcal F ,\mu) $ を測度空間と呼んでいますが,そもそも測度空間とはなんでしょうか? まず $ \Omega $ とか $ \mathcal F$ などがどのようなものなのかを説明しなければなりません.

$ \Omega $ はものの集まり,つまり集合です. $ \mathcal F$ は $ \Omega $ の部分集合を集めたもの,そして $ \mu $ は $ \mathcal F$ から $ \rea\two\geq 0 $ (非負の実数集合)への関数です.

簡単に言うと,測度空間における $ \mathcal F $ と $ \mu $ は, $ \Omega $ の部分集合に面積や体積などといった「量」を与えるものです.まず $ \mathcal F $ は $ \Omega $ の部分集合の中で「量」を測定可能なものの集まりで,そして $ \mu $ が実際にその量を測定し,実数値を返す関数です.

むろん,測定値を返す関数である $ \mu $ がハチャメチャなものであっては面積や体積といった概念と同列に扱うことができなくなります.それを防ぐために,測定器である $ \mu $ には条件が定められています.それは$\mu(\es)=0$であることと,完全加法性と呼ばれる次の性質です: $ A\f 1,A\f 2,\ldots \in\mathcal F $ が交わらないとき,
\begin{equation}
\mu(A\f 1\cup A\f 2\cup\cdots )=\mu(A\f 1)+\mu(A\f 2)+\cdots
\end{equation}
でなければなりません.このような条件を持った $ \mu $ を測度と呼びます.

このような,「測定可能なもの」 $ \mathcal F $ と「測定器(測度)」 $ \mu $ を兼ね備えた集合 $ (\Omega,\mathcal F,\mu) $ を測度空間と呼ぶわけです.例えば平面 $ \rea\ef 2 $ に,面積が測定可能な集合族 $ \mathcal F $ と ,$\mathcal F$の要素に面積値を与える関数 $ \mu $ を兼ね備えた $ (\rea\ef 2,\mathcal F,\mu) $ も測度空間になります(この辺りの話はルベーグ測度など,込み入った話がありますがいまは深く立ち入りません).

話を確率に戻します.まず確率空間というのは全測度が $ 1 $ の測度空間のことだと言っていますが,つまり $ \mu (\Omega)=1 $ となるような測度空間 $ (\Omega,\mathcal F,\mu ) $ を確率空間と呼ぶわけです.この空間において測られる量こそ「確率」というわけです.すなわち「確率」は「面積」や「体積」といったものと,ほとんど同列な概念として定義されていたのです.

さて,確率空間 $ (\Omega,\mathcal F,\mu) $ において, $ \mathcal F $ が確率を測定可能なものの集まりであり, $ \mu $ が確率を測定する関数ですが,この $ \mathcal F $ の要素のことを事象と呼びます.

ここまでの定義を見ると,確率を定義するのに「同様に確からしい」といった言葉は出てきていません.一つ確率空間と確率の例を挙げてみたいと思います.

$ \Omega $ を $ \jb{表,裏} $ として,
\begin{eqnarray}
\mathcal F&=&\jb{\es,\jb 表,\jb 裏,\Omega}\\
\mu (\es)&=&0\\
\mu (\jb 表)&=&1/2\\
\mu (\jb 裏)&=&1/2\\
\mu (\jb{表,裏})&=&1
\end{eqnarray}
とします.すると $ (\Omega,\mathcal F,\mu) $ は確率空間を成し, $ \jb{表} $ という事象の確率は $ 1/2 $ となります.しかし次のように $ \mu $ を設定してみましょう.
\begin{eqnarray}
\mu(\es)&=&0\\
\mu(\jb 表)&=&0.1\\
\mu(\jb 裏)&=&0.9\\
\mu (\jb{表,裏})&=&1
\end{eqnarray}
これでも $ (\Omega,\mathcal F,\mu) $ は確率空間を成します.そして $ \jb{表} $ という事象の確率は $ 0.1 $ となっています.

このように確率というものは,確率空間というものが設定されたはじめて定義される概念であり,測度空間が確率空間となるための条件の中に「同様に確からしい」という言葉は一切出てきていません.言い換えれば,数学では,「実際に得られる値」を調べることで「 $ \mu $ が確率と呼べるかどうか」を判断しているのではなく, $ \mu $ が測度としての性質と $ \mu(\Omega)=1 $ を満たしているかどうかでそれを判断していることがわかります.


■では「同様に確からしい」とは何か?


そこで,ここまでの話を前提に,「同様に確からしい」の定義を試みてみました: $ \Omega $ を有限集合, $ \mathcal F $ を $ \Omega $ のすべての部分集合として, $ \Omega $ の任意の要素 $ a,b $ に対して
\begin{equation}
\mu(\jb a)=\mu(\jb b)
\end{equation}
であるとき, $ \mathcal F $ は同様に確からしい事象の集まりであると定義します.(注:この定義は私がいま勝手に思いついたものです.一般的なものではない可能性があります.)こうすれば,「同様に確からしい」は確率空間が定められた後に定義される概念であり,「等確率」と呼んでも差し支えないと思います.

しかし,この定義でも少し違和感が残ります.それは「この確率空間はどうやって設定されたのか?」ということです.同じ事象を扱うにしても,確率空間の設定の仕方はいくつもあります.任意の $ a,b\in\Omega $ に対して $ \mu(\jb a)=\mu(\jb b) $ となるような確率空間を設定するためには,実際の事象が「同様に確からしい」ということを確認しなければならないはずです.

つまり,結局「同様に確からしい」という概念は,具体的に起こる事柄から確率空間を設定するまでの間の話であり,それは人間の判断で行われることだということになると思います.そして,確率というのは確率空間を設定した後の話と言うことになります.

例えば「あるできごと $ A,B,C $ が同様に確からしいと仮定する」とは,「一点事象の確率がすべて等しくなるような確率空間 $ (\jb{A,B,C},\mathcal P(\jb{A,B,C}),\mu) $ を設定する」という意味であると考えられます.

確率空間は無限個の事象を含んでいてもいいわけですが,同様に確からしいという言葉を,上の意味(一点事象の確率がすべて等しいという意味)で使う場合は, $ \Omega $ は有限集合でないといけないでしょう.そして $ \Omega $ が有限なら, $ \mu $ の測度としての性質から, $ A\in\mathcal F $ に対して
\begin{eqnarray}
\mu (A)&=&\frac{\sharp A}{\sharp\Omega}
\end{eqnarray}
( $ \sharp X $ は $ X $ の集合としての濃度を表す)となることがわかります.よって,「同様に確からしい」事象に対する確率の計算は,実質的に事象の集合濃度(いわゆる場合の数)を計算することと同じになるわけなんですね.

そして,具体的な事象に関して,それらが同様に確からしいと判断するのは人間であり,そのために必要とするのが「統計」という学問だと考えられます.

以上のように,「同様に確からしい」ということについて調べていると,「確率」というものの理解が若干進んできたような気がします.確率を測度として定式化したことによって,確率という概念を「現象論的な事象」から切り離すことができています.

これらのことを調べているうちに,ある突拍子もない疑問が浮かんできました.それは「確率は実数値である必要があるか」ということです.もし測度という概念が非実数に拡張することができるのであれば,同様に確率概念もそうできるはずです.ただし,確率論で問題となるのは,確率の値にどのような解釈を持たせるかという部分なので,それは難しいと思っていました.が…実際にそのようなことを研究する「エキゾチック確率論」(exotic probability theory)というものがあるらしいです.

そのことも,いずれ説明できればと思います.

2019/03/04の話:同様に確からしいってなんだ?」への2件のフィードバック

  1. 負の確率どころか複素値の確率理論とは数学は自由ですね!

    細かいですが、事象はΩの部分集合、(根源事象は事象のうち一元集合)なので
    ある事象 A,B,Cが同様に確からしいと仮定する〜
    のところのΩは、Ω={A,B,C}ではなく、Ω=A ∪B ∪Cと表されると思います!

    • コメントありがとうございます.
      確率論の研究は,ほぼ測度論の研究になっている節がありますね.

      Ω の部分についてですが,確かにここに事象と書くと数学的な事象と混同してしまいますね.なので若干の修正をしました.

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です