と思って、信頼区間に関する浅薄な記事への批判を書いたが、変な人に広められると面倒なので検閲しとこう。
だけど、あまりにも省略しすぎたので少し追加しとくか。なお、伏せ字は xxxxx としてあるが,1文字だったり、100文字以上だったりと省略に幅を持たせて、内容が推定しずらいようにしている(2021.7.18)
信頼区間に関するブログを見て爆笑。こんな議論を未だにしているとか、100年前か?
(注)たぶん、まだ100年経ってない)
信頼区間はその計算方法からわかるように、xxxxx であり、それ以外の意味はない。イメージとしては xxxxx である。この当たり前のことを書いてある本は以外と少ない。「xxxxx」
には書いていて、さすが xxx と思った記憶があるが、夢かも知れない。確認しようにも本は買ってないので来週買って確認してみよう。
これを意識的に、または無意識的に xxxxx いる人々が多いのが現状だ。
例えば、 確率ではない とか書いている本などは、「xxxxx から確率ではなくて割合だ 」って書いているけど、こういうことを書いている人は「統計学のセンス」がない。そもそも 割合と確率を区別する意味は、 xxxxx という意味の区別以外ない訳で、要するに、「 有限回の試行に基づく結果は確率ではなく割合だ 」と言っているだけに過ぎない。そしてそれを強調する意味も殊更ない。ちなみに、xxxxx としか言いようがない。そもそも、こんなことを注釈もなく書く時点で、「私は xxxxx と xxxxx の区別がつかないん です」と告白しているように思う。ちなみに、xxxxx を仮定して xxxxx だから、「xxxxx」というのは当たり前すぎてコメントしずらい。なお、xxxxx から得られた結果が が信頼できないという話は、xxxxx という有名な例を挙げておく。「日本人が xxxxx で調査した結果 xxxxx ラーメンでした 」って阿呆でしょ?
なお、xxxxx のすり替えの典型は xxxxx としている本で、非常に売れている有名な本では「xxxxx」が該当する。このすり替え、 xxxxx ことに気付かない人が多い。 xxxxx ではない。統計を意に反して教えさせられている純粋数学者の中には、ここで躓く人も多い。
xxxxx 出版会の xxxxx も、言っていることは本質的に「xxxxx」ということと、さほど変わらない、頭大丈夫?という注意喚起がなされている。xxxxx なんだから、当たり前でしょ。xxxxx は当たり前(xxxxx)。
このような「xxxxx と思い込む良くある勘違い」という勘違いが横行する理由は、xxxxx に過ぎない。xxxxx という説明に苦言を呈するならば、何故 xxxxx という単純な説明をしないのか、理解に苦しむ。では、xxxxx にはどうすれば良いのか、ということであるが、これは単純明快で、xxxxx すれば良いことになる。つまり、「xxxxx」ややこしくも何ともない。 頻度論者 も xxxxx も関係なく、ただ単に、 「お前が計算しているのは xxxxx ではなく xxxxx なのだ」 というだけの話。いかにも xxxxx 、肝心要の xxxxx は何故かきちんと教えないものが多いのも、 xxxxx。
2021.07.18 追記
やっと twitter でそこそこまともな投稿をみた。
95%信頼区間の95%は確率ではないというデマはやめてくれ。無作為抽出した時(あるいはiidからサンプリングしたとき)の標本の変動の相対頻度(割合)を確率と考えるところが頻度論的な推測統計の出発点なので,信頼区間もαもp値もその意味で確率です。
— mutopsy // μ to ψ (@mutopsy) 2021年7月17日
だけど書き方がわかりにくい。信頼区間95%の95%とは、何の確率かということを一言添えるだけの問題だと思うのだが。
「信頼区間は標本から計算される」という推測統計学の基本的な話なのだけど。
「真の母数がこの標本区間に含まれる確率が95%」という舌足らずの表現を「標本」を利用してちょっと書き換えるだけの話。
うーむ。何故こんなことが論争になるのかが良くわからない。きっと私が馬鹿なんだろうな。
2021.07.20 追記
何かまともなことをいってる。
#数楽 どこかで、「確率と割合の違いがあるのか?」という話が出ていたように思うが、純粋に数学的に確率測度として定義される確率概念はランダム性の概念を含まず、割合の概念の抽象化に過ぎない。
— 黒木玄 Gen Kuroki (@genkuroki) 2021年7月18日
95%信頼区間とは、母数を含む確率が95%となるように、標本から構成された「確率変``区間''」の実現値
と書けば、それだけの話なのだが、、、(って伏字の意味がなくなってしまった)。
だから、母数が定数かどうかという議論は無意味だし、母数を含む確率が95%だから、1回だけの実現値に着目すれば、母数を含むか含まないかのいずれかなのはアタリマエだし、「標本抽出」を十分多く繰り返せば、大数の法則から、母数を含む区間が得られる割合は95%に確率収束するのは、そうなるように確率変``区間''を構成したのだからアタリマエである。なので、何であんな変な論争が起こるのかさっぱりわからない。
Fisher,Peasonたちも含めて、標本に対する確率を母数に対する確率に無理矢理読み替えようとするから、変な論争になってしまうのだと思う。