統計
✅統計検定1級不偏分散の証明によく用いる写真1枚目の関係式は、下記の教科書に解説が載っている。①「現代数理統計学の基礎」P86〜②「スモールデータ解析と機械学習」P265〜②の方が、解説が細かくてわかりやすいのでおススメ! pic.twitter.com/mcyl5SenoC— …
データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅作者:阿部真人ソシムAmazonには、ちゃんと信頼区間は、求められた区間が母数を含むような「実現値」が得られる確率と書いてあるぞ(正確な記述は、この本を…
という言葉は正しくもあり、正しくもない。標準偏差(または分散)はデータのちらばりぐらいを表す指標の1つに過ぎないのだから、別の指標、例えば、中央絶対偏差(median absolute deviation; MAD)からするとちらばり具合の大きさは逆転することがある。このよ…
コンピュータのありがたみを知るためじゃ。ありがたやありがたや(Microsoft Windows はありがたくない)東大のきぶつじだってエクセルなどでグラフ書くの禁止で配られた対数グラフに手書きなのだから、これが日本の伝統なのだ。
FREQUENCY関数で、 ctrl+shift+enter で動かない。結構コツがいるな。1) データを作る 2) 階級を作る 3) 頻度を入れるセルを選択する(階級の隣りに作るのが良い) 4) 選択したセルの一番上に 「=FREQUENCY(データ, 階級)」 5) ctrl+shift+enterだとうまくいき…
2つのデータには「正の相関がある」「負の相関がある」「相関がない」のいずれであるか答え、そのように判断した理由を述べよ.という出題をしたら、「相関がない」、理由は「なんとなく」という解答があった。高校でデータの分析を学ぶようになった世代から…
という問題の答が直線の式になってなくて、スカラーなのは何故?
日本工業規格のJIS Z 8101-1で確率統計に関する JIS における用語の定義がなされている。1999年だと 1.1 確率 かくりつ probability ある試行を同じ条件の下で長く続けたとき,一定の結果が生起する相対頻度の極限値。より一般的にはランダムな事象に割り当…
1976年の早稲田の二文の入試問題「ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、表を見ないで箱の中にしまった。そして残りのカードをよく切ってから3枚抜き出したところ、3枚ともダイヤであった。このとき箱の中のカードがダイヤである確…
きちんと統計を教えることができない予備校の先生は、やっぱり高校数学に統計が入るのを反対するよね。生徒に聞かれてもわかんないんだもん。純粋数学の先生の多くもきちんと統計を教えることができないので、やはり大学入試に統計の問題は出したくないよね…
ある教科書をみてみると 一般に,標本抽出を行い信頼区間を求めるとき,「この区間は母平均 m を含む」という主張は正しいとは限らない。しかし,多数回抽出して信頼区間を求めれば,そのうち約95%は母平均 m を含んでいる。これが信頼度95%の信頼区間とい…
Fisher の思想に関して Twitter で色々盛り上がっているが、実際、知人は Fisher の論文を引用しているという理由で Reject されたので、なかなか困ったものである。人格と科学的に正しいことは切り話して考えないといかんよね。
というスライドを作ったが、微妙だったので普通に「回帰は予測したい」にひよってしまった。
前に喧嘩でも売ってみるか(検閲済) - 球面倶楽部 零八式 mark IIでも書いたけど、母数に対する確率ではなくて信頼区間に対する確率が信頼率なんだってばよ。もちろん、そのためには、現実が確率分布族として正しくモデル化できていることが前提になっている…
と思って、信頼区間に関する浅薄な記事への批判を書いたが、変な人に広められると面倒なので検閲しとこう。 だけど、あまりにも省略しすぎたので少し追加しとくか。なお、伏せ字は xxxxx としてあるが,1文字だったり、100文字以上だったりと省略に幅を持た…
備忘録。「期待値の関数」は、ナイーブには不偏推定量とならないよ、という資料を作成中(いわゆる1/Nバイアス)。 pic.twitter.com/sQnMZj7jus— ロボ太 (@kaityo256) 2021年3月16日 #数楽 確率変数Xについてf(X)の期待値とXの期待値でのfの値の違いの話は、本…