備忘録:スチュワートの定理

トレミーの定理と角の2等分線の長さ - 球面倶楽部 零八式 mark II(2023.10.08)

「スチュワートの定理は全分散はクラス内分散とクラス間分散の和でかけるという解釈もできるので、中線の角の2等分線の長さも全分散はクラス内分散とクラス間分散の和でかけるという解釈ができるのだなって,この話はブログに書いてないか」

と書いて放置していたが,スチュワートの定理と分散の関係については誰かが代わりに書いてくれた。

個人的には「スチュワートの定理は分散の公式を覚えていたら覚えやすいでしょ」と考えているので,少し筆をとって見ました.高校生は参考程度にしてください.


ただ,ここには「全分散はクラス内分散とクラス間分散の和でかける」とまでは言及されていないが.ただ,感覚的には良いけれども,数学的には危うい.2次元の話なので

「位置ベクトルの大きさの平均」

「重心の位置ベクトルの大きさ」

は一般に一致しないからである.というのも「重心の位置ベクトルの大きさはデータの原点の位置に依存する量」だからである(今回うまくいく理由は後述).

正確には次のように「分散共分散行列のトレースをとる」必要がある.

\overrightarrow{\mbox{AB}}y 個,\overrightarrow{\mbox{AC}}x 個あるときの重心は \mbox{AB}x:y に内分する点を \mbox{P} とするときの \overrightarrow{\mbox{AP}} となる.

このとき,この x+y 個のデータの分散共分散行列\Sigma(\vec{x})
\Sigma(\vec{x}) = E[\vec{x}\vec{x}^{\top}]-\overrightarrow{\mbox{AP}}\,\overrightarrow{\mbox{AP}}^{\top}
をみたすので,トレースをとると
\dfrac{y|\overrightarrow{\mbox{PB}}|^2+x|\overrightarrow{\mbox{PC}}|^2}{y+x}=\dfrac{y|\overrightarrow{\mbox{AB}}|^2+x|\overrightarrow{\mbox{AC}}|^2}{y+x}-|\overrightarrow{\mbox{AP}}|^2
とスチュワートの定理が得られる.

ここで重要なのは

「分散共分散行列はデータの原点の位置に不変な量」

であるということである.つまりデータの原点をどこにとっても同じ計算結果が得られるということだから,\mbox{A} を一般の位置にとった結果と直線 \mbox{BC}上にとった結果は一致することがわかる.そしてこの場合,1次元データの話になるのだから,1次元データの分散の式 V(x)=E[x^2]-(E[x])^2 をそのまま適用しても正しい結果が得られることがわかる.