【2017年】統計検定準1級 論述

スポンサーリンク
スポンサーリンク

問1 主成分分析

(1)

分散共分散行列の性質がわかっていればワンパン。

$$V[x_1]=428.6$$

$$Cov[x_1,x_2]=42.9$$

$$\rho_{x_1x_2}=0.1075$$

(2)

$$第一主成分得点をz_1とすると、$$

$$z_1=0.527x_1+0.459x_2+0.428x_3+0.573x_4$$

である。

つまり、第一主成分はすべての科目の得点と正の相関があるので総合点と関係があり、総合学力というとらえ方ができる。

同様にして第二主成分を考えると、

国語、社会とは負の相関、数学、理科とは正の相関を持っている。

つまり、第二主成分は値が大きいほど理系より、小さいほど文系よりであることを表す。

テスト結果を第二主成分までで表すことで、説明しているのは、

$$\frac{798+560}{798+560+160+10.5}\simeq 0.899$$

であるので、失われる情報は10%程度である。

累積寄与率の目安は80%であることを考えると第二主成分までの適用で十分だといえる。

(3)

問題文から、

$$\frac{7l_1}{\lambda_1}~\chi^2(7)$$

であるので

$$\chi_{0.025}^2(7)=1.69,\chi_{0.975}^2(7)=16.01より、$$

$$P\begin{pmatrix}1.69\leq \frac{7l_1}{\lambda_1}\leq 16.01\end{pmatrix}=0.95$$

$$\Leftrightarrow 348.9\leq \lambda_1 \leq 3305$$

(4)

まず、AICが小さいほど当てはまりの良いモデルであるので、AICが最も小さいモデル3にあたりをつける。

スクリ―プロットを確認すると、固有値の下がり幅がどれも100以上あり、

$$\lambda_1\geq \lambda_2\geq \lambda_3 \geq \lambda_4$$

も妥当と考えられるのでモデル3を採用すべきである。

問2 ポアソン過程

[1]

ポアソン分布の当てはまりが良いのは、

発生がまれであり、それぞれの発生が独立である

ような事象である。

[2]

s→0としたとき、

$$E[N_t-0]=\lambda(t-0)$$

となり、

$$N_tは原点から傾き\lambdaで増加すると考えられる。$$

実際にページ数と誤植発見数のグラフも原点を通る直線となっているので(c)は妥当と考える。

また、実際のデータから最尤推定によりλを推定してみると、

$$\hat{lambda}=\frac{20}{10.072}\simeq 1.99$$

であり、λ=2という推定は妥当と考えられる。

[3]

$$\sum_{i=1}^{N_t}=N_tq$$であるので、

$$E[X_t]=E[N_tq]=qE[N_t]=q\lambda t$$

[4]

実際の誤植は300頁で558個、

学生の誤植発見数は1.58個/頁であるので、

誤植発見率は、

$$\hat{q}=\frac{1.58\times 300}{558}=0.823$$

とわかる。