Week5 確認テスト(最終課題)

問題5-1

事前準備として,データを読み込みます。

dummydata_E <- read.csv("~/Dropbox/R/dummydata_E.csv")
attach(dummydata_E) #お好みで

【問題5-9】

ヒストグラムのソースは次の通り。

par(family="HiraKakuProN-W3") #mac
par(mar=c(5,4,4,2)+0.1)
par(las=1)
par(cex=0.9)
income = dummydata_E$年間収入.円. / 10000
h = pretty(income)
hist(income, breaks=seq(800,1160,10),
     right = F, 
     col = "gray",  
     main = "Histgram of 年間収入", 
     ylim = c(0, max(h)),
     xlab = "年間収入階級(万円)", ylab = "")
axis(side=2, labels="人", at=max(h),
     hadj=0.6, padj=-1.5)

【問題5-10】

corを使って,相関係数を求めます。

> cor(年間収入.円., 教養娯楽費)
[1] 0.6885426
> cor(年間収入.円., 被服及び履物費)
[1] 0.1189328
> cor(年間収入.円., 食費)
[1] 0.1050746
> cor(年間収入.円., 住居費)
[1] -0.05196645

よって,答えは (2) になります。

【問題5-11】

工事中

【問題5-12】

散布図のソースは次の通り。

par(family="HiraKakuProN-W3") #mac
par(mar=c(5,5,4,2)+0.1)
par(las=1)
par(cex=0.8)
income = dummydata_E$年間収入.円./10000
leisure = dummydata_E$教養娯楽費/10000
plot(income, leisure, 
     xlab="年間収入(万円)", 
     ylab="教養娯楽費(万円)")

【問題5-13】

> lm(dummydata_E$教養娯楽費~dummydata_E$年間収入.円.)

Call:
lm(formula = dummydata_E$教養娯楽費 ~ dummydata_E$年間収入.円.)

Coefficients:
 (Intercept)  年間収入.円.  
  -1.773e+05     2.724e-02  

よって,答えは,(4) の y = 0.0272x - 177294 が正解。

【問題5-14】

まずは散布図を見ながら,外れ値を外す作業をします。具体的には教養娯楽費から500000円のデータを抜き,抜いたデータを dummydata_E2 とします。

> case1 = dummydata_E$教養娯楽費<500000
> dummydata_E2 = dummydata_E[case1,]

dummydata_E2 の表を元に回帰分析をします。

> lm(dummydata_E2$教養娯楽費~dummydata_E2$年間収入.円.)

Call:
lm(formula = dummydata_E2$教養娯楽費 ~ dummydata_E2$年間収入.円.)

Coefficients:
              (Intercept)  dummydata_E2$年間収入.円.  
               -1.800e+05                  2.752e-02

よって,答えは,(2) の y = 0.0275x - 180042 になります。

【問題5-15】

問題5-14で求めた式の x に 10000000 を代入します。

> 0.0275*10000000-180042
[1] 94958

よって,答えは,(1) の 94,958円 になります。