石田修二のホームページ > コンピュータメモ >

Gretl

キーワード:経済統計学, 経済学, 計量経済学 (Econometrics), SPSS

表題になっている Gretl(グレーテル)(GNU regression, econometrics, and time series library) は経済学での利用を想定した統計ソフトウェアです。Wikipedia でその存在を知り、統計学への関心もあって、使い始めました。

Linux, MS Windows, Mac で動かすことができます。Linux のディストーションによってはアプリケーションパッケージに含まれているようです。Macでは x11 が動く環境が必要で、動きがもっさりしています。ということから私はインストールが簡単な MS Windows 版(Gretl for win32)を使っています。

起動と終了

一般的なアプリケーションと同じです。Gretl のアイコンをダブルクリックすると起動しますし、終了は「閉じる」ボタンを押すことで可能です。

Gretlのアイコン

データの入力

こちらを参照して下さい。

ファイルの読み込み

Gretl 独自のファイルの拡張子は .gdt です。ダブルクリックすると、Gretlが起動しデータが読み込まれます。

Gretl data file

csv はもちろん Excel, Gnumeric, Open document, SPSS, SAS のデータを読み込むこともできます。データの中に日本語が含まれている場合の対応状況については未確認です。

サンプルファイルを読み込む

サンプルデータを開く

ちょっと機能を試してみましょう。「Sample file」の data3-6 Disposable income and consumption を使ってみます(「Ramanathan」のタブに入っています)。

const は「定数」という意味です。Ct (Personal consumption expenditures) は個人消費支出、Yt (Per capita disposable personal income) は一人あたりの可処分所得を意味しています。

分析したい変数を選択する際、Ctrl や Shiftキーを使うことで複数の変数を選ぶことができます。なお、[Data] - [Select All] ですべての変数を選択することができます。

時系列グラフの作成

メニューバーの [View] - [Graph specified vars] - [Time Series Plot]で作成することができます(右クリックメニューにも [Time Series Plot] が入っています)。

五数要約

要約したい変数を選択して、メニューバーから [Variable] - [Summary statistics] の順にクリックします。

Summary statistics

変数名を右クリックして表示されるメニューから、[Summary statistics] を選んでも同じ操作ができます。

Summary statistics

度数分布表とヒストグラムを作成したいのであれば、変数を選択して、[Frequency distribution] を選択します。

散布図と相関関係

(工事中)

回帰分析

Let's 最小二乗法!

[Model] - [Ordinary Least Squares ...] の順にクリックします。

最小二乗法

ダイアログボックスが表示されたら、次のように設定します

設定できたら、[OK]ボタンをクリックします。

結果のダイアログボックスが表示されます。各用語の日本語訳を記しておきます。

出力結果をコピーして、Wordに貼り付けることもできますが、その際は貼り付けて終わりではなく、表形式にして日本語にするなど、キレイにまとめましょう。

[File] メニューから印刷することもできます。

次の動画も参考になります。

t検定

まずは次の問題(片側検定)から。

ある電器メーカーは,蛍光灯の新製法を開発した。新製品から,25本を無作為に抽出し測定したら,平均寿命1160時間であった。従来の製品仕様書によれば,平均寿命1130時間,標準偏差80時間であった。新製法によって寿命が伸びたといえるか。(小寺平治『新統計入門』裳華房,1996年, p.98)

新製法を開発したのだから,本音では“寿命が伸びた”すなわち,

$H_{1}$ は $\mu > 1130$(対立仮説)

帰無仮説は“寿命が変わらない”すなわち,以下のように仮定する。

$H_{0}$ は $\mu = 1130$(帰無仮説)

Gretlでは次のようにして求める。

(1)[Tools] - [Test statistic calculator] の順にクリックする。

検定

(2)"test calculator" のダイアログボックスが出たら,次のように設定する。

出力結果は次の通り。

ttest08.png
Null hypothesis: population mean = 1130
Sample size: n = 25
Sample mean = 1160, std. deviation = 80
Test statistic: t(24) = (1160 - 1130)/16 = 1.875
Two-tailed p-value = 0.07301
(one-tailed = 0.03651)

判定は one-tailed p-value を 0.05 と比較する。

p値 = 0.03651 < 0.05

棄却域に属するので,$H_{0}$は棄却された。したがって,有意水準を0.05にすると,新製法で蛍光灯の寿命が延びたという主張が右側検定で認められた。

(注)ただし,有意水準を 0.01 にすると, t値は棄却域に属さず,帰無仮説 $H_{0}$ は棄却されない。結局,得られたデータからは何も言えないということになる。

次は両側検定

ある精密機器メーカーでは,直径の平均が 3.32cm,標準偏差 0.03cm のボルトを製造していた。ある日,ボルトを10個任意抽出したら,直径の平均が 3.34cm であった。

この機械は,正常に作動しているか。

(小寺平治『新統計入門』裳華房, 1996年, p.100)

この日製造されるボルトの全部の平均をμとする。ボルトの直径は,大きくても小さくてもいけないから,μ = 3.32(機械は正常に作動している)か,μ≠3.32(機械は正常に作動していない)かが問題であって,

$H_{0}$:$\mu = 3.32$(帰無仮説)

$H_{1}$:$\mu \neq 3.32$(対立仮説)

両側検定である。有意水準αを0.05として,Gretlで求めてみる。

結果は次の通り。

ttest09
Null hypothesis: population mean = 3.32
Sample size: n = 10
Sample mean = 3.34, std. deviation = 0.03
Test statistic: t(9) = (3.34 - 3.32)/0.00948683 = 2.10819
Two-tailed p-value = 0.06426
(one-tailed = 0.03213)

p値 = 0.06426 > 0.05

したがって,$H_{0}$は棄却され,機械は正常に作動していないと判断する。

(注)ただし,有意水準 0.01 では,$H_{0}$は棄却されない。結局,得られたデータからは何も言えないということになる。

次の問題のキーワード:母分散未知,小標本,t分布

C大学経済学部は,Y予備校の模試で358点以上必要であることが過去の資料からわかっている。一郎くんの今年5回の模試の成績は,

328, 372, 314, 325, 351(点)

であった。一郎くんは合格できるだろうか。(小寺平治『新統計入門』1996年, p.100)

問題は,一郎くんの平均学力(得点力)μと358点との比較である。すなわち,

$H_{0}$:$\mu = 358$(帰無仮説)

$H_{1}$:$\mu < 358$(対立仮説)

の左側検定である。

母分散が未知なので,t分布の活用を考える。

(作成中)

帰無仮説は棄却されない。だからといって合格を積極的に認めているわけではない。つまり「努力次第」。

あるクラスの学生の身長を測定したら、次のような結果を得ました(単位はすべてcm)。

150, 155, 154, 152, 157, 163, 159, 161, 164, 165

クラス全体の平均身長が 159cm であるという仮説を立てた時、この仮説は棄却できるでしょうか。(勝木太一『経済統計学』開成出版, 1995年, p.30-p.31)

Gretlデータ形式のファイル(height.gdt)はこちら。CSV形式のファイル(height.csv)はこちら

まず、帰無仮説を立てましょう。帰無仮説 $H_{0}$ は $\mu = 159$ です。信頼率は 95% とします(デフォが95%のようです)。

次に、メニューバー [Tools] - [Test statistic calculator] をクリックします。

検定

設定画面が表示されたら、次のように設定します。

検定

計算結果とグラフが出力されます。

検定結果

判定は Two-tailed p-value を 0.05 と比較する。

p値 = 0.5602 > 0.05

したがって、$H_{0}$は棄てられません(rejectできない)。言い換えれば 159cm でないとは言えないと結論付けられます。

グラフで示したもの

検定結果のグラフ

次のデータは、ウエイターのアルバイトをしている学生8人の時給である。

850, 1000, 1100, 950, 1200, 900, 1050, 800

昨年の同時期ににおける平均時給は 900円であった。今年のウエイターの平均時給も900円と仮説を立てた時、この仮説は棄却できるか。

Gretlデータ形式のファイル(waitress_salary.gdt)はこちら。CSV形式のファイル(waitress_salary.csv)はこちら

帰無仮説を以下のように設定します。

メニューバー [Tools] - [Test statistic calculator] をクリックします。

設定画面(test calculator)が表示されたら、以下のように設定し。[OK]ボタンをクリックします。

設定

Gretlの出力結果は次の通り。

Null hypothesis: population mean = 900
Sample size: n = 8
Sample mean = 981.25, std. deviation = 133.463
Test statistic: t(7) = (981.25 - 900)/47.1865 = 1.72189
Two-tailed p-value = 0.1288
(one-tailed = 0.06438)

判定は Two-tailed p-value を 0.05 と比較します。

p値 = 0.1288 > 0.05

したがって、$H_{0}$は棄てられません(rejectできない)。言い換えると、母集団の平均給与は900円という仮説を否定できない、と結論付けられます。

グラフで示したもの。青い線が検定統計量。

検定結果のグラフ

グラフ

グラフの上で右クリックしてコピーすると、グラフをクリップボードに取り込むことができます。そうすれば、例えば Word の文章の中に貼り付けるといったことができます。

graph copy

参考資料

なかなか日本語の説明ページが見つかりません。しかし検索してみると一部の経済学部では積極的に使われているようです。

書籍であれば、加藤久和先生の『gretlで計量経済分析』(日本評論社, 2012年)が参考になるようです。


リンクはご自由にどうぞ。

【石田修二フロントページ】 【コンピュータメモ】 【データ統計処理】

Last modified: 2015-09-04 01:49:16