2010年1月11日月曜日

無料統計ソフト「R言語」


【簡単な紹介】
R言語とは、1984年、AT&Tベル研究所で開発された統計処理言語であるS言語を参考に、ニュージーランドのAuckland大学のRoss IhakaとRobert Gentlemanにより学生の教育を目的に開発された。オープンソースとして開発が継続されているため、世界中の専門家が磨きをかけ、パッケージを追加し、現在では、FDA内部やGoogleでも使用されるに至っています。 Sの先を行くという願いを込めてRと名付けられたそうです。しかし、その短い名称が徒になり、ネットでの関連情報の検索は困難でした。そんな状況を打開するため、Rjpwiki(後述)のような関連情報の集積場所が出来ることとなりました。

【R本体のインストール】
  1. The Comprehensive R Archive Network のサイトへ行く。
  2. "Download and Install R"の"Windows"をクリック。
  3. "base"をクリック。
  4. "Download R 2.10.1 for Windows"をクリックすると、ダウンロードが開始。
  5. ダウンロードが終了したら、そのファイルをダブルクリックして指示にしたがってインストール。
【デモ:起動、t検定、ヘルプ、終了】
  • デスクトップにできたショートカットをダブルクリックして起動。
  • 次のスクリプトを実行
nations<-read.csv("C:/Documents and Settings/foo/デスクトップ/sample.csv")
asia<-subset(nations, region=="Asia")
europe<-subset(nations, region=="Europe")
t.test(asia$area, europe$area)
  • ヘルプ ?foo、help.search("foo")
  • 終了 q()
【Rcmdrのインストールと実行】
  • R上で、install.packages("Rcmdr") と入力。
  • ダウンロード元を選択して、しばし待つ。
  • R上で、library(Rcmdr) と入力すると、Rcmdrが起動。
【間奏曲~Rの利点と欠点】

利点!
  • 無料。ちなみに、JMP 8.0.1 は、176,400円、Dr.SPSS2は102,900円、エクセル統計2008は、41,580円
  • OSを選ばない。Windows、MacOS X、Linuxなど主要なOS版がある。
  • オープンソースなので、バグの修正や統計学の新しい理論の適用が早い。
欠点? 見方を変えれば利点。解決策も用意されている。
  • リソースが圧倒的に英語→英語の勉強になる。解決策:Rjpwikiの利用、日本語R関連図書
  • コマンドで操作→慣れると、かえって便利。解決策:Rcmdrパッケージ
【Rcmdrのデモ】
  • データ→データのインポート→テキストファイルまたはクリップボード、URLから…
  • 統計量→平均→独立サンプルt検定…
【参考図書】
【参考サイト】

0 件のコメント:

コメントを投稿