R では、常用な三角関数(sin
cos
)、平均値や分散を求める関数(mean
var
)などが標準実装されている。そのため、R を起動して、画面に mean(x)
などと入力するだけで使えるようになる。しかし、より高度な機能をもった関数や論文で発表したばかりの統計手法などの場合は、R に標準実装されていない場合が多い。これらの手法はほとんど「パッケージ」としてまとめられ、公開されている。したがって、これらの手法を利用する場合は、そのパッケージをダウンロードして R にインストールする必要がある。
パッケージのインストール
パッケージはほとんど CRAN と Bioconductor と呼ばれるところで公開されている。経済統計、機械学習、画像処理などに関連するパッケージは CRAN で公開されている。また、生物・医療統計学向けのパッケージは概ね Bioconductor で公開されている。このほかに、個人のサイトで公開している小規模なパッケージも存在する。
自分が使いたいパッケージがどこにあるかが分からない場合は、とりあえず CRAN、Bioconductor の順でインストールを試す。
すべてのパッケージを一括にインストールすることは不可能ではないが推奨しない。必要なパッケージがある場合、その都度インストールすることを推奨する。
CRAN パッケージのインストール
CRAN で公開されているパッケージをインストールするとき、install.packages
にパッケージの名前を指定して行う。例えば som パッケージをインストールする場合は次のように行う。
install.packages("som", dependencies = TRUE)
実行すると、ミラーサイトの場所が聞かれるので、自分にもっとも近い場所を選ぶとダウンロード時間が短縮される。
※システムに何かライブラリーが足りなかったときに、エラーが発生し、インストールできない。エラー文をよくチェックし、どのライブラリーが必要かを調べて、それらのライブラリーを先にインストールしてから、再度パッケージをインストールする。
※いままでインストールができたのに、R バージョンを新しくしたらインストールできなる場合がある。エラー文をチェックし、どのライブラリーでエラーが起こったかを調べ、そのパッケージを単独でインストールする。それでもうまくいかない場合は、一つ古いバージョンを探してインストールしてみると解決する場合がある。古いパッケージは、CRAN の各パッケージのページにアクセスし、「Old sources:」と書かれている場所に保存されている。
Bioconductor パッケージのインストール
Bioconductor のパッケージは生物屋さん向けのものがほとんど。Bioconductor パッケージをインストールする場合は biocLite
を利用する。ここでは Biostrings パッケージをインストールする例を示す。
source("http://bioconductor.org/biocLite.R")
biocLite("Biostrings")
ダウンロードした圧縮ファイルからインストール
個人のサイトで公開されているパッケージをインストールするには、まず、そのパッケージをダウンロードする。次に install.packages
を利用してインストールする。
パッケージは一般に .tar.gz で圧縮されているが、これを解凍せずに、R で次のようにしてインストールする。
install.packages("TCC.tar.gz", repos = NULL, type = "source")
パッケージの呼び出し
パッケージをインストールした後に、使えるようにするためには、そのパッケージを呼び出す必要がある。
library(som) # som パッケージを呼び出します
library(Biostrings) # Biostrings パッケージを呼び出します
呼び出した後、初めて som と Biostrings パッケージ中の関数が自由に使えるようになる。
インストールされたパッケージの確認
インストールされたパッケージを確認したりすることができる。
library() | インストールされいてるライブラリー一覧を表示 |
library(X) | Xというライブラリーを読み込み、その機能を使えるようにします |
search() | libraryで呼び出されているライブラリー |
help(package="X") | Xというパッケージのバージョンや著者などを確認できます |
インストールされているパッケージを表示させる例。
library()
## base The R Base Package
## boot Bootstrap R (S-Plus) Functions (Canty)
## class Functions for Classification
## cluster Cluster Analysis Extended Rousseeuw et al.
## codetools Code Analysis Tools for R
## datasets The R Datasets Package
## foreign Read Data Stored by Minitab, S, SAS, SPSS,
## Stata, Systat, dBase, ...
## graphics The R Graphics Package
## grDevices The R Graphics Devices and Support for
## Colours and Fonts
## 後略
library(X)
によって呼び出されたパッケージを確認した場合は search
を利用する。
search()
## [1] ".GlobalEnv" "package:stats" "package:graphics"
## [4] "package:grDevices" "package:utils" "package:datasets"
## [7] "package:methods" "Autoloads" "package:base"
パッケージのバージョンや著者などを確認したい場合は、help
で関連情報を呼び出す。
library(TCC)
help(package = "TCC")
## Information on package ‘TCC’
##
## Description:
##
## Package: TCC
## Type: Package
## Title: TCC: Differential expression analysis for tag count
## data with robust normalization strategies
## Version: 1.0.0
## Date: 2013-01-10
## Author: Jianqiang Sun, Tomoaki Nishiyama, Kentaro Shimizu,
## and Koji Kadota
パッケージ関数の利用方法
パッケージに含まれる関数の使い方を調べる場合は help
などを利用する。その他に args
、example
などの便利な関数もある。
library(MASS)
# truehist関数の使い方を表示
help(truehist)
# truehist関数の引数を表示
args(truehist)
# truehist関数のサンプルコードを実行
example(truehist)
# パッケージの説明
help(package = "MASS")
# 詳しいパッケージの使い方(作成されていない場合は何も起こらない)
vignette(package = "MASS")
パッケージのデタッチ
library
関数で呼び出したパッケージを消すには detach
を利用する。
library(MASS)
truehist(rnorm(100))
detach(package:MASS)
truehist(rnorm(100))
## Error: could not find function "truehist"