R のパッケージのインストール方法と呼び出し方

パッケージ

R では、常用な三角関数(sin cos)、平均値や分散を求める関数(mean var)などが標準実装されている。そのため、R を起動して、画面に mean(x) などと入力するだけで使えるようになる。しかし、より高度な機能をもった関数や論文で発表したばかりの統計手法などの場合は、R に標準実装されていない場合が多い。これらの手法はほとんど「パッケージ」としてまとめられ、公開されている。したがって、これらの手法を利用する場合は、そのパッケージをダウンロードして R にインストールする必要がある。

パッケージのインストール

パッケージはほとんど CRANBioconductor と呼ばれるところで公開されている。経済統計、機械学習、画像処理などに関連するパッケージは CRAN で公開されている。また、生物・医療統計学向けのパッケージは概ね Bioconductor で公開されている。このほかに、個人のサイトで公開している小規模なパッケージも存在する。

自分が使いたいパッケージがどこにあるかが分からない場合は、とりあえず CRAN、Bioconductor の順でインストールを試す。

すべてのパッケージを一括にインストールすることは不可能ではないが推奨しない。必要なパッケージがある場合、その都度インストールすることを推奨する。

CRAN パッケージのインストール

CRAN で公開されているパッケージをインストールするとき、install.packages にパッケージの名前を指定して行う。例えば som パッケージをインストールする場合は次のように行う。

install.packages("som", dependencies = TRUE)

実行すると、ミラーサイトの場所が聞かれるので、自分にもっとも近い場所を選ぶとダウンロード時間が短縮される。

※システムに何かライブラリーが足りなかったときに、エラーが発生し、インストールできない。エラー文をよくチェックし、どのライブラリーが必要かを調べて、それらのライブラリーを先にインストールしてから、再度パッケージをインストールする。

※いままでインストールができたのに、R バージョンを新しくしたらインストールできなる場合がある。エラー文をチェックし、どのライブラリーでエラーが起こったかを調べ、そのパッケージを単独でインストールする。それでもうまくいかない場合は、一つ古いバージョンを探してインストールしてみると解決する場合がある。古いパッケージは、CRAN の各パッケージのページにアクセスし、「Old sources:」と書かれている場所に保存されている。

Bioconductor パッケージのインストール

Bioconductor のパッケージは生物屋さん向けのものがほとんど。Bioconductor パッケージをインストールする場合は biocLite を利用する。ここでは Biostrings パッケージをインストールする例を示す。

source("http://bioconductor.org/biocLite.R")
biocLite("Biostrings")

ダウンロードした圧縮ファイルからインストール

個人のサイトで公開されているパッケージをインストールするには、まず、そのパッケージをダウンロードする。次に install.packages を利用してインストールする。

パッケージは一般に .tar.gz で圧縮されているが、これを解凍せずに、R で次のようにしてインストールする。

install.packages("TCC.tar.gz", repos = NULL, type = "source")

パッケージの呼び出し

パッケージをインストールした後に、使えるようにするためには、そのパッケージを呼び出す必要がある。

library(som)         # som パッケージを呼び出します
library(Biostrings)  # Biostrings パッケージを呼び出します

呼び出した後、初めて som と Biostrings パッケージ中の関数が自由に使えるようになる。

インストールされたパッケージの確認

インストールされたパッケージを確認したりすることができる。

library()インストールされいてるライブラリー一覧を表示
library(X)Xというライブラリーを読み込み、その機能を使えるようにします
search()libraryで呼び出されているライブラリー
help(package="X")Xというパッケージのバージョンや著者などを確認できます

インストールされているパッケージを表示させる例。

library()
## base          The R Base Package
## boot          Bootstrap R (S-Plus) Functions (Canty)
## class         Functions for Classification
## cluster       Cluster Analysis Extended Rousseeuw et al.
## codetools     Code Analysis Tools for R
## datasets      The R Datasets Package
## foreign       Read Data Stored by Minitab, S, SAS, SPSS,
##               Stata, Systat, dBase, ...
## graphics      The R Graphics Package
## grDevices     The R Graphics Devices and Support for
##               Colours and Fonts
## 後略

library(X) によって呼び出されたパッケージを確認した場合は search を利用する。

search()
## [1] ".GlobalEnv"        "package:stats"     "package:graphics" 
## [4] "package:grDevices" "package:utils"     "package:datasets" 
## [7] "package:methods"   "Autoloads"         "package:base"

パッケージのバージョンや著者などを確認したい場合は、help で関連情報を呼び出す。

library(TCC)
help(package = "TCC")
##                 Information on package ‘TCC’
## 
## Description:
## 
## Package:            TCC
## Type:               Package
## Title:              TCC: Differential expression analysis for tag count
##                     data with robust normalization strategies
## Version:            1.0.0
## Date:               2013-01-10
## Author:             Jianqiang Sun, Tomoaki Nishiyama, Kentaro Shimizu,
##                     and Koji Kadota

パッケージ関数の利用方法

パッケージに含まれる関数の使い方を調べる場合は help などを利用する。その他に argsexample などの便利な関数もある。

library(MASS)

# truehist関数の使い方を表示
help(truehist)

# truehist関数の引数を表示
args(truehist)

# truehist関数のサンプルコードを実行
example(truehist)

# パッケージの説明
help(package = "MASS")

# 詳しいパッケージの使い方(作成されていない場合は何も起こらない)
vignette(package = "MASS")

パッケージのデタッチ

library 関数で呼び出したパッケージを消すには detach を利用する。

library(MASS)
truehist(rnorm(100))


detach(package:MASS)
truehist(rnorm(100))
## Error: could not find function "truehist"