R を利用した統計解析およびデータの視覚化
R
R は統計解析や視覚化などの機能を備えたプログラミング言語ないし統計解析環境である。統計解析の機能として、統計検定、線形回帰、時系列データ解析、クラスタリングなどがサポートされている。また、最新論文で発表されているような新しい手法も、R で実装されている場合が多い。特に、次世代シークエンサーに代表される分子生物学・バイオインフォマティクスの分野において R が使われる傾向がある。視覚化の機能として、ヒストグラム、棒グラフ、折れ線グラフ、散布図、樹形図やヒートマップなど基本的なグラフが標準でサポートされている。その他に、ggplot2 などのパッケージを使用することで、さらに高レベルな図を簡単に作図できるようになる。
基礎編
- データ型
- ベクトル
- 行列
- データフレーム
- 配列
- リスト
- ハッシュテーブル
- 文字列
- 欠損値
- 演算子
- 数学基本関数
- 関数の作り方
- 分岐処理
- 繰返処理
- 再帰処理
- パッケージ
- applyファミリー
- 時系列データ
- ファイル操作関数
発展編
グラフィックス
- 数学関数グラフ
- ヒストグラム
- 棒グラフ
- ボックスプロット
- ビーンプロット
- ビースウォーム
- ヴァイオリンプロット
- ベン図
- UpSet プロット
- 近似曲線
- 散布図
- 三次元散布図
- 系統樹 ape ade4
- ヒートマップ
- 数式表記
- グラフ凡例
- 複数座標軸
- 折れ線グラフ
- RColorBrewer
- 環境設定
- プロットエリア環境設定
- 複数ウィンドウ
- 複数グラフの描画
- グラフの保存
- ネットワーク
- circos プロット
グラフィックス(ggplot2)
- geom_bar
- geom_line
- geom_point
- geom_boxplot
- geom_tile
- geom_histogram
- facet_grid
- ggplot2 色と塗りの指定
- 有効数字表示