日本語のテキストデータを解析する際に、係り受けを抽出したいときがあります。係り受けを行うことができるフリーのソフトウェアの一つにCaboChaがある。CaboChaは, Support Vector Machinesに基
R×rpart 決定木 – 回帰木
ここでは、決定木の目的変数が連続値である場合の回帰木について、R言語の「rpart」パッケージを用いて簡単に見ていきます。 まずは必要となるパッケージのインストールとロードを行います。「rpart」パッケージは決定木を行
R×rpart 決定木 – 分類木
決定木とは、分類ルールを木構造で表したものです。分類したいデータを目的変数(従属変数)、分類するために用いるデータを説明変数(独立変数)といいます。目的変数がカテゴリデータなどの場合は「分類木」、連続値などの量的データの
R×Ubuntu14.04 RStudioのインストール手順
Ubuntuにデスクトップ版のRStudioをインストールするための手順をお伝えします。 まず、Ubuntuが32bitか64bitかを確認するため、端末を起動させ(ショートカットキー:Ctrl+Alt+t)、以下のコマ
R×Ubuntu14.04 Rのインストール手順
UbuntuにRをインストールするための手順をお伝えします。 Ubuntuのバージョン確認 Ubuntuのバージョンを確認するために、端末を起動し(ショートカットキー:Ctrl+Alt+t)、以下のコマンドを実行します。
Python 度数分布表から乱数を生成する
Pythonで与えられた度数分布に従う乱数を生成する方法をご紹介する。 さっそくだが、全コードを以下に記す。 import random import matplotlib.pyplot as plt def rando
UCI 機械学習リポジトリのデータセット一覧
UCI machine learning repositoryで公開されているデータセットを一覧にまとめ、機械翻訳を交えて日本語化し掲載します。データセットのサンプルを探す参考にしていただければ幸いです。 確認日: 20
C++ Boostによるコマンドライン引数処理
boost::program_optionsを用いると、コマンドライン引数(オプション)を比較的容易に解析することができる。 #include <iostream> #include <string> #in
Python pyqueryを用いて簡単にウェブスクレイピング
Pythonでpyqueryパッケージを用いて、ウェブスクレイピングを行う方法をご紹介する。ウェブ上には様々なデータがあるが、必要なデータがいつもファイルとしてダウンロードできるとは限らない。ここでご紹介する方法は、ht
R言語 CRAN Task View:Rグラフィカルモデル
CRAN Task View: Graphical Modelsについて、機械翻訳を交えて日本語化し掲載しております。 概要 Maintainer: Soren Hojsgaard Contact: sorenh at