トップページ -> 研究道具箱と教材 -> Ruby プログラミング -> Ruby で MeCab を使ってみる
[サイトマップへ]  

Ruby で MeCab を使ってみる


事前準備


■ mecab のインストールo

◆ Ubuntu での操作手順(例)(パッケージを用いてインストールする場合

  1. ubutnu のパッケージを使い mecab をインストール。ついでに chasen, namazu もインストールしている

    sudo apt-get -yV install  chasen
    sudo apt-get -yV install  libchasen-dev
    sudo apt-get -yV install  chasen-dictutils
    sudo apt-get -yV install  libtext-chasen-perl
    sudo apt-get -yV install  naist-jdic-utf8
    sudo apt-get -yV install  mecab
    sudo apt-get -yV install  mecab-utils
    sudo apt-get -yV install  mecab-naist-jdic
    sudo apt-get -yV install  libmecab-dev
    sudo apt-get -yV install  libmecab-ruby
    sudo apt-get -yV install  namazu2
    sudo apt-get -yV install  namazu2-index-tools
    sudo apt-get -yV install  libnmz7-dev
    

    ◆ Ubuntu での操作手順(例)(ソースパッケージを用いてビルドとインストールを行う場合

    ※ソースパッケージに関する設定については, 別のWebページで説明しています.

    mkdir /tmp/mecab
    cd /tmp/mecab
    
    sudo apt-get source mecab
    sudo apt-get -yV build-dep mecab
    cd mecab-0.97
    sudo dpkg-buildpackage -rfakeroot 
    cd ..
    sudo dpkg -i *.deb
    

    mecab-ruby のインストール

    cd /tmp
    wget http://sourceforge.net/projects/mecab/files/mecab-ruby/0.98/mecab-ruby-0.98.tar.gz
    tar -xvzof mecab-ruby-0.98.tar.gz
    cd mecab-ruby-0.98
    ruby extconf.rb
    make 
    sudo make install
    

◆ Fedora の場合のインストール手順(例)

gem ではインストールできないみたいなので,yum を使ってインストールする.

  1. 「yum install *mecab」の実行

    yum install *mecab
    

  2. 「yum install mecab*」の実行

    yum install mecab*
    

Windows の Cygwin の場合のインストール手順(例)

Mecab のインストール

  1. libiconv, libtool のインストール
  2. Mecab の入手

    cd /tmp
    wget http://sourceforge.net/projects/mecab/files/mecab/0.98/mecab-0.98.tar.gz
    tar -xvzof mecab-0.98.tar.gz
    cd mecab-0.98
    
  3. ソースコードの調整
  4. ./configure --with-charset=utf-8
  5. make
  6. sudo make install

ipadic のインストール

cd /tmp
wget http://sourceforge.net/projects/mecab/files/mecab-ipadic/2.7.0-20070801/mecab-iadic-2.7.0-20070801.tar.gz
tar -xvzof mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install

MeCab Ruby のインストール

cd /tmp
wget http://sourceforge.net/projects/mecab/files/mecab-ruby/0.98/mecab-ruby-0.98.tar.gz
tar -xvzof mecab-ruby-0.98.tar.gz
cd mecab-ruby-0.98
ruby extconf.rb
ここでできた Makefile を書き換える
===
ldflags = -L. -L/usr/local/lib
LIBS = $(LIBRUBYARG_SHARED) -lstdc++ -ldl -lcrypt -lmecab
===
make
sudo make install

実行例

起動チェック

irb を使用."I have a pen." という英文を解析してみる.これは起動チェックを兼ねる.

irb

require 'MeCab'
c = MeCab::Tagger.new()
parsed = c.parse("I have a pen")

実行結果の例

Linux の irb を使用.ターミナルの文字コードは UTF-8 に設定

UTF-8 形式日本語ファイルの解析

今度も irb を使用.ファイル hoge2.txt の中身を解析してみる.ファイルの文字コードは UTF-8 にしておく.

irb

require 'pp'
require 'MeCab'

c = MeCab::Tagger.new()
File.open("hoge2.txt", "r") do |f|
  parsed = c.parse(f.read)
  print parsed
end

実行結果の例

Linux の irb を使用.ターミナルの文字コードは UTF-8 に設定