Web ページのリンクチェッカー

Webページのリンク切れチェックツール『linkchecker』はUbuntu 24.04 LTSでaptを用いてインストール可能である.基本的な使い方としてURL指定に加え,外部リンクチェック(--check-extern)や再帰チェック(-r)オプションがある.コマンド実行結果の例とその見方を示す.

前準備

Ubuntu のシステム更新

Ubuntu で OS のシステム更新を行うときは, 次のコマンドを実行する.

# パッケージリストの情報を更新
sudo apt update
# インストール済みのパッケージを包括的に更新 (依存関係も考慮)
sudo apt full-upgrade
# 変更をシステム全体に確実に反映させるために再起動
sudo shutdown -r now

Ubuntu のインストールは別ページ »で説明している.

linkchecker のインストール

Ubuntu 24.04 LTSでは,標準リポジトリ(universe)に含まれるlinkcheckerパッケージ(バージョン 10.4.0-1)をaptでインストールできる.次のコマンドを実行する.

sudo apt install linkchecker

linkchecker の利用

「linkchecker」を利用するには,URL を指定する.

既定(デフォルト)では,内部向けのリンクはアクセス可能かを確認し,外部向けのリンクは書き方(シンタックス)の確認のみを行う.

例えば,次のようにコマンドを実行する.

linkchecker https://example.com/

外部のリンクについても実際にアクセスしてチェックを行うには,--check-extern オプションを使用する.例えば,次のように実行する.

linkchecker --check-extern https://example.com/

ウェブサイト全体のリンクを再帰的にチェックする場合,-r オプションで深さを指定できる.例えば深さ3までチェックするには次のように実行する.

linkchecker -r3 https://example.com/

実行すると,リンクのチェック結果が表示される.結果は通常,以下のような形式で示される.

# 例: 問題ない場合
Link: https://example.com/ (OK)
  Parent: http://localhost/path/to/page.html

# 例: リンク切れの場合
Link: https://example.com/broken-link (Error)
  Parent: http://localhost/path/to/page.html
  Check time: 0.123 seconds
  Result: 404 Not Found