利用条件は,利用者自身で確認すること.
利用条件,注意事項,ダウンロード手順を確認する.
「...」のところは日付.
git の URL: https://git-scm.com/
Python の URL: http://www.python.org/
インストールするには, 端末で,次のコマンドを実行.
python -m pip install -U pip setuptools jupyterlab jupyter jupyter-console jupytext nteract_on_jupyter spyder
Git の URL: https://git-scm.com/
sudo apt -y update sudo apt -y install git
システム Python を使用(インストール操作は不要)
端末で,次のコマンドを実行.
sudo apt -y update sudo apt -y install python-is-python3 python3-dev python3-pip python3-setuptools python3-venv sudo pip3 uninstall ptyprocess sniffio terminado tornado jupyterlab jupyter jupyter-console jupytext nteract_on_jupyter spyder sudo apt -y install jupyter jupyter-qtconsole spyder3 sudo apt -y install python3-ptyprocess python3-sniffio python3-terminado python3-tornado sudo pip3 install -U jupyterlab nteract_on_jupyter
「jawiki-20200701-pages-articles-multistream.xml.bz2」は 実際のファイル名に読み替えること.
終わるまで数時間かかるので待つ.
※ Windows の場合は「python」,Ubuntu の場合は「python3」.
git clone https://github.com/attardi/wikiextractor.git mkdir jawiki python wikiextractor/WikiExtractor.py s -b 500M -o jawiki/ jawiki-20200701-pages-articles-multistream.xml.bz2
エラーメッセージが出ていないこと.
結果は,ディレクトリ名 jawiki のディレクトリに置かれる.