トップページ -> 最新情報技術の実習と研究ツール -> Keras 2 の利用 -> Keras に付属のデータセットのうち画像以外のデータ
[サイトマップへ]  

Keras に付属のデータセットのうち画像以外のデータ

Python の kerasパッケージには,次のデータセットを簡単にダウンロードできる機能があります.

この Web ページでは、IMDB, Reuters newswire topics, Boston Housing Price を説明します. 残りの CIFAR10, CIFAR100, MNIST, Fashion MNIST は、別の Web ページで説明します

先人に感謝.


前準備

Anaconda 3, Tensorflow, Keras のインストール

前準備として,Python 開発環境のAnaconda, Tensorflow, Keras のインストールが終わっていること

Windows での Anaconda 3, Tensorflow, Keras のインストール手順は、 別の Web ページに記載しています

以下,Windows での Anaconda 3, Tensorflow, Keras をインストール済みであるものとして説明を続けます.


Keras に付属のデータセットのうち画像以外のデータ

データセットとは、「データの集まり」のこと.

keras に付属のデータセットを取得するときのオプションについては, https://keras.io/ja/datasets/(日本語版), https://keras.io/datasets/(英語版) に説明されている.

ここでの、オブジェクトの名前付けのルール

IMDB Movie reviews sentiment classification

Python 処理系」で次を実行.(Anacondaに入っている開発環境 spyder を実行し,右下の ipython コンソールを使うのが簡単.)

from keras.datasets import imdb
(X_train, y_train), (X_test, y_test) = imdb.load_data()

配列のサイズ確認

print( X_train.shape )
print( y_train.shape )
print( X_test.shape )
print( y_test.shape )

X_train の先頭要素の表示(確認のため)

print( X_train[0] )

実習課題

IMDB Movie reviews sentiment classification データセットのうち学習用の配列データについて,配列の形,次元数,先頭要素の中身を,次のプログラムで確認しなさい

from keras.datasets import imdb
(X_train, y_train), (X_test, y_test) = imdb.load_data()
print( X_train.shape )
print( X_train.ndim )
print( X_train[0] )

Reuters newswire topics classification

Python 処理系」で次を実行.(Anacondaに入っている開発環境 spyder を実行し,右下の ipython コンソールを使うのが簡単.)

from keras.datasets import reuters
(X_train, y_train), (X_test, y_test) = reuters.load_data()

配列のサイズ確認

print( X_train.shape )
print( y_train.shape )
print( X_test.shape )
print( y_test.shape )

X_train の先頭要素の表示(確認のため)

print( X_train[0] )

実習課題

Reuters newswire topics classification データセットのうち学習用の配列データについて,配列の形,次元数,先頭要素の中身を,次のプログラムで確認しなさい

from keras.datasets import reuters
(X_train, y_train), (X_test, y_test) = reuters.load_data()
print( X_train.shape )
print( X_train.ndim )
print( X_train[0] )

Boston housing price regression dataset

Python 処理系」で次を実行.(Anacondaに入っている開発環境 spyder を実行し,右下の ipython コンソールを使うのが簡単.)

from keras.datasets import boston_housing
(X_train, y_train), (X_test, y_test) = boston_housing.load_data()

配列のサイズ確認

print( X_train.shape )
print( y_train.shape )
print( X_test.shape )
print( y_test.shape )

X_train の先頭要素の表示(確認のため)

print( X_train[0] )

実習課題

Boston housing price regression dataset データセットのうち学習用の配列データについて,配列の形,次元数,先頭要素の中身を,次のプログラムで確認しなさい

from keras.datasets import boston_housing
(X_train, y_train), (X_test, y_test) = boston_housing.load_data()
print( X_train.shape )
print( X_train.ndim )
print( X_train[0] )

以下、書きかけ

参考Webページ http://www.procrasist.com/entry/2017/01/07/154441

https://keras.io/getting-started/sequential-model-guide/ で言及されている次の事項について.

https://github.com/fchollet/keras/tree/master/examples に記載のプログラムを動かしてみる.

  • CIFAR 10

    https://github.com/fchollet/keras/blob/master/examples/cifar10_cnn.py を実行してみる.