18-01 Kaggleで人・自動車・二輪車のデータセットを探す
●Kaggleから"CUHK03"で検索する
この章では「道路標識」→「信号機」と認識対象を変えました。本章ではさらに「動くもの」(人・自動車・バイク)を認識してみます。変更するHDLは「重み係数」などごく一部で、その他のHDLはこのように使い回します。
まずは「データセット」を探しましょう。「人」(歩行者)はこのサイトのデータセットを使います。CUHK03(Chinese University of Hong Kong Re-identification)をダウンロードしましょう(図18‐01)。 |
図18-01 Kaggleからヒトの画像をダウンロードする
●ネパールの四輪・二輪の画像を使う
また「自動車・バイク」(四輪車・二輪車)はこのサイトのデータセットを使います。Vehicles-Nepalをダウンロードします(図18‐02)。 |
図18-02 KaggleからVehicle Nepalで検索
●画像を評価用と訓練用に分ける
CUHK03(ヒト)のデータセットのimages_detectedディレクトリ以下に14,097個の画像があるので、そのうち1,000個を評価用(推論用)、残りの13,097個を訓練用(学習用)とします。
Vehicle-Nepal(車・バイク)のデータセットにはtwo-wheelerディレクトリに1,823個の画像があるので、そのうち180個を評価用、残りの1,643個を訓練用とします。
またfour-wheelerディレクトリには2,974個の画像があるので、そのうち290個を評価用、残りの2,684個を訓練用とします(*1)。
(*1)ファイルの分け方:エクスプローラで名前順に並べ、下の方の約1割のファイルを評価用、残りの約9割を訓練用とした。
そして評価用(推論用)の3クラスの画像ファイルを図18‐03のようにval_1フォルダ以下にまとめておきます。 |
図18-03 評価用の画像。bikeには180、carには290、humanには1000個のファイルがある
●訓練用train_1フォルダ以下は名前を0,1,2とする
次に図18‐04のように訓練用(学習用)の3クラスの画像をまとめます。train_1フォルダ以下に0, 1, 2のフォルダがあり、バイク、自動車、ヒトの画像がそれぞれ1643, 2684, 13097個あります。 |
図18-04 学習用の画像。0にはバイク、1には車、2にはヒトの画像がある
●フォルダ名と画像が合っているか確認
train_1(学習用のフォルダ)以下の"0", "1", "2"を開くと次のようなファイルがあるのを確認します。 |
次のページへ
目次へ戻る
|