18-01 Kaggleで人・自動車・二輪車のデータセットを探す

●Kaggleから"CUHK03"で検索する

 この章では「道路標識」→「信号機」と認識対象を変えました。本章ではさらに「動くもの」(
人・自動車・バイク)を認識してみます。変更するHDLは「重み係数」などごく一部で、その他のHDLはこのように使い回します。

 まずは「データセット」を探しましょう。「人」(歩行者)はこのサイトのデータセットを使います。
CUHK03(Chinese University of Hong Kong Re-identification)をダウンロードしましょう(図18‐01)。

図18-01 Kaggleからヒトの画像をダウンロードする

●ネパールの四輪・二輪の画像を使う

 また「自動車・バイク」(四輪車・二輪車)はこのサイトのデータセットを使います。
Vehicles-Nepalをダウンロードします(図18‐02)。

図18-02 KaggleからVehicle Nepalで検索

●画像を評価用と訓練用に分ける

 
CUHK03(ヒト)のデータセットのimages_detectedディレクトリ以下に14,097個の画像があるので、そのうち1,000個を評価用(推論用)、残りの13,097個を訓練用(学習用)とします。

 
Vehicle-Nepal(車・バイク)のデータセットにはtwo-wheelerディレクトリに1,823個の画像があるので、そのうち180個を評価用、残りの1,643個を訓練用とします。
 またfour-wheelerディレクトリには2,974個の画像があるので、そのうち290個を評価用、残りの2,684個を訓練用とします(*1)。

(*1)ファイルの分け方:エクスプローラで名前順に並べ、下の方の約1割のファイルを評価用、残りの約9割を訓練用とした。

 そして評価用(推論用)の3クラスの画像ファイルを図18‐03のようにval_1フォルダ以下にまとめておきます。

図18-03
 評価用の画像。bikeには180、carには290、humanには1000個のファイルがある

●訓練用train_1フォルダ以下は名前を0,1,2とする

 次に図18‐04のように
訓練用(学習用)の3クラスの画像をまとめます。train_1フォルダ以下に0, 1, 2のフォルダがあり、バイク、自動車、ヒトの画像がそれぞれ1643, 2684, 13097個あります。

図18-04 学習用の画像。0にはバイク、1には車、2にはヒトの画像がある

●フォルダ名と画像が合っているか確認

 
train_1(学習用のフォルダ)以下の"0", "1", "2"を開くと次のようなファイルがあるのを確認します。






次のページへ

目次へ戻る