●2層目も1層目と同じ64並列
図8‐26にvgg-2層目のタイミングのイメージを示します。
2層目の入力は64ch、出力は64chなので最大限並列化するには乗算器が64x64=4096個必要になります。2層目以降は乗算器はビットシフトで達成しますが(*1)、それでも4096個となるとFPGAのリソースを圧迫します。
(*1)係数値を-4, -1, +1, +4に限定。みな2の累乗なのでビットシフトで乗算を達成できる。
そこで図8-26の右(赤字)にあるように、入力64chの読み出しと計算は逐次処理、出力64chの計算と書き込みは並列処理として、乗算器の数を1x64=64個に減らします。 |