●2層目は入力16ch・・・一つの積和演算器では間に合わない
2層目は入力16チャネルあります。仮にそれらを一つの積和演算器が受け持つとすると、1層目の4倍の時間がかかり、スループットが目標の320usを越えてしまいます。したがって図5‐26のように積和演算器を4個用意して、それぞれが入力4chを分担することにします。
同図の一番上の積和演算器は入力ch0〜3を受け持ち、それらを逐次的に処理します。出力の1ラインは26画素なので、90ns x 26 x 4ch = 9.36usで1ライン計算します。
その下の積和演算器は入力ch4〜7、次はch8〜11、最後はch12〜15を受け持ち、各自同様に処理します。 |