前節では1層目の行列演算を並列化し、全体で6.6倍高速化しました。本節では2層目を並列化して更に高速化します。
●7つのグループに分けて並列動作
2層目の重み行列は50×100なのでROMが100個存在します。図3-21では100個のROMを16個づつ7つのグループに分けます。
同図の最初のグループではROM_W2_00〜15が、16対1マルチプレクサで選択され、乗算器に入力されます。その後は累積器、シグモイドなどの回路を通ってZ_WR_DATA_00となり出力されます。
次のグループはROM_W2_16〜31、その次はROM_W2_32〜47、・・・最後はROM_W2_96〜99、これだけはROMの数が4個のグループです。 |