8‐05 3層目シミュレーションとEXCELの答え合わせ(続き)

●EXCELのtruncateシートとRelu_xxを比較

 積和演算の後はバイアス加算、8ビットシフト、ReLUを経てRelu_00〜63となります(図8‐60(a))。同図(b)はEXCELのtruncateシートですが、Relu_00がA列、Relu_01がB列・・・Relu_63がBL列とピタリ一致することを確認します。

図8-60 (a) 3層目の出力(シム)


図8-60 (b) 3層目の出力(EXCEL)

●積和結果が合わないとき−入力画素データはEXCELと合っているか

 図8‐61はEXCELのim2col00, 01シートで、これらは入力ch0, 1の画素を11×11→9×121に並び替えたものです。
 それぞれの一行目を並べたものが図8‐52
PixRomDataの値になっています。3層目はこの図のように一つの積和演算器が入力16chを受け持つので、PixRomDataはこの後、16chぶん続きます(im2col02〜15と比較)。



図8-61 im2col00, 01。入力16ch(im2col00〜15)が1セットになる。

●重み係数はEXCELと合っているか

 図8‐62はW3_Biasシートで、A列の16ch×9個の係数が図8‐52
MatRomDataとなっています(この表のようにエンコードされる)。

図8-62 重み係数9×16chぶん、A列144個で1セット

●11×11画素を320usで書いて4層目へ

 図8‐63は3層目の出力RAMの信号です。CNN1ブロックを処理する時間は320us、その時間内にRAM_X3_WR_N_Xが11ラインぶんLになっています。RAM_X3_WR_SELは1ラインごとに0, 1, 2, 3, 0...と遷移し、それに相当するRAM_X3_WR_N_XがLになります。

図8‐63 RAM_X3にはラインバッファが4つある。順番に書き込む

●書き込みタイミングが想定通りになっているか

 図8‐64のように1画素書き込むのに
1440ns、1ライン(13画素)書き込むのに20.16usかかります。このタイムチャート通りになっているか確認しましょう。

図8-64 RAM_X3の書き込みを拡大

最初のページへ

目次へ戻る