8‐05 3層目シミュレーションとEXCELの答え合わせ(続き)
●EXCELのtruncateシートとRelu_xxを比較
積和演算の後はバイアス加算、8ビットシフト、ReLUを経てRelu_00〜63となります(図8‐60(a))。同図(b)はEXCELのtruncateシートですが、Relu_00がA列、Relu_01がB列・・・Relu_63がBL列とピタリ一致することを確認します。 |
図8-60 (a) 3層目の出力(シム)
図8-60 (b) 3層目の出力(EXCEL)
●積和結果が合わないとき−入力画素データはEXCELと合っているか
図8‐61はEXCELのim2col00, 01シートで、これらは入力ch0, 1の画素を11×11→9×121に並び替えたものです。
それぞれの一行目を並べたものが図8‐52のPixRomDataの値になっています。3層目はこの図のように一つの積和演算器が入力16chを受け持つので、PixRomDataはこの後、16chぶん続きます(im2col02〜15と比較)。 |
図8-61 im2col00, 01。入力16ch(im2col00〜15)が1セットになる。
●重み係数はEXCELと合っているか
図8‐62はW3_Biasシートで、A列の16ch×9個の係数が図8‐52のMatRomDataとなっています(この表のようにエンコードされる)。 |
図8-62 重み係数9×16chぶん、A列144個で1セット
●11×11画素を320usで書いて4層目へ
図8‐63は3層目の出力RAMの信号です。CNN1ブロックを処理する時間は320us、その時間内にRAM_X3_WR_N_Xが11ラインぶんLになっています。RAM_X3_WR_SELは1ラインごとに0,
1, 2, 3, 0...と遷移し、それに相当するRAM_X3_WR_N_XがLになります。 |
図8‐63 RAM_X3にはラインバッファが4つある。順番に書き込む
●書き込みタイミングが想定通りになっているか
図8‐64のように1画素書き込むのに1440ns、1ライン(13画素)書き込むのに20.16usかかります。このタイムチャート通りになっているか確認しましょう。 |
図8-64 RAM_X3の書き込みを拡大
最初のページへ
目次へ戻る
|