●3層目の結果や途中経過も確認

 図3-32は3層目の結果の部分です(23us付近)。このEXCELのa3の行と
ピタリ一致しています。途中経過も確認してみてください。


   図3-32 23us付近から3層目の結果


●2層目は5.9倍高速化

 図3-33はシミュレーションのフル画面です。2層目の演算は8.5us (
0.85kサイクル)で終了します。前節では50.5us (5.05kサイクル)だったので、2層目は約5.9倍高速化しました。(*1)

(*1) 7並列で演算するが、多少のオーバヘッドもあり、5.9倍となった。


  図3-33 2層目は8.5usかかる(W1BUSY_NがHになってからW2BUSY_NがHになるまで)

全体でも2.5倍速くなった

 また同図では1〜3層目までの演算が27.9us (
2.79kサイクル)で終了しています(*2)。前節では69.9us (6.99kサイクル)だったので、全体でも約2.5倍高速化しています。

(*2)最初の5usはリセット期間なので32.9 - 5 = 27.9us


●今後のパイプライン化を考えてサイクル数のバランスを良くする

 各層でかかるサイクル数(MNIST画像1枚あたり)とその割合を表3-21に示します。1層目、2層目と並列化した結果、3層目のサイクル数が一番長くなりました。

  表3-21 
全層が30%台でバランスが良い(1サイクル = 10ns)
1層目 2層目 3層目 全体
時間 8.4us 8.5us 11us 27.9us
サイクル数 0.84k 0.85k 1.1k 2.79k
割合 30% 30% 39% 100%


●次節ではパイプライン化する

 ここで述べたように、パイプライン化するには各層のサイクル数のバランスをとる必要があります。表3-21を見ると最長でも30%台なので、このまま次節で
パイプライン化したいと思います。お楽しみに!

最初のページへ


目次へ戻る