また同図では1〜3層目までの演算が69.9us (6.99kサイクル)で終了しています(*2)。前章では461us (46.1kサイクル)だったので、全体でも約6.6倍高速化しています。
(*2)最初の5usはリセット期間なので74.9 - 5 = 69.9us
●今度は2層目が支配的になった
各層でかかるサイクル数(MNIST画像1枚あたり)とその割合を表3-02に示します。
表3-02 今度は2層目の割合が大きくなった(1サイクル = 10ns)
|
1層目 |
2層目 |
3層目 |
全体 |
時間 |
8.4us |
50.5us |
11us |
69.9us |
サイクル数 |
0.84k |
5.05k |
1.1k |
6.99k |
割合 |
12% |
72% |
15% |
100% |
●次章では2層目を並列化する
本章では1層目を並列化しましたが、その結果表3-02に示すように、今度は2層目のサイクル数が72%と大部分を占めるようになりました。
次章では2層目を並列化して更なるスピードアップを図ります。お楽しみに!
|