●ハードウエア化するのなら速くないと意味がない
第2章のような「逐次処理のVHDL」では(*3)あまりハードウエア化する意味がありません。そこで第3章で徐々に並列化、パイプライン化し、最終的には41.9倍も高速になりました。
(*3)例えば高位合成ツール(HLS, High Level Synthesis)などを何も考えずに使うと、第2章のような逐次処理のVHDLになりがち。
●FPGAならPythonの10倍高速になる?
画像1枚あたりの推論時間が11usということは、10,000枚で110,000us = 110msになります。それに対し、Pythonでの推論時間はここで述べたように1秒程度に感じられます。したがってVHDL化により10倍程度のスピードアップが可能になるかもしれません。
次章ではいよいよディープラーニングをFPGAに実装したいと思います。お楽しみに! |