●ある程度の「逐次化」が必要
SSD物体認識を最大限並列化すると画像1枚(300x300画素)を900kサイクル程度で推論できます。しかし上記のようにFPGAに入りきらなくなるため、ある程度は「逐次処理」させる必要があります。
さしあたり「64倍逐次化」として回路を減らします。すなわち同一のリソースを64回時分割で使用するのでサイクル数は64倍、900
x 64 = 約60Mサイクルになります。クロック100MHzで動かすと10ns x 60M = 約600msで画像1枚推論できることになります。
●将来的にはもっと並列化する
もっと高速にしたい場合は「並列化」と「FPGA容量」とのトレードオフになります。「並列化度合」を上げるためには現状は高価なFPGAが必要になりそうです。しかし将来的には安価で大容量なFPGAが出てくるでしょうからそれを待つ手もあります。 |