論文へのリンク
[1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors
筆者・所属機関
George Plastiras(University of Cyprus), Christos Kyrkou(University of Cyprus), Theocharis Theocharides(University of Cyprus)
投稿日付
2019/11/14
概要(一言まとめ)
高解像度の動画を性能を下げずに、高速度・低電力でディープラーニングによる物体検出をする手法
エッジデバイス向けで、UAVなどを想定しているよう。
手法の概要
論文より引用
上図のように、3ステージに分けているのがポイント。
1ステージは通常のCNNによる物体検出で、3ステージはLucas-Kanade法による昔からある手法でのトラッキングなので、ポイントは2ステージ。
1ステージで検出した対象が、コーナーの4隅に来るような5種類のサイズのタイルを生成する。これにより1ステージで検出した物体1つに対して20個のタイルが生成される。
これらのタイルから、Effective Processing Time(EPT)と呼ばれる、物体を効率よく検出できる指標を元に1番良いものを選ぶ。最終的には、すべての検出した対象をカバーするようなタイルの組み合わせを選ぶ。
それらのタイルに対して、更にCNNによる検出をかけることで、性能と速度の向上の両立を狙う。
コメント
タイルの工夫は、3回くらい読み直して理解できた(と思う)。なかなか面白いなと思った。考え方、何かに応用できそう。
関連情報
次に読む論文
自分なりのアウトプット
気になった英単語・英語表現
- hierarchical 階層的
- outperform より性能が良い