からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

CNNの不思議「Deep Image Prior」

論文へのリンク

[1711.10925] Deep Image Prior

筆者・所属機関

Dmitry Ulyanov(Skoltech), Andrea Vedaldi(University of Oxford), Victor Lempitsky(Skoltech)

投稿日付

2018/04/05

概要(一言まとめ)

 CNNモデルに対して、入力をノイズ、出力の教師画像をノイズ画像、欠損画像、ボケた画像にして学習を進めたとき、学習途中で、教師画像より高品質(ノイズレス、欠損無し、超解像)画像が得られるという驚くべき内容。

手法の概要

f:id:karaage:20191209164647p:plain

f:id:karaage:20191209164706p:plain

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

データオーギュメンテーションの決定版?「AUGMIX」

論文へのリンク

[1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors

筆者・所属機関

Anonymous authors (匿名でのレビュー中)

投稿日付

2019/11/09

概要(一言まとめ)

 Data Augmentationの1手法。論文より引用した以下の画像が分かりやすい。ほぼこれが全て。

f:id:karaage:20191209132444g:plain:w640

手法の概要

 以下が詳しいので、ここでは省略。

コメント

 データオーギュメンテーション、どんどん新しい手法が出てくるなというのが印象。

 なんとなく、この辺りの前処理はドメインによって最適な手法が異なる気がするので、今のデータセットに特化した手法が出ているような気がしなくもない(それを言ったら、ネットワーク構造もそうなのだけど)。

 そのうち更に決定版的なものが出てくるのだろうか?

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

絵みたいなQRコードを作る

f:id:karaage:20191128100022p:plain:w640

上の図は以下から引用

Generation of Photorealistic QR Codes

 今はこんなことまでできちゃうのね。誤り訂正機能を活用しているのかな?

参考サイト

MobileHackerz再起動日記: 「真に」デザインされたQRコードのつくりかた

ニューラルネットワークでQRコードを解読する - プログラミング素人のはてなブログ

高解像度動画のエッジデバイス用物体検出手法「EdgeNet」

論文へのリンク

[1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors

筆者・所属機関

George Plastiras(University of Cyprus), Christos Kyrkou(University of Cyprus), Theocharis Theocharides(University of Cyprus)

投稿日付

2019/11/14

概要(一言まとめ)

高解像度の動画を性能を下げずに、高速度・低電力でディープラーニングによる物体検出をする手法

エッジデバイス向けで、UAVなどを想定しているよう。

手法の概要

f:id:karaage:20191120175805p:plain:w640
論文より引用

 上図のように、3ステージに分けているのがポイント。

 1ステージは通常のCNNによる物体検出で、3ステージはLucas-Kanade法による昔からある手法でのトラッキングなので、ポイントは2ステージ。

 1ステージで検出した対象が、コーナーの4隅に来るような5種類のサイズのタイルを生成する。これにより1ステージで検出した物体1つに対して20個のタイルが生成される。

 これらのタイルから、Effective Processing Time(EPT)と呼ばれる、物体を効率よく検出できる指標を元に1番良いものを選ぶ。最終的には、すべての検出した対象をカバーするようなタイルの組み合わせを選ぶ。

 それらのタイルに対して、更にCNNによる検出をかけることで、性能と速度の向上の両立を狙う。

コメント

 タイルの工夫は、3回くらい読み直して理解できた(と思う)。なかなか面白いなと思った。考え方、何かに応用できそう。

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

  • hierarchical 階層的
  • outperform より性能が良い

ディープラーニングによる物体検出のサーベイ論文 その2

論文へのリンク

[1908.03673] Recent Advances in Deep Learning for Object Detection

筆者・所属機関

Xiongwei Wua(School of Information System, Singapore Management University),Doyen Sahooa, Steven C.H. Hoi(School of Information System, Singapore Management University / Salesforce Research Asia)

投稿日付

2019/08/10

概要(一言まとめ)

ディープラーニングによる物体検出手法を比較・調査しているサーベイ論文。

手法の概要

サーベイ論文。以下の内容がまとまっており、物体検出の理解を深めるのによい論文

  • ディープラーニング以前の手法(探索・特徴量抽出・分類の3ステップ)の解説
  • ディープラーニングの発展に関しての概略
  • ディープラーニングによる物体検出の2ステージの手法と1ステージの手法の概要
  • 物体検出の評価方法
  • 物体検出のアルゴリズムの紹介・性能比較
  • 物体検出応用例

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

  • spur 拍車をかける
  • hierarchical 階層的
  • spatial-invariant 空間不変量
  • neocognitron 福島邦彦によって提唱されたネットワーク(ディープラーニングの元祖)

オートエンコーダを使った異常検知の性能向上

論文へのリンク

[1807.02011] Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders

筆者・所属機関

Paul Bergmann(MVTec Software GmbH), Sindy Lo ̈we(MVTec Software GmbH / University of Amsterdam) , Michael Fauser1, David Sattlegger(MVTec Software GmbH), and Carsten Steger(MVTec Software GmbH)

投稿日付

2018/07/05

概要(一言まとめ)

オートエンコーダで異常検知。精度良好、可視化もできる。

手法の概要

従来の方式(多分、オートエンコーダを使って得た画像と元画像をピクセルレベルで差分比較して異常検知)に対して、輝度、コントラスト、構造情報を上手く用いることで、精度を向上させている。

詳しくは後で読み込む。

コメント

関連情報

【まとめ】ディープラーニングを使った異常検知 - Qiita

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現