2021-01-30

ディープラーングの性能はデータ集めて札束で殴り続けると向上し続ける！？「Scaling Law」

論文

論文へのリンク

筆者・所属機関

Jared Kaplan(Johns Hopkins University, OpenAI), Sam McCandlish(Open AI), ...
Tom Henighan(Open AI), Jared Kaplan(Johns Hopkins University, OpenAI), ...

投稿日付

2020/01/23
2020/10/28

概要（一言まとめ）

　ディープラーニングの性能は、データのサイズD, モデルのパラメータ数N, 札束 Cmin （論文ではcompute budgetと表現）が支配的なことを実験的に示した身も蓋もない内容。この法則をデータスケーリング則(Scaling Law)と呼んでいる。

手法の概要

　以下が詳しい。

OpenAIが発見したScaling Lawの秘密 - ディープラーニングブログ

「テクニックなんて無駄で、データ集めてでかいモデルでガンガン学習させた方が勝ちなんじゃ！」と宣言しているような内容。

言われてみれば、それはそうかもしれないけど、それだけだと寂しいよね、とは思ったりする。

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

2021-01-30

DataAugmentaionは2回やれ

論文

論文へのリンク

[1909.09148] Data Augmentation Revisited: Rethinking the Distribution Gap between Clean and Augmented Data

筆者・所属機関

Zhuoxun He 1 Lingxi Xie 2 Xin Chen 3 Ya Zhang 1 Yanfeng Wang 1 Qi Tian 2

1 Shanghai Jiao Tong University 2Huawei Noahs Ark Labc 3Tongji University

投稿日付

2019/09/11

概要（一言まとめ）

Data Augmentationを最後の数epochs、減らして（無しで）学習させることで性能があがる

手法の概要

Data Augmentation正則化としてとらえて、汎化誤差と経験損失の観点で性能向上の理由を説明？

Data Augmentationを正則化として捉え、汎化性能を向上させる反面、経験損失が増加するリスクがあると考察。
最初に大量にData AugmentationしてData Augmentationを減らして学習することで、汎化誤差と経験損失のバランスが取れ、精度が向上。
現実にもよく使われる印象。https://t.co/6wRMsPxu5V
— goto yuta (@goto_yuta_) January 20, 2021

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

empirical 経験的

2021-01-30

ニューラルネットワークを用いたRAW現像

論文

論文へのリンク

[2101.04442] Joint Demosaicking and Denoising in the Wild: The Case of Training Under Ground Truth Uncertainty

筆者・所属機関

Jierun Chen, Song Wen, S.-H. Gary Chan

Department of Computer Science and EngineeringThe Hong Kong University of Science and Technology, Hong Kong, China

投稿日付

2021/01/12

概要（一言まとめ）

ニューラルネットを用いたRAW画像からのデモザイクとノイズ除去を行いState-of-the-art達成。

手法の概要

　Twitterを引用。

RAW画像からのデモザイクとノイズ除去を行う。Dataset中のGround Truthも画像処理プロセス(ISP)を通っているので劣化しているのでそのまま学習するのは問題であると指摘し真のGTからの劣化過程をモデル化し真のGTらしさ(尤度)を最大化するようにLossを定式化したのがキモ。https://t.co/QxutdlNbVC pic.twitter.com/9Pr13YgJj8
— Teppei Kurita (@kuritateppei) January 26, 2021