2020-01-01から1年間の記事一覧
メモ。くら寿司はPepperをやめて、ラズパイにしたのだろうか。 ラズパイ + Google Coralの組み合わせのようだけど、どこらへんにGoogle Coralを使っているのだろう。 QRコードを読み込むだけなら、ラズパイで十分な気がする。他にディープラーニングで画像認…
論文へのリンク An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale | OpenReview 筆者・所属機関 Anonymous authors Paper under double-blind review 目隠しレビュー中のため、著者非公開らしい。でも、きっとFacebookでしょ? …
論文へのリンク Array programming with NumPy | Nature 筆者・所属機関 Charles R. Harris(Independent researcher), K. Jarrod Millman(Berkeley) 投稿日付 2020/09/16 概要(一言まとめ) Pythonの数値計算ライブラリとしてお馴染みにのNumpyの論文。なん…
論文へのリンク [2005.14140] Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection 筆者・所属機関 投稿日付 2020/04/22 概要(一言まとめ) 手法の概要 コメント 関連情報 この論文の凄さは、「DNNは学習してい…
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて TensorFlow User Group Meetup - ベイズ分科会 - connpassでの発表資料 世界モデルというのは、やっていることはもろSLAMっぽいけど、違いがよく分からない。 Pixyzという深層生成モデ…
論文へのリンク An Empirical Study of Spatial Attention Mechanisms in Deep Networks [1904.05873] An Empirical Study of Spatial Attention Mechanisms in Deep Networks 筆者・所属機関 Xizhou Zhu1,3, Dazhi Cheng2,3 ,Zheng Zhang3 ,Stephen Lin3 ,J…
論文へのリンク [1912.02292] Deep Double Descent: Where Bigger Models and More Data Hurt 筆者・所属機関 Preetum Nakkiran(Harvard University), Gal Kaplun(Harvard University), Yamini Bansal(Harvard University), Tristan Yang(Harvard University…
CVPR2020 みつけたものをメモ CVPR2020まとめ CVPR 2020 報告 xpaper.challenge(Hirokatsu KATAOKA) cvpaper. challenge’s Presentations on SlideShare CVPR2020 Report - Speaker Deck CVPR2020サーベイまとめ(一覧) CVPR2020話題 【ボタ山話#13】CVPR20…
技育祭とは 内容のアーカイブ 400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck 国内最大級の学生エンジニア向け…
物体検出といえば、Object Detection、Semantic Segmentation, Instance Segmentationだと思っていたのですが、更にPanoptic Segmentationなるものもあるらしいです。 引用元:コンピュータビジョンの最新論文調査 Segmentation 編 · DeNA Engineers' Blog S…
論文へのリンク [2006.09994] Noise or Signal: The Role of Image Backgrounds in Object Recognition 筆者・所属機関 Kai Xiao, Logan Engstrom, Andrew Ilyas, Aleksander Madry 全員 MIT 投稿日付 2020/06/17 概要(一言まとめ) 物体認識のとき、ニュー…
論文へのリンク End-to-End Object Detection with Transformers 筆者・所属機関 Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko 全員 Facebook 投稿日付 2020/05/27 概要(一言まとめ) BERT…
論文へのリンク [1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection 筆者・所属機関 Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra Indian Institute of Technology Gandhinagar, Gujarat, In…
物体検出のサーベイ論文 サーベイ論文だけでもたくさんありすぎでは? [1907.09408] A Survey of Deep Learning-based Object Detection [1908.03673] Recent Advances in Deep Learning for Object Detection [1809.02165] Deep Learning for Generic Objec…
GTC2020 新型コロナの影響で今年はオンライン開催。YouTubeで公開されている Part 1: CEO Jensen Huang Introduces Data-Center-Scale Accelerated Computing CEOのKeynote。 最初はCOVID-19の話 NVIDIAの技術の活用例のイメージビデオ Part 2: NVIDIA RTX –…
論文へのリンク Jukebox: A Generative Model for Music 筆者・所属機関 Prafulla Dhariwal * 1, Heewoo Jun * 1, Christine Payne * 1, Jong Wook Kim * 1, Alec Radford * 1 ,Ilya Sutskever * 1 1 OpenAI, San Francisco. Correspondence 投稿日付 2020/0…
そもそもコンピューターは知能の大体を目的として作られた。人工知能のつくるためのもの コンパイラは翻訳機。プログライング言語からマシン語への変換 人間の使う言語から言語の変換(翻訳)は難しい
何かに使いたいと思いながら、何にもできていない強化学習。個人的なメモをまとめておいて一回封印します。 まとめ的なリンク 自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常 GitHub - komi1230/Resume 深層強化学習の最前線 - Speaker D…
論文へのリンク [2004.10634] Unpaired Photo-to-manga Translation Based on The Methodology of Manga Drawing 筆者・所属機関 Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan 全員 Beihang University(北京大学) 投稿日付 2020/04/…
論文へのリンク [2001.05049] DeepFactors: Real-Time Probabilistic Dense Monocular SLAM 筆者・所属機関 Jan Czarnowski, Tristan Laidlow, Ronald Clark, and Andrew J. Davison 全員所属はDyson Robotics Laboratory, Imperial College London 注:Dyso…
論文へのリンク 3D Photography using Context-aware Layered Depth Inpainting(Google Drive) [2004.04727] 3D Photography using Context-aware Layered Depth Inpainting 筆者・所属機関 Meng-Li Shih(Virginia Tech, National Tsing Hua University), Sh…
論文へのリンク [1812.07179] Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving [1906.06310] Pseudo-LiDAR++: Accurate Depth for 3D Object Detection in Autonomous Driving 筆者・所属機関 …
論文へのリンク [1710.09412] mixup: Beyond Empirical Risk Minimization mixup: Beyond Empirical Risk Minimization 筆者・所属機関 Hongyi Zhang(MIT), Moustapha Cisse(FAIR), Yann N. Dauphin(FAIR), David Lopez-Paz(FAIR) 投稿日付 2017/10/25 概要…
個人的メモ。いつかちゃんとまとめる。 モダンな深層距離学習 (deep metric learning) 手法: SphereFace, CosFace, ArcFace - Qiita scikit-learn-contrib の Metric Learning を試す - u++の備忘録 FaceNet(顔認識)を動かしてみた - ハードウェア技術者のス…
論文へのリンク [1905.11946] EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 筆者・所属機関 Mingxing Tan(Google Brain), Quoc V. Le(Google Brain) 投稿日付 2019/05/28 概要(一言まとめ) 2019年時点でState of the artの…
富士フィルムで、写真の撮影された年代を当てるという面白いコンペがあったらしい。 なんと、上位者の商品は、フジフィルムのX100Fだったらしい。めっちゃ良い… FUJIFILM デジタルカメラ X100F シルバー X100F-S発売日: 2017/02/23メディア: エレクトロニク…
論文へのリンク [1706.05587] Rethinking Atrous Convolution for Semantic Image Segmentation DeepLabV3 [1802.02611] Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation DeepLabV3+ 筆者・所属機関 Liang-Chieh Chen(G…
論文へのリンク [2001.05566] Image Segmentation Using Deep Learning: A Survey 筆者・所属機関 Shervin Minaee(Expedia Inc, and New York University), Yuri Boykov (University of Waterloo), Fatih Porikli(Australian National University, and Huawe…
論文へのリンク A Discriminative Feature Learning Approach for Deep Face Recognition 筆者・所属機関 Yandong Wen (1), Kaipeng Zhang (1), Zhifeng Li (1), and Yu Qiao (1,2) Shenzhen Key Lab of Computer Vision and Pattern Recognition Shenzhen I…