からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

SIGGRAPH 2018個人的まとめ

技術メモ論文

SIGGRAPH（シーグラフ）2018

　SIGGRAPH（Special Interest Group on Computer GRAPHics）。個人的メモ

Color in Advanced Displays: HDR, OLED, AR & VR

Color in advanced displays

ACM SIGGRAPH 2018 Courses

Deep Video Portraits

Deep Video Portraits

HeadOn: Real-time Reenactment of Human Portrait Videos

HeadOn: Real-time Reenactment of Human Portrait Videos(pdf)

In the Blink of an Eye – Leveraging Blink-Induced Suppression for Imperceptible Position and Orientation Redirection in Virtual Reality

In the Blink of an Eye – Leveraging Blink-Induced Suppression for Imperceptible Position and Orientation Redirection in Virtual Reality

参考リンク

ラズパイで動く火星探査用のローバー小型版のソフトウェアが設計書一式と共にGitHubで公開

火星探査用のローバー小型版のソフトウェアが設計書一式と共にGitHubで公開されてる。ラズパイで動く。夏休みの宿題に良いかもw / “GitHub - nasa-jpl/open-source-rover: A build-it…” https://t.co/1cZepZx2ui
— からあげ (@karaage0703) 2018年8月8日

GitHub - nasa-jpl/open-source-rover: A build-it-yourself, 6-wheel rover based on the rovers on Mars!

Build Your Own Rover | Science and Technology

RefineNet

論文

論文へのリンク

[1611.06612] RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

筆者・所属機関

Guosheng Lin, Anton Milan, Chunhua Shen, Ian Reid

投稿日付

2016/11/20

概要（一言まとめ）

　セマンティックセグメンテーション(Semantic Segmentation)のネットワーク。従来のCNNベースのモデルだと、画像の解像度が下がってしまう問題があったが、refinenetと呼ばれるマルチパスを持つネットワークによりこれを解決する。

手法の概要

　以下みたいなネットワーク構造がキモらしい f:id:karaage:20180813102045p:plain

　以下がResNet f:id:karaage:20180813102103p:plain

コメント

関連情報

ディープラーニングにおけるセマンティックセグメンテーションのガイド2017年版 | POSTD

RefineNet on Chainer - Sigfossの開発者ブログ

GitHub - ponta256/chainer_refinenet

GitHub - mrgloom/awesome-semantic-segmentation: awesome-semantic-segmentation

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

Depth Cameras: A State-of-the-Art Review（デプスカメラのまとめ）

技術メモ

"Depth Cameras: A State-of-the-Art Overview," a Presentation from Aquifi from Embedded Vision Alliance

www.youtube.com

概要

デプスカメラ（3Dカメラ）のまとめ

内容メモと自分の補足

デプスカメラはピクセルごとの深度（デプス）情報が取得できる
応用は AR/VR Robotics 画像処理（疑似ボケ）ビデオ会議、ゲーム
主な方式は ToF/Structured-light/Active stereo/Passive stereo
ToFはキネクトv2、ホロレンズ。Structured-lightはキネクトv1、Xtion、Realsense SR300。Active StereoはRealsense R200, D400。Passive StereoはZED等（普通のステレオカメラ）
メーカーは、マイクロソフト、インテル、アップル、PMD、ZED等。キネクトv1のセンサを開発したPrimesenseはアップルに買収された（iPhone Xにつながる）
視差（Parallax）による三角測量（Triangulation）
ToFは光の位相差から距離を取得する

Learning Face Age Progression: A Pyramid Architecture of GANs

論文へのリンク

[1711.10352] Learning Face Age Progression: A Pyramid Architecture of GANs

筆者・所属機関

投稿日付

2017/11/28

概要（一言まとめ）

　年をとったときの顔をGANを使って生成する。似たようなものはたくさんあると思うけど、クオリティが高いのが特徴なのかな？多分

f:id:karaage:20180728110426p:plain

手法の概要

　以下のようなピラミッド型の構造が肝なんだと思う。後で見てみる

f:id:karaage:20180728110412p:plain

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

Single-Shot Object Detection with Enriched Semantics

論文

論文へのリンク

[1712.00433] Single-Shot Object Detection with Enriched Semantics

筆者・所属機関

投稿日付

概要（一言まとめ）

セマンティックセグメンテーション的な考え（？）を取り入れることで物体検出の性能をスピード、精度ともに向上させる（？）セマンティックセグメンテーションのための、アノテーションは不要で、バウンディングボックスでの教師データからセグメンテーションの教師データは生成される（？）

新規性（何が過去の研究に比べて凄い？）

特別なアノテーションデータの追加の必要なく、セマンティックセグメンテーション的な考え方で物体検出の性能を向上している

手法の概要

コメント

　よく理解できなかった。概要も間違っているかも…

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

ACL2018読み会

論文

　自然言語処理の有名な学会ACL2018の論文を読む会