10/2017 読んだもの

38. Fast-AT: Fast Automatic Thumbnail Generation using Deep Neural Networks , CVPR2017 1枚の画像から,アスペクト比を指定してサムネイルを生成.アスペクト比ごとに畳み込み層のカーネルを使い分ける. 物体検出のフレームワークが元.saliencyは利…

9/2017 読んだもの

28. Learning from Simulated and Unsupervised Image through Adversarial Training シミュレータで画像を生成した時についてくるアノテーション情報と,refineした画像が食い違わないようにする工夫が面白い. 現実的な画像に近づけられたかをどう定量的に…

~8/2017 読んだもの

1. Generative Adversarial Nets 2. unsupervised representation learning with deep convolutional generative adversarial networks (pdf) 3. Image-to-Image Translation with Conditional Adversarial Networks (pdf) 4. InfoGAN 5. Pose Guided Person…

Globally and Locally Consistent Image Completionを試す

SIGGRAPH 2017で発表された「Globally and Locally Consistent Image Completion」を簡略し実験した記録です.(ディープネットワークによるシーンの大域的かつ局所的な整合性を考慮した画像補完) 論文へのリンク: http://hi.cs.waseda.ac.jp/~iizuka/proje…

Pose Guided Person Image Generation

5/25 arXivに投稿された,Pose Guided Person Image Generation という論文を読みました. [1705.09368] Pose Guided Person Image Generation Pose Guided Person Generation Network 服や人の情報を残して,任意のポーズを取った,人の画像を生成したい. …

infoGANを実装した(い)

infoGANの論文を読み,MNIST用の実装をPyTorchで行った記録です. 論文は2016年6月に出ているので1年ほど前のもの. [1606.03657] InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets タイトルを日本語…

自己符号化器,AutoEncoderの実装

機械学習プロフェッショナルシリーズの「深層学習」のChapter5を参考に,PyTorchでAutoEncoderの実装を行いました. パラメータとしては, 入出力層が28x28次元, 中間層が100次元, (28x28 -> 100 -> 28x28) 中間層の活性化関数はReLU, 出力層の活性化関…

シンプルなGANの実装

GANの論文を読んだついでにMNIST用に実装しました. ネットワークには,Convolutionを使わず,多層ニューラルネットです.層の数,活性化関数やバッチ正規化などの設定はてきとうです.なのでGANもどきです. がんもどき pytorchで実装したかったので,本家…