add denoise_autoencoder.py

jiangyangbo · jiangyangbo · commit 967cd49270f8 · 2019-09-25T15:35:14.000+08:00
diff --git a/chapter5_卷积神经网络/mycnn.py b/chapter5_卷积神经网络/mycnn.py
@@ -59,10 +59,11 @@ def forward(self, x):
 
 
 # 打印模型
-print(Cnn)
-
 model = Cnn(1, 10)  # 图片大小是28x28, 10
 
+# 打印模型
+print(model)
+
 # 定义loss和optimizer
 criterion = nn.CrossEntropyLoss()
 optimizer = optim.SGD(model.parameters(), lr=learning_rate)
diff --git a/chapter6_嵌入与表示学习/autoencoder.py b/chapter6_嵌入与表示学习/autoencoder.py
@@ -0,0 +1,110 @@
+import os
+import pdb
+import torch
+import torchvision
+from torch import nn
+from torch.autograd import Variable
+from torch.utils.data import DataLoader
+from torchvision import transforms
+from torchvision.datasets import MNIST
+from torchvision.utils import save_image
+from torchvision import datasets
+import matplotlib.pyplot as plt
+
+# 配置参数
+torch.manual_seed(1) #设置随机数种子，确保结果可重复                                                                                                      
+batch_size = 128  #批处理大小
+learning_rate = 1e-2  #学习率
+num_epochs = 10      #训练次数   
+
+#下载训练集 MNIST 手写数字训练集
+train_dataset = datasets.MNIST(
+        root='./data',  #数据保持的位置
+        train=True, # 训练集 
+        transform=transforms.ToTensor(),# 一个取值范围是[0,255]的PIL.Image
+                        # 转化为取值范围是[0,1.0]的torch.FloadTensor
+        download=True) #下载数据
+
+test_dataset = datasets.MNIST(
+       root='./data', 
+       train=False, # 测试集
+       transform=transforms.ToTensor())
+
+#pdb.set_trace()
+#数据的批处理，尺寸大小为batch_size, 
+#在训练集中，shuffle 必须设置为True, 表示次序是随机的
+train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
+test_loader = DataLoader(test_dataset, batch_size=10000, shuffle=False)
+
+class autoencoder(nn.Module):
+    def __init__(self):
+        super(autoencoder, self).__init__()
+        self.encoder = nn.Sequential(
+            nn.Linear(28 * 28, 1000),
+            nn.ReLU(True),
+            nn.Linear(1000, 500),
+            nn.ReLU(True), 
+            nn.Linear(500, 250), 
+            nn.ReLU(True), 
+            nn.Linear(250, 2)
+            )
+        self.decoder = nn.Sequential(
+            nn.Linear(2, 250),
+            nn.ReLU(True),
+            nn.Linear(250, 500),
+            nn.ReLU(True),
+            nn.Linear(500, 1000),
+            nn.ReLU(True), 
+            nn.Linear(1000, 28 * 28), 
+            nn.Tanh())
+
+    def forward(self, x):
+        x = self.encoder(x)
+        x = self.decoder(x)
+        return x
+
+#model = autoencoder().cuda()
+model = autoencoder()
+criterion = nn.MSELoss()
+optimizer = torch.optim.Adam(
+    model.parameters(), lr=learning_rate, weight_decay=1e-5)
+
+for epoch in range(num_epochs):
+    for data in train_loader:
+        img, _ = data
+        img = img.view(img.size(0), -1)
+        #img = Variable(img).cuda()
+        img = Variable(img)
+        # ===================forward=====================
+        output = model(img)
+        loss = criterion(output, img)
+        # ===================backward====================
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+    # ===================log========================
+    print('epoch [{}/{}], loss:{:.4f}'
+          .format(epoch + 1, num_epochs, loss.data.item()))
+
+
+#模型测试， 由于训练和测试 BatchNorm, Dropout配置不同，需要说明是否模型测试
+model.eval()
+eval_loss = 0
+import pdb
+#pdb.set_trace()
+for data in test_loader:  #test set 批处理
+    img, label = data
+
+    img = img.view(img.size(0), -1)
+    #img = Variable(img, volatile=True).cuda() # volatile 确定你是否不调用.backward(), 测试中不需要
+    img = Variable(img, volatile=True) 
+    label = Variable(label, volatile=True)
+    out = model(img)  # 前向算法 
+    out = out.detach().numpy()
+    y = (label.data).numpy()
+    plt.scatter(out[:, 0], out[:, 1], c = y)
+    plt.colorbar()
+    plt.title('audocoder of MNIST test dataset')
+    plt.show()
+
+
diff --git a/chapter6_嵌入与表示学习/denoise_autoencoder.py b/chapter6_嵌入与表示学习/denoise_autoencoder.py
@@ -0,0 +1,171 @@
+# Simple Convolutional Autoencoder
+import torch
+import torch.nn as nn
+import torch.utils as utils
+from torch.autograd import Variable
+import torchvision.datasets as dset
+import torchvision.transforms as transforms
+import numpy as np
+import matplotlib.pyplot as plt
+# 配置参数
+torch.manual_seed(1) #设置随机数种子，确保结果可重复
+n_epoch = 200 #训练次数
+batch_size = 100 #批处理大小
+learning_rate = 0.0002 #学习率
+
+#下载训练集 MNIST 手写数字训练集
+mnist_train = dset.MNIST("./", train=True, transform=transforms.ToTensor(), target_transform=None, download=True)
+train_loader = torch.utils.data.DataLoader(dataset=mnist_train,batch_size=batch_size,shuffle=True)
+
+# Encoder 模型设置
+class Encoder(nn.Module):
+    def __init__(self):
+        super(Encoder,self).__init__()
+        self.layer1 = nn.Sequential(
+                        nn.Conv2d(1,32,3,padding=1),   # batch x 32 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(32),
+                        nn.Conv2d(32,32,3,padding=1),   # batch x 32 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(32),
+                        nn.Conv2d(32,64,3,padding=1),  # batch x 64 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(64),
+                        nn.Conv2d(64,64,3,padding=1),  # batch x 64 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(64),
+                        nn.MaxPool2d(2,2)   # batch x 64 x 14 x 14
+        )
+        self.layer2 = nn.Sequential(
+                        nn.Conv2d(64,128,3,padding=1),  # batch x 128 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(128),
+                        nn.Conv2d(128,128,3,padding=1),  # batch x 128 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(128),
+                        nn.MaxPool2d(2,2),
+                        nn.Conv2d(128,256,3,padding=1),  # batch x 256 x 7 x 7
+                        nn.ReLU()
+        )
+        
+
+
+# Encoder 模型设置
+class Encoder(nn.Module):
+    def __init__(self):
+        super(Encoder,self).__init__()
+        self.layer1 = nn.Sequential(
+                        nn.Conv2d(1,32,3,padding=1),   # batch x 32 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(32),
+                        nn.Conv2d(32,32,3,padding=1),   # batch x 32 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(32),
+                        nn.Conv2d(32,64,3,padding=1),  # batch x 64 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(64),
+                        nn.Conv2d(64,64,3,padding=1),  # batch x 64 x 28 x 28
+                        nn.ReLU(),
+                        nn.BatchNorm2d(64),
+                        nn.MaxPool2d(2,2)   # batch x 64 x 14 x 14
+        )
+        self.layer2 = nn.Sequential(
+                        nn.Conv2d(64,128,3,padding=1),  # batch x 128 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(128),
+                        nn.Conv2d(128,128,3,padding=1),  # batch x 128 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(128),
+                        nn.MaxPool2d(2,2),
+                        nn.Conv2d(128,256,3,padding=1),  # batch x 256 x 7 x 7
+                        nn.ReLU()
+        )
+                
+    def forward(self,x):
+        out = self.layer1(x)
+        out = self.layer2(out)
+        out = out.view(batch_size, -1)
+        return out
+    
+#encoder = Encoder().cuda()
+encoder = Encoder()
+# decoder模型设置
+
+class Decoder(nn.Module):
+    def __init__(self):
+        super(Decoder,self).__init__()
+        self.layer1 = nn.Sequential(
+                        nn.ConvTranspose2d(256,128,3,2,1,1), # batch x 128 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(128),
+                        nn.ConvTranspose2d(128,128,3,1,1),   # batch x 128 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(128),
+                        nn.ConvTranspose2d(128,64,3,1,1),    # batch x 64 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(64),
+                        nn.ConvTranspose2d(64,64,3,1,1),     # batch x 64 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(64)
+        )
+        self.layer2 = nn.Sequential(
+                        nn.ConvTranspose2d(64,32,3,1,1),     # batch x 32 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(32),
+                        nn.ConvTranspose2d(32,32,3,1,1),     # batch x 32 x 14 x 14
+                        nn.ReLU(),
+                        nn.BatchNorm2d(32),
+                        nn.ConvTranspose2d(32,1,3,2,1,1),    # batch x 1 x 28 x 28
+                        nn.ReLU()
+        )
+        
+    def forward(self,x):
+        out = x.view(batch_size,256,7,7)
+        out = self.layer1(out)
+        out = self.layer2(out)
+        return out
+        
+        
+#decoder = Decoder().cuda()
+decoder = Decoder()
+
+parameters = list(encoder.parameters())+ list(decoder.parameters())
+loss_func = nn.MSELoss()
+optimizer = torch.optim.Adam(parameters, lr=learning_rate)
+
+# 噪声
+noise = torch.rand(batch_size,1,28,28)
+for i in range(n_epoch):
+    for image,label in train_loader:
+        image_n = torch.mul(image+0.25, 0.1 * noise)
+        #image = Variable(image).cuda()
+        image = Variable(image)
+        #image_n = Variable(image_n).cuda()
+        image_n = Variable(image_n)
+        optimizer.zero_grad()
+        output = encoder(image_n)
+        output = decoder(output)
+        loss = loss_func(output,image)
+        loss.backward()
+        optimizer.step()
+        break
+    print('epoch [{}/{}], loss:{:.4f}'
+          .format(i + 1, n_epoch, loss.data.item()))
+          
+          
+
+img = image[0].cpu()
+input_img = image_n[0].cpu()
+output_img = output[0].cpu()
+origin = img.data.numpy()
+inp = input_img.data.numpy()
+out = output_img.data.numpy()
+plt.figure('denoising autodecoder')
+plt.subplot(131)
+plt.imshow(origin[0],cmap='gray')
+plt.subplot(132)
+plt.imshow(inp[0],cmap='gray')
+plt.subplot(133)
+plt.imshow(out[0],cmap="gray")
+plt.show()
+print(label[0])