書名: 深度學習初學者指南作者名: (智)巴勃羅·里瓦斯本章字數: 455字更新時間: 2021-12-01 13:58:51
3.5.1 尺度縮放
我們重新加載MNIST數據集,正如之前所做的:

然后,可以簡單地調用rescale()方法來創建一個尺度被重新縮放的圖像。調整圖像尺度大小的目的是將其重新縮放到原始大小,使得圖像看起來像原始圖像的一個較低分辨率的圖像。在縮放過程中,圖像會失去一些特征,但實際上可以由此訓練出一個更加健壯的深度學習模型。也就是說,這個模型對圖像中目標的尺度具有更好的健壯性。

對于要處理的原始圖像x,可以按如下方式對其進行縮小和放大:

此時,增強(尺度縮放)的圖像在x_中。注意,在本例中,圖像被縮小了2倍(50%),然后又被放大了2倍(200%)。multichannel參數設置為false,因為圖像只有一個通道,這意味著它們是灰度圖像。
在進行尺度縮放時,要注意需要按能夠對分辨率進行精確等分的因子進行縮放。例如,一張28×28的圖像,如果縮小0.5倍,就會變成14×14,這挺好的。但如果縮小0.3倍,就會縮小到8.4×8.4,也就是9×9,因為這會增加不必要的復雜情況,所以并不好。要盡量保持簡單。
除了尺度縮放之外,還可以稍微修改現有數據,使現有數據既發生一些變化,又不至于偏離原始數據,下面對此進行討論。