舉報

會員
生成對抗網絡GAN:原理與實踐
最新章節:
封底
這是一本系統講解GAN理論、模型、常見問題,并為視覺和語音領域的大部分應用場景提供GAN解決方案和綜合實例的著作。作者在人工智能領域積累頗深,這本書得到了前阿里巴巴達摩院華先勝和中國科學院自動化所劉成林的推薦。前4章有針對性地講解GAN的理論,幫助讀者夯實基礎;后8章講解應用,用大量經典的模型和9個案例,為8個應用場景提供了GAN解決方案。第1~4章首先介紹了無監督生成模型、顯式生成模型、以GAN為代表的隱式生成模型等各種生成模型的理論和原理;然后講解了GAN中的目標函數及其數學原理、GAN在訓練中的常見問題和相應解決方案、GAN的評價指標和可視化等;第5~12章分別講解了圖像生成GAN的各類模型與應用、圖像翻譯GAN的各類模型與應用、人臉圖像編輯GAN的各類模型與應用、圖像質量增強GAN的各類模型與應用、三維圖片與視頻生成GAN的各類模型與應用、通用的圖像編輯GAN框架、對抗攻擊以及GAN在其中的應用、GAN在語音信號處理中的實戰應用。全書內容理論體系完善,GAN的目標優化、訓練、評估等內容同類書中極少提及;內容豐富、循序漸進,覆蓋視覺和語音中的絕大部分應用場景;實戰性強,9個綜合案例,提供案例源代碼和解讀,以及實驗數據和實驗結果對比分析;圖文并茂,包含大量原創圖表,可讀性強。
目錄(249章)
倒序
- 封面
- 版權信息
- 內容簡介
- 前言
- 第1章 生成模型
- 1.1 無監督學習與生成模型
- 1.1.1 監督學習與無監督學習
- 1.1.2 判別模型與生成模型
- 1.1.3 無監督生成模型
- 1.2 顯式與隱式生成模型
- 1.2.1 極大似然估計法
- 1.2.2 完全可見置信網絡
- 1.2.3 流模型
- 1.2.4 變分自編碼器
- 1.2.5 玻爾茲曼機
- 1.2.6 隱式生成模型
- 參考文獻
- 第2章 目標函數優化
- 2.1 GAN
- 2.1.1 GAN概述
- 2.1.2 GAN模型
- 2.1.3 GAN的本質
- 2.2 LSGAN
- 2.3 EBGAN
- 2.4 fGAN
- 2.5 WGAN
- 2.5.1 分布度量
- 2.5.2 WGAN目標函數
- 2.6 Loss-sensitive GAN
- 2.7 WGAN-GP
- 2.8 IPM
- 2.8.1 IPM概念
- 2.8.2 基于IPM的GAN
- 2.8.3 IPM與f散度
- 2.9 其他目標函數
- 2.9.1 RGAN
- 2.9.2 BEGAN
- 參考文獻
- 第3章 訓練技巧
- 3.1 GAN訓練的3個問題
- 3.1.1 梯度消失
- 3.1.2 目標函數不穩定性
- 3.1.3 模式崩潰
- 3.2 退火噪聲
- 3.3 譜正則化
- 3.3.1 特征值與奇異值
- 3.3.2 譜范數與1-Lipschitz限制
- 3.4 一致優化
- 3.4.1 歐拉法
- 3.4.2 GAN動力學系統
- 3.4.3 一致優化算法
- 3.5 GAN訓練技巧
- 3.5.1 特征匹配
- 3.5.2 歷史均值
- 3.5.3 單側標簽平滑
- 3.5.4 虛擬批正則化
- 3.5.5 TTUR
- 3.5.6 0中心梯度
- 3.5.7 其他建議
- 3.6 模式崩潰解決方案
- 3.6.1 unrolledGAN
- 3.6.2 DRAGAN
- 3.6.3 Minibatch判別器與PGGAN
- 3.6.4 MADGAN與MADGAN-Sim
- 3.6.5 VVEGAN
- 參考文獻
- 第4章 評價指標與可視化
- 4.1 評價指標
- 4.1.1 評價指標的要求
- 4.1.2 IS系列
- 4.1.3 FID
- 4.1.4 MMD
- 4.1.5 Wasserstein距離
- 4.1.6 最近鄰分類器
- 4.1.7 GANtrain與GANtest
- 4.1.8 NRDS
- 4.1.9 圖像質量度量
- 4.1.10 平均似然值
- 4.2 GAN可視化
- 4.2.1 設置模型
- 4.2.2 訓練模型
- 4.2.3 可視化數據
- 4.2.4 樣例演示
- 參考文獻
- 第5章 圖像生成
- 5.1 圖像生成應用
- 5.1.1 訓練數據擴充
- 5.1.2 數據質量提升
- 5.1.3 內容創作
- 5.2 深度卷積GAN
- 5.2.1 DCGAN原理
- 5.2.2 DCGAN的思考
- 5.3 條件GAN
- 5.3.1 有監督條件GAN
- 5.3.2 無監督條件GAN
- 5.3.3 半監督條件GAN
- 5.3.4 復雜形式的條件輸入
- 5.4 多尺度GAN
- 5.4.1 LAPGAN
- 5.4.2 Progressive GAN
- 5.5 屬性GAN
- 5.5.1 顯式屬性GAN
- 5.5.2 隱式屬性GAN
- 5.6 多判別器與生成器GAN
- 5.6.1 多判別器GAN
- 5.6.2 多生成器GAN
- 5.7 數據增強與仿真GAN
- 5.7.1 數據增強GAN
- 5.7.2 數據仿真GAN
- 5.8 DCGAN圖像生成實踐
- 5.8.1 項目解讀
- 5.8.2 實驗結果
- 5.9 StyleGAN人臉圖像生成實踐
- 5.9.1 項目簡介
- 5.9.2 模型解讀
- 5.9.3 預訓練模型的使用
- 5.9.4 小結
- 參考文獻
- 第6章 圖像翻譯
- 6.1 圖像翻譯基礎
- 6.1.1 什么是圖像翻譯
- 6.1.2 圖像翻譯任務的類型
- 6.2 有監督圖像翻譯模型
- 6.2.1 Pix2Pix
- 6.2.2 Pix2PixHD
- 6.2.3 Vid2Vid
- 6.3 無監督圖像翻譯模型
- 6.3.1 基于域遷移與域對齊的無監督模型
- 6.3.2 基于循環一致性約束的無監督模型
- 6.4 圖像翻譯模型的關鍵改進
- 6.4.1 多領域轉換網絡StarGAN
- 6.4.2 豐富圖像翻譯模型的生成模式
- 6.4.3 給模型添加監督信息
- 6.5 基于Pix2Pix模型的圖像上色實踐
- 6.5.1 數據處理
- 6.5.2 模型代碼解讀
- 6.5.3 模型訓練與測試
- 6.5.4 小結
- 參考文獻
- 第7章 人臉圖像編輯
- 7.1 人臉表情編輯
- 7.1.1 表情編輯問題
- 7.1.2 關鍵點控制的表情編輯模型
- 7.2 人臉年齡編輯
- 7.2.1 年齡編輯問題
- 7.2.2 基于潛在空間的條件對抗自編碼模型
- 7.3 人臉姿態編輯
- 7.3.1 姿態編輯問題
- 7.3.2 基于3DMM的姿態編輯模型
- 7.4 人臉風格編輯
- 7.4.1 風格編輯問題
- 7.4.2 基于注意力機制的風格化模型
- 7.5 人臉妝造編輯
- 7.5.1 妝造編輯問題
- 7.5.2 基于GAN的妝造遷移算法
- 7.6 人臉換臉編輯
- 7.6.1 身份編輯問題
- 7.6.2 基于編解碼器的Deepfakes換臉算法
- 7.7 通用的人臉屬性編輯
- 7.7.1 StyleGAN人臉編輯的關鍵問題
- 7.7.2 潛在編碼向量的求解
- 7.8 基于StyleGAN模型的人臉屬性編輯實踐
- 7.8.1 人臉重建
- 7.8.2 人臉屬性混合與插值
- 7.8.3 人臉屬性編輯
- 7.8.4 小結
- 參考文獻
- 第8章 圖像質量增強
- 8.1 圖像降噪
- 8.1.1 圖像降噪問題
- 8.1.2 基于GAN的圖像去噪框架
- 8.2 圖像去模糊
- 8.2.1 圖像去模糊問題
- 8.2.2 基于GAN的圖像去模糊框架
- 8.3 圖像色調映射
- 8.3.1 圖像色調映射問題
- 8.3.2 圖像色調映射數據集
- 8.3.3 基于GAN的圖像色調映射框架
- 8.4 圖像超分辨
- 8.4.1 圖像超分辨問題
- 8.4.2 基于GAN的圖像超分辨框架
- 8.5 圖像修復
- 8.5.1 圖像修復基礎
- 8.5.2 基于GAN的圖像修復框架
- 8.6 基于SRGAN的人臉超分重建實踐
- 8.6.1 項目解讀
- 8.6.2 模型訓練
- 8.6.3 模型測試
- 8.6.4 小結
- 參考文獻
- 第9章 三維圖像與視頻生成
- 9.1 三維圖像與視頻生成應用
- 9.1.1 三維圖像生成應用
- 9.1.2 視頻生成與預測應用
- 9.2 三維圖像生成框架
- 9.2.1 一般三維圖像生成框架
- 9.2.2 二維圖到三維圖的預測框架
- 9.3 視頻生成與預測框架
- 9.3.1 基本的Video-GAN
- 9.3.2 多階段的MD-GAN
- 9.3.3 內容動作分離的MoCoGAN
- 參考文獻
- 第10章 通用圖像編輯
- 10.1 圖像深度編輯
- 10.1.1 深度與景深
- 10.1.2 圖像景深編輯框架
- 10.2 圖像融合
- 10.2.1 圖像融合問題
- 10.2.2 基于GAN的圖像融合框架
- 10.3 交互式圖像編輯
- 10.3.1 交互式圖像編輯框架
- 10.3.2 基于GAN的交互式圖像編輯框架
- 10.4 展望
- 參考文獻
- 第11章 對抗攻擊
- 11.1 對抗攻擊及防御算法
- 11.1.1 對抗攻擊概述
- 11.1.2 常用攻擊算法
- 11.1.3 常用防御算法
- 11.2 基于GAN的對抗樣本生成
- 11.2.1 Perceptual-Sensitive GAN
- 11.2.2 Natural GAN
- 11.2.3 AdvGAN
- 11.3 基于GAN的對抗攻擊防御
- 11.3.1 APEGAN
- 11.3.2 DefenseGAN
- 11.4 對抗攻擊工具包AdvBox
- 11.4.1 對分類器的攻擊
- 11.4.2 高斯噪聲對抗防御
- 11.4.3 其他示例程序
- 參考文獻
- 第12章 語音信號處理
- 12.1 基于GAN的語音增強
- 12.1.1 項目簡介
- 12.1.2 SEGAN模型
- 12.1.3 SEGAN訓練和測試
- 12.2 基于GAN的語音轉換
- 12.2.1 項目簡介
- 12.2.2 WORLD語音合成工具
- 12.2.3 CycleGAN-VC2模型
- 12.2.4 CycleGAN-VC2訓練
- 12.2.5 CycleGAN-VC2測試
- 12.3 基于GAN的語音生成
- 12.3.1 項目簡介
- 12.3.2 WaveGAN模型
- 12.3.3 WaveGAN訓練和測試
- 參考文獻
- 作者簡介
- 封底 更新時間:2023-11-09 18:53:11
推薦閱讀
- 昆侖子牙練AI:人工智能從開發到實戰
- 解構ChatGPT
- 不會被機器替代的人:智能時代的生存策略
- 人工智能+機器人入門與實戰
- AI自媒體寫作超簡單
- Python金融大數據風控建模實戰:基于機器學習
- Joy RL:強化學習實踐教程
- 玩轉ChatGPT:秒變AI論文寫作高手
- 塊數據4.0:人工智能時代的激活數據學
- 人工智能視域下機器學習在教育研究中的應用
- 機器學習與學習資源適配
- 人工智能導論
- 人工智能算法(卷3):深度學習和神經網絡
- 機器人愛好者(第3輯)
- 機器人SLAM導航:核心技術與實戰
- 搜索:開啟智能時代的新引擎
- 人工智能革命:開啟超級智能新時代
- 寫好論文:思維模型與AI輔助應用
- Manus應用與AI Agent設計指南:從入門到精通
- DeepSeek快速上手
- 初中如何用DeepSeek快速提高數學成績
- 人,倫理,機器人:一本孩子寫給孩子的書
- AI時代項目經理成長之道:ChatGPT讓項目經理插上翅膀
- OpenCV深度學習應用與性能優化實踐
- 生成對抗網絡入門指南
- 自己動手制作軟體機器人
- 通用人工智能標準、評級、測試與架構
- 人工智能與計算生物的未來
- AI賦能超級個體
- 智能計算技術與應用