最新章節
- 專家力薦
- 8.3.3 視覺搜索的高級形態:實時視頻流式搜索
- 8.3.2 工程結構編碼前重新設計
- 8.3.1 體積壓縮
- 8.3 解決歷史問題:研發Paddle-Lite框架
- 8.2.4 通過AI工程技術提升視覺搜索體驗
上架時間:2019-12-05 14:17:28
出版社:電子工業出版社
上海閱文信息技術有限公司已經獲得合法授權,并進行制作發行
- 專家力薦 更新時間:2019-12-05 14:23:08
- 8.3.3 視覺搜索的高級形態:實時視頻流式搜索
- 8.3.2 工程結構編碼前重新設計
- 8.3.1 體積壓縮
- 8.3 解決歷史問題:研發Paddle-Lite框架
- 8.2.4 通過AI工程技術提升視覺搜索體驗
- 8.2.3 使用深度學習技術提速視覺搜索
- 8.2.2 取消拍照按鈕,提升視覺搜索體驗
- 8.2.1 初次探索移動端AI能力
- 8.2 移動端視覺搜索研發
- 8.1.2 OpenCL中的一些概念
- 8.1.1 開發移動端GPU應用程序
- 8.1 異構計算編程框架OpenCL
- 第8章 移動端GPU編程及深度學習框架落地實踐
- 7.4 開發問題與經驗總結
- 7.3.4 卷積計算基本優化
- 7.3.3 快速傅里葉變換
- 7.3.2 基于Winograd算法進行卷積性能優化
- 7.3.1 滑窗卷積和GEMM性能對比
- 7.3 卷積性能優化方式
- 7.2.4 并行優化與流水線重排
- 7.2.3 循環展開
- 7.2.2 內存性能和耗電量優化
- 7.2.1 編譯選項優化
- 7.2 CPU高性能通用優化
- 7.1.3 深度學習庫文件體積優化
- 7.1.2 模型體積優化
- 7.1.1 工具使用
- 7.1 工具及體積優化
- 第7章 移動端CPU預測性能優化
- 6.5.6 運用NEON指令計算矩陣乘法
- 6.5.5 NEON乘法指令
- 6.5.4 NEON通用算術操作指令
- 6.5.3 NEON通用數據操作指令
- 6.5.2 NEON存儲操作指令
- 6.5.1 NEON寄存器與指令類型
- 6.5 NEON匯編指令
- 6.4.3 ARM匯編的內存操作
- 6.4.2 ARM指令集
- 6.4.1 ARM匯編數據類型和寄存器
- 6.4 ARM匯編知識
- 6.3.4 利用一個簡單的公式優化訪存性能
- 6.3.3 靈活高效的緩存結構:組相聯映射
- 6.3.2 簡單的緩存映射結構:直接映射
- 6.3.1 緩存的基本理解
- 6.3 ARM芯片的緩存設計原理
- 6.2 存儲設備的金字塔結構
- 6.1 ARM CPU的完整結構
- 第6章 存儲金字塔與ARM匯編
- 5.6 ARM手機芯片的現狀與格局
- 5.5 ARM指令集架構
- 5.4.3 ARMv7匯編指令介紹
- 5.4.2 ARMv7-A處理器架構
- 5.4.1 ARM CPU家族
- 5.4 匯編指令概況
- 5.3.2 這些指令是什么
- 5.3.1 匯編語言程序的第一行
- 5.3 匯編指令初探
- 5.2.5 細化分工:流水線技術
- 5.2.4 回寫過程
- 5.2.3 執行過程
- 5.2.2 譯碼過程
- 5.2.1 取指過程
- 5.2 簡單的CPU模型
- 5.1.2 移動計算設備的分工
- 5.1.1 馮·諾依曼計算機的基本結構
- 5.1 現代計算機與ARM CPU架構的現狀
- 第5章 ARM CPU組成
- 4.7 移動端神經網絡模型的優化方向
- 4.6.3 MobileNet v2網絡結構
- 4.6.2 MobileNet v1網絡結構
- 4.6.1 什么是深度可分離卷積(Depthwise Separable Convolution)
- 4.6 輕量高性能的MobileNet
- 4.5.3 SqueezeNet的全局
- 4.5.2 fire模塊
- 4.5.1 SqueezeNet的優化策略
- 4.5 輕量化模型SqueezeNet
- 4.4.3 應用在產品中的效果
- 4.4.2 將CPU版本服務器端框架移植到移動端
- 4.4.1 將32位float參數轉化為8位int參數以降低傳輸量
- 4.4 嘗試在App中運行GoogLeNet
- 4.3.2 計算量問題
- 4.3.1 模型體積問題
- 4.3 GoogLeNet網絡結構
- 4.2 AlexNet網絡結構
- 4.1 早期的卷積神經網絡
- 第4章 移動端常見網絡結構
- 3.10 卷積的重要性
- 3.9 卷積后的降維操作:池化
- 3.8.2 讓卷積核“跳躍”:stride
- 3.8.1 讓卷積核“出界”:padding
- 3.8 卷積相關的兩個重要概念:padding和stride
- 3.7 卷積后的圖片效果
- 3.6.3 多通道卷積核的應用
- 3.6.2 卷積核和矩陣乘法的關系
- 3.6.1 從全局了解視覺相關的神經網絡
- 3.6 圖像卷積效果
- 3.5 卷積神經網絡
- 3.4.2 神經網絡
- 3.4.1 神經元
- 3.4 神經元和神經網絡
- 3.3.2 訓練過程涉及的數學公式
- 3.3.1 預測過程涉及的數學公式
- 3.3 數學表達
- 3.2 預測過程
- 3.1 移動端機器學習的全過程
- 第3章 什么是機器學習和卷積神經網絡
- 2.13 抽象向量空間
- 2.12 線性代數的特征概念
- 2.11.2 叉積的幾何意義
- 2.11.1 點積的幾何意義
- 2.11 點積和叉積的幾何表示與含義
- 2.10 零空間
- 2.9 秩
- 2.8 矩陣的逆
- 2.7 行列式
- 2.6 矩陣乘法
- 2.5 矩陣和變換
- 2.4 線性空間
- 2.3 線性組合的幾何意義
- 2.2.2 向量的數乘運算
- 2.2.1 向量的加減運算
- 2.2 向量的幾何意義
- 2.1.2 改變坐標系的基向量
- 2.1.1 標準平面直角坐標系
- 2.1 線性代數基礎
- 第2章 以幾何方式理解線性代數基礎知識
- 1.8.4 開發一個基于移動端深度學習框架的Android App
- 1.8.3 用Paddle-Lite框架編譯與開發Android應用
- 1.8.2 Android平臺上mobile-deep-learning項目的Demo代碼結構
- 1.8.1 Android平臺上mobile-deep-learning項目的環境依賴
- 1.8 在Android平臺上搭建深度學習框架
- 1.7.3 iOS平臺上mobile-deep-learning項目的Demo代碼結構
- 1.7.2 在OS X平臺上編譯mobile-deep-learning項目
- 1.7.1 在iOS平臺上搭建mobile-deep-learning項目
- 1.7 在iOS平臺上搭建深度學習框架
- 1.6.3 mobile-deep-learning通用環境依賴
- 1.6.2 mobile-deep-learning項目整體代碼結構
- 1.6.1 mobile-deep-learning項目環境簡介
- 1.6 編譯運行深度學習App
- 1.5.2 實現AR實時翻譯功能
- 1.5.1 在服務器端和移動端應用深度學習技術的難點對比
- 1.5 在移動端應用深度學習技術的難點
- 1.4.3 視頻主體檢測技術在App中的應用
- 1.4.2 奇妙的風格化效果
- 1.4.1 植物花卉識別
- 1.4 在移動端應用深度學習技術的業界案例
- 1.3 在線上產品中以“云+端計算”的方式應用深度學習技術
- 1.2 移動端主體檢測和分類
- 1.1.2 在Demo App中應用神經網絡技術
- 1.1.1 安裝編譯好的文件
- 1.1 本書示例代碼簡介
- 第1章 初窺移動端深度學習技術的應用
- 讀者服務
- 前言
- 推薦序二
- 推薦序一
- 作者簡介
- 版權信息
- 封面
- 封面
- 版權信息
- 作者簡介
- 推薦序一
- 推薦序二
- 前言
- 讀者服務
- 第1章 初窺移動端深度學習技術的應用
- 1.1 本書示例代碼簡介
- 1.1.1 安裝編譯好的文件
- 1.1.2 在Demo App中應用神經網絡技術
- 1.2 移動端主體檢測和分類
- 1.3 在線上產品中以“云+端計算”的方式應用深度學習技術
- 1.4 在移動端應用深度學習技術的業界案例
- 1.4.1 植物花卉識別
- 1.4.2 奇妙的風格化效果
- 1.4.3 視頻主體檢測技術在App中的應用
- 1.5 在移動端應用深度學習技術的難點
- 1.5.1 在服務器端和移動端應用深度學習技術的難點對比
- 1.5.2 實現AR實時翻譯功能
- 1.6 編譯運行深度學習App
- 1.6.1 mobile-deep-learning項目環境簡介
- 1.6.2 mobile-deep-learning項目整體代碼結構
- 1.6.3 mobile-deep-learning通用環境依賴
- 1.7 在iOS平臺上搭建深度學習框架
- 1.7.1 在iOS平臺上搭建mobile-deep-learning項目
- 1.7.2 在OS X平臺上編譯mobile-deep-learning項目
- 1.7.3 iOS平臺上mobile-deep-learning項目的Demo代碼結構
- 1.8 在Android平臺上搭建深度學習框架
- 1.8.1 Android平臺上mobile-deep-learning項目的環境依賴
- 1.8.2 Android平臺上mobile-deep-learning項目的Demo代碼結構
- 1.8.3 用Paddle-Lite框架編譯與開發Android應用
- 1.8.4 開發一個基于移動端深度學習框架的Android App
- 第2章 以幾何方式理解線性代數基礎知識
- 2.1 線性代數基礎
- 2.1.1 標準平面直角坐標系
- 2.1.2 改變坐標系的基向量
- 2.2 向量的幾何意義
- 2.2.1 向量的加減運算
- 2.2.2 向量的數乘運算
- 2.3 線性組合的幾何意義
- 2.4 線性空間
- 2.5 矩陣和變換
- 2.6 矩陣乘法
- 2.7 行列式
- 2.8 矩陣的逆
- 2.9 秩
- 2.10 零空間
- 2.11 點積和叉積的幾何表示與含義
- 2.11.1 點積的幾何意義
- 2.11.2 叉積的幾何意義
- 2.12 線性代數的特征概念
- 2.13 抽象向量空間
- 第3章 什么是機器學習和卷積神經網絡
- 3.1 移動端機器學習的全過程
- 3.2 預測過程
- 3.3 數學表達
- 3.3.1 預測過程涉及的數學公式
- 3.3.2 訓練過程涉及的數學公式
- 3.4 神經元和神經網絡
- 3.4.1 神經元
- 3.4.2 神經網絡
- 3.5 卷積神經網絡
- 3.6 圖像卷積效果
- 3.6.1 從全局了解視覺相關的神經網絡
- 3.6.2 卷積核和矩陣乘法的關系
- 3.6.3 多通道卷積核的應用
- 3.7 卷積后的圖片效果
- 3.8 卷積相關的兩個重要概念:padding和stride
- 3.8.1 讓卷積核“出界”:padding
- 3.8.2 讓卷積核“跳躍”:stride
- 3.9 卷積后的降維操作:池化
- 3.10 卷積的重要性
- 第4章 移動端常見網絡結構
- 4.1 早期的卷積神經網絡
- 4.2 AlexNet網絡結構
- 4.3 GoogLeNet網絡結構
- 4.3.1 模型體積問題
- 4.3.2 計算量問題
- 4.4 嘗試在App中運行GoogLeNet
- 4.4.1 將32位float參數轉化為8位int參數以降低傳輸量
- 4.4.2 將CPU版本服務器端框架移植到移動端
- 4.4.3 應用在產品中的效果
- 4.5 輕量化模型SqueezeNet
- 4.5.1 SqueezeNet的優化策略
- 4.5.2 fire模塊
- 4.5.3 SqueezeNet的全局
- 4.6 輕量高性能的MobileNet
- 4.6.1 什么是深度可分離卷積(Depthwise Separable Convolution)
- 4.6.2 MobileNet v1網絡結構
- 4.6.3 MobileNet v2網絡結構
- 4.7 移動端神經網絡模型的優化方向
- 第5章 ARM CPU組成
- 5.1 現代計算機與ARM CPU架構的現狀
- 5.1.1 馮·諾依曼計算機的基本結構
- 5.1.2 移動計算設備的分工
- 5.2 簡單的CPU模型
- 5.2.1 取指過程
- 5.2.2 譯碼過程
- 5.2.3 執行過程
- 5.2.4 回寫過程
- 5.2.5 細化分工:流水線技術
- 5.3 匯編指令初探
- 5.3.1 匯編語言程序的第一行
- 5.3.2 這些指令是什么
- 5.4 匯編指令概況
- 5.4.1 ARM CPU家族
- 5.4.2 ARMv7-A處理器架構
- 5.4.3 ARMv7匯編指令介紹
- 5.5 ARM指令集架構
- 5.6 ARM手機芯片的現狀與格局
- 第6章 存儲金字塔與ARM匯編
- 6.1 ARM CPU的完整結構
- 6.2 存儲設備的金字塔結構
- 6.3 ARM芯片的緩存設計原理
- 6.3.1 緩存的基本理解
- 6.3.2 簡單的緩存映射結構:直接映射
- 6.3.3 靈活高效的緩存結構:組相聯映射
- 6.3.4 利用一個簡單的公式優化訪存性能
- 6.4 ARM匯編知識
- 6.4.1 ARM匯編數據類型和寄存器
- 6.4.2 ARM指令集
- 6.4.3 ARM匯編的內存操作
- 6.5 NEON匯編指令
- 6.5.1 NEON寄存器與指令類型
- 6.5.2 NEON存儲操作指令
- 6.5.3 NEON通用數據操作指令
- 6.5.4 NEON通用算術操作指令
- 6.5.5 NEON乘法指令
- 6.5.6 運用NEON指令計算矩陣乘法
- 第7章 移動端CPU預測性能優化
- 7.1 工具及體積優化
- 7.1.1 工具使用
- 7.1.2 模型體積優化
- 7.1.3 深度學習庫文件體積優化
- 7.2 CPU高性能通用優化
- 7.2.1 編譯選項優化
- 7.2.2 內存性能和耗電量優化
- 7.2.3 循環展開
- 7.2.4 并行優化與流水線重排
- 7.3 卷積性能優化方式
- 7.3.1 滑窗卷積和GEMM性能對比
- 7.3.2 基于Winograd算法進行卷積性能優化
- 7.3.3 快速傅里葉變換
- 7.3.4 卷積計算基本優化
- 7.4 開發問題與經驗總結
- 第8章 移動端GPU編程及深度學習框架落地實踐
- 8.1 異構計算編程框架OpenCL
- 8.1.1 開發移動端GPU應用程序
- 8.1.2 OpenCL中的一些概念
- 8.2 移動端視覺搜索研發
- 8.2.1 初次探索移動端AI能力
- 8.2.2 取消拍照按鈕,提升視覺搜索體驗
- 8.2.3 使用深度學習技術提速視覺搜索
- 8.2.4 通過AI工程技術提升視覺搜索體驗
- 8.3 解決歷史問題:研發Paddle-Lite框架
- 8.3.1 體積壓縮
- 8.3.2 工程結構編碼前重新設計
- 8.3.3 視覺搜索的高級形態:實時視頻流式搜索
- 專家力薦 更新時間:2019-12-05 14:23:08