- 聯(lián)邦學(xué)習(xí)實戰(zhàn)
- 楊強等
- 770字
- 2021-05-19 18:06:57
1.1 數(shù)據(jù)資產(chǎn)的重要性
隨著算法的不斷創(chuàng)新、訓(xùn)練數(shù)據(jù)的不斷收集、硬件算力的不斷增強,機器學(xué)習(xí)技術(shù),特別是深度學(xué)習(xí)技術(shù)(Deep Learning,DL)在人工智能(Artificial Intelligence,AI)應(yīng)用領(lǐng)域取得了巨大的成功[232,279,113]。例如,在圖像識別領(lǐng)域,通過卷積網(wǎng)絡(luò)實現(xiàn)的視覺算法在識別錯誤率上早已超越人類[128];在自然語言處理領(lǐng)域,Google在2018年提出的BERT算法[84],刷新了自然語言處理的11項紀(jì)錄;在推薦系統(tǒng)領(lǐng)域,YouTube[75]、Facebook[216]、Netflix[112]等科技公司正在使用智能的推薦引擎,通過分析用戶的歷史數(shù)據(jù),為用戶推薦個性化的內(nèi)容和商品,有效提升用戶的黏性和留存率。
但我們也應(yīng)該注意到,當(dāng)前深度學(xué)習(xí)所取得的成功,無一不是建立在大量數(shù)據(jù)基礎(chǔ)之上的[232,279,268]。圖1-1展示了互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)對當(dāng)前互聯(lián)網(wǎng)每年產(chǎn)生的數(shù)據(jù)總量的統(tǒng)計預(yù)測[79],預(yù)計2021年全球?qū)a(chǎn)生超過50 ZB的數(shù)據(jù),到2025年更是將達到175 ZB。

圖1-1 互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)對互聯(lián)網(wǎng)數(shù)據(jù)總量的預(yù)測(圖片來源于IDC白皮書[79])
在過去很長的一段時間里,數(shù)據(jù)的價值主要體現(xiàn)在作為一種“燃料”,為人工智能模型提供大量的樣本訓(xùn)練數(shù)據(jù),幫助提升模型的效果。但隨著移動互聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)的規(guī)模變得越來越龐大、復(fù)雜,數(shù)據(jù)的價值已經(jīng)不再局限于訓(xùn)練數(shù)據(jù),而是以資產(chǎn)的形式服務(wù)于企業(yè),并給企業(yè)帶來經(jīng)濟收益。
這種經(jīng)濟收益可以體現(xiàn)在兩個方面:一方面是數(shù)據(jù)作用于產(chǎn)品或者業(yè)務(wù),間接幫助提高產(chǎn)品的收益,比如各運營商或者社交網(wǎng)絡(luò)服務(wù)商都擁有豐富的用戶數(shù)據(jù),因此可以基于用戶的行為數(shù)據(jù)、位置信息等,為每個客戶構(gòu)建完善的用戶畫像,幫助企業(yè)深入了解客戶行為偏好和需求;另一方面,數(shù)據(jù)直接與企業(yè)收益相關(guān),比如各金融機構(gòu)有用戶的歷史逾期數(shù)據(jù),一個有效的對逾期客戶的識別模型,能夠大大降低金融機構(gòu)的貸款風(fēng)險,減少潛在的經(jīng)濟損失。數(shù)據(jù)的資產(chǎn)屬性也催生了一種新的商品交易模式:大數(shù)據(jù)交易。我們將在第14章詳細講解基于聯(lián)邦學(xué)習(xí)構(gòu)建的大數(shù)據(jù)交易市場。
- Python元學(xué)習(xí):通用人工智能的實現(xiàn)
- 自然語言處理:基于預(yù)訓(xùn)練模型的方法
- 現(xiàn)代推薦算法
- 智能浪潮:增強時代來臨
- 人工智能算法基礎(chǔ)
- DeepSeek:打開財富密碼
- 人人都是設(shè)計師:設(shè)計基礎(chǔ)+Midjourney+ChatGPT
- 深度學(xué)習(xí)之TensorFlow:入門、原理與進階實戰(zhàn)
- PaddlePaddle深度學(xué)習(xí)實戰(zhàn)
- 深度學(xué)習(xí)視頻理解
- Web3超入門
- 機器學(xué)習(xí)基礎(chǔ):從入門到求職
- AIGC提示詞美學(xué)定義
- DeepSeek快速上手
- 圖分析與圖機器學(xué)習(xí):原理、算法與實踐