官术网_书友最值得收藏!

1.1 數(shù)據(jù)資產(chǎn)的重要性

隨著算法的不斷創(chuàng)新、訓(xùn)練數(shù)據(jù)的不斷收集、硬件算力的不斷增強,機器學(xué)習(xí)技術(shù),特別是深度學(xué)習(xí)技術(shù)(Deep Learning,DL)在人工智能(Artificial Intelligence,AI)應(yīng)用領(lǐng)域取得了巨大的成功[232,279,113]。例如,在圖像識別領(lǐng)域,通過卷積網(wǎng)絡(luò)實現(xiàn)的視覺算法在識別錯誤率上早已超越人類[128];在自然語言處理領(lǐng)域,Google在2018年提出的BERT算法[84],刷新了自然語言處理的11項紀(jì)錄;在推薦系統(tǒng)領(lǐng)域,YouTube[75]、Facebook[216]、Netflix[112]等科技公司正在使用智能的推薦引擎,通過分析用戶的歷史數(shù)據(jù),為用戶推薦個性化的內(nèi)容和商品,有效提升用戶的黏性和留存率。

但我們也應(yīng)該注意到,當(dāng)前深度學(xué)習(xí)所取得的成功,無一不是建立在大量數(shù)據(jù)基礎(chǔ)之上的[232,279,268]。圖1-1展示了互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)對當(dāng)前互聯(lián)網(wǎng)每年產(chǎn)生的數(shù)據(jù)總量的統(tǒng)計預(yù)測[79],預(yù)計2021年全球?qū)a(chǎn)生超過50 ZB的數(shù)據(jù),到2025年更是將達到175 ZB。

圖1-1 互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)對互聯(lián)網(wǎng)數(shù)據(jù)總量的預(yù)測(圖片來源于IDC白皮書[79]

在過去很長的一段時間里,數(shù)據(jù)的價值主要體現(xiàn)在作為一種“燃料”,為人工智能模型提供大量的樣本訓(xùn)練數(shù)據(jù),幫助提升模型的效果。但隨著移動互聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)的規(guī)模變得越來越龐大、復(fù)雜,數(shù)據(jù)的價值已經(jīng)不再局限于訓(xùn)練數(shù)據(jù),而是以資產(chǎn)的形式服務(wù)于企業(yè),并給企業(yè)帶來經(jīng)濟收益。

這種經(jīng)濟收益可以體現(xiàn)在兩個方面:一方面是數(shù)據(jù)作用于產(chǎn)品或者業(yè)務(wù),間接幫助提高產(chǎn)品的收益,比如各運營商或者社交網(wǎng)絡(luò)服務(wù)商都擁有豐富的用戶數(shù)據(jù),因此可以基于用戶的行為數(shù)據(jù)、位置信息等,為每個客戶構(gòu)建完善的用戶畫像,幫助企業(yè)深入了解客戶行為偏好和需求;另一方面,數(shù)據(jù)直接與企業(yè)收益相關(guān),比如各金融機構(gòu)有用戶的歷史逾期數(shù)據(jù),一個有效的對逾期客戶的識別模型,能夠大大降低金融機構(gòu)的貸款風(fēng)險,減少潛在的經(jīng)濟損失。數(shù)據(jù)的資產(chǎn)屬性也催生了一種新的商品交易模式:大數(shù)據(jù)交易。我們將在第14章詳細講解基于聯(lián)邦學(xué)習(xí)構(gòu)建的大數(shù)據(jù)交易市場。

主站蜘蛛池模板: 恩施市| 赤壁市| 尼勒克县| 保德县| 图木舒克市| 左权县| 攀枝花市| 焦作市| 泽库县| 闽清县| 通道| 鱼台县| 黔西县| 河西区| 寿光市| 中卫市| 大兴区| 大埔县| 平果县| 进贤县| 湘乡市| 黎平县| 玛沁县| 沂水县| 呼图壁县| 华安县| 安平县| 深水埗区| 博客| 博湖县| 自治县| 徐州市| 正镶白旗| 宁陵县| 应用必备| 米脂县| 满城县| 青浦区| 皋兰县| 禄劝| 浦县|