書名: AI數(shù)字人原理與實(shí)現(xiàn)作者名: 方進(jìn)本章字?jǐn)?shù): 725字更新時(shí)間: 2024-12-16 16:55:15
1.2 數(shù)字人的發(fā)展歷史
數(shù)字人技術(shù)起源于20世紀(jì)50年代,最初以簡單的文字或語音交互系統(tǒng)形式出現(xiàn)。隨后,隨著圖像和動(dòng)畫技術(shù)的融入,數(shù)字人技術(shù)進(jìn)入了一個(gè)嶄新的階段。到了21世紀(jì),數(shù)字人與3D技術(shù)及人工智能技術(shù)進(jìn)一步融合,這一發(fā)展過程充分體現(xiàn)了其背后支持技術(shù)的持續(xù)進(jìn)步。
當(dāng)前,數(shù)字人技術(shù)正處于高速發(fā)展期,正從單一智能向通用智能加速演進(jìn)。未來,隨著支持算法和算力的持續(xù)進(jìn)步,數(shù)字人將具備更強(qiáng)大的知識(shí)處理能力,實(shí)現(xiàn)更為復(fù)雜的交互,變得越來越智能化。隨著5G等新基礎(chǔ)設(shè)施的建設(shè),數(shù)字人未來可在云端學(xué)習(xí)與進(jìn)化,并提供更廣泛的在線服務(wù)。數(shù)字人技術(shù)必將推動(dòng)傳統(tǒng)產(chǎn)業(yè)的改造,也將對(duì)人類社會(huì)帶來深刻影響。
1.2.1 早期虛擬角色
20世紀(jì)50年代,早期的數(shù)字人系統(tǒng)僅提供基本的文本或語音查詢功能。20世紀(jì)60年代,數(shù)字人開始向公眾展示其能力,但與人類的互動(dòng)仍然十分有限。20世紀(jì)80年代,數(shù)字圖像技術(shù)的進(jìn)步使數(shù)字人能夠做到面部表情和唇型的同步,并具有初步的視覺形象。20世紀(jì)90年代,計(jì)算機(jī)動(dòng)畫和渲染技術(shù)的發(fā)展使數(shù)字人向多媒體方向發(fā)展,但它們的外形仍然比較簡單。
進(jìn)入21世紀(jì)后,數(shù)字人開始朝多功能、專業(yè)化方向轉(zhuǎn)化,如將數(shù)字人用作虛擬偶像、數(shù)字導(dǎo)游等。此外,由于3D計(jì)算機(jī)圖形學(xué)技術(shù)的廣泛應(yīng)用,數(shù)字人開始朝3D高保真方向發(fā)展,包括基于圖像的面部和身體的數(shù)字化復(fù)制。2007年,初音未來的出現(xiàn)標(biāo)志著數(shù)字人進(jìn)入2.0時(shí)代,在這個(gè)階段,數(shù)字人開始具有初步的人機(jī)交互能力。
1.2.2 人工智能與數(shù)字人的融合
最近幾年,人工智能技術(shù)在數(shù)字人領(lǐng)域的應(yīng)用取得了重大進(jìn)展。例如,基于深度學(xué)習(xí)的視覺和語音識(shí)別算法大大增強(qiáng)了數(shù)字人的環(huán)境理解和語言交互能力。此外,知識(shí)圖譜、自然語言理解和自動(dòng)推理等技術(shù)已應(yīng)用于數(shù)字人系統(tǒng),使數(shù)字人能夠更有效地表達(dá)知識(shí)并進(jìn)行自主思考。
- 人工智能
- 深度學(xué)習(xí)在醫(yī)學(xué)圖像中的應(yīng)用
- 解碼智能時(shí)代2021:前沿趨勢10人談
- 人工智能視域下機(jī)器學(xué)習(xí)在教育研究中的應(yīng)用
- 向AI提問的藝術(shù):提示工程入門與應(yīng)用
- 深度學(xué)習(xí)時(shí)代的計(jì)算機(jī)視覺算法
- 人工智能導(dǎo)論
- 人形機(jī)器人(原書第2版)
- 圖解人工智能
- 機(jī)器人圖形化編程:從0到1
- 人工智能核心:神經(jīng)網(wǎng)絡(luò)(青少科普版)
- Web3超入門
- 揭秘大模型:從原理到實(shí)戰(zhàn)
- AI速成課:從AI編程到構(gòu)建智能軟件
- 智能革命:迎接人工智能時(shí)代的社會(huì)、經(jīng)濟(jì)與文化變革