官术网_书友最值得收藏!

第1章 緒論

目前,云計算、物聯網、大數據、機器學習、人工智能、芯片技術和移動網絡等新一代信息技術不斷涌現,掀起了新一輪技術革命和產業革命的浪潮,新一代信息技術受到了政府、學術界、媒體和企業的廣泛關注,同時也帶來了巨大的市場機遇,具有廣闊的應用前景。

人工智能不是一個新名詞,在 1956 年達特茅斯會議上計算機專家約翰·麥卡錫首先提出了“人工智能”的概念。1980年美國卡耐基·梅隆大學設計并實現了具有知識庫和推理功能的專家系統;1997年IBM公司的“深藍”戰勝了國際象棋世界冠軍卡斯帕羅夫;2016年谷歌公司的“阿爾法狗”(AlphaGO)戰勝了韓國棋手李世石和我國的圍棋天才柯潔。這些里程碑式的標志使得人們對人工智能未來的發展充滿了渴望和期待。

人工智能至今尚沒有一個統一的定義。專家和學者們從不同的角度出發,給出了各自的定義:暢銷書《人工智能》的作者伊萊恩·里奇(Elaine Rich)認為人工智能是研究如何利用計算機模擬人腦從事推理、規劃、設計和學習等思維活動,協助人類解決復雜的工程問題;麻省理工學院教授溫斯頓(Winston)認為人工智能是那些使知覺、推理和行為成為可能的計算的研究;加州大學伯克利分校教授斯圖爾特·羅素(Stuart Russell)則把人工智能定義為:像人一樣思考的系統,像人一樣行動的系統。

機器學習的發展可以追溯到 1950 年,其發展過程大體經歷了 3個重要時期,即推理期、知識期和學習期。1970年前稱為推理期,主要標志是讓機器具有簡單的邏輯推理能力;1970年后稱為知識期,主要標志是1965年斯坦福大學教授費根鮑姆(E.A.Feigenbaum)等人研制了世界上首個專家系統。20世紀80年代至今稱為學習期,主要標志是讓機器從樣本中學習。1983年,美國加州理工學院霍普菲爾德(J.J.Hopfield)教授提出了著名的Hopfield反饋神經網絡;1986年,斯坦福大學教授魯姆哈特(D.E.Rumelhart)等人提出了 BP 神經網絡;1995 年,美國工程院院士瓦普尼克(Vapnik)教授提出了基于統計學習理論的支持向量機,產生了以支持向量機為代表的核機器學習方法,如核聚類和核主分量分析等。深度學習是機器學習和人工智能的一個重要組成部分,來源于人工神經網絡研究和發展,最早由加拿大多倫多大學的辛頓(Geoffrey E.Hinton)教授于2006年提出,辛頓通過pre-training較好地解決了多層網絡難以訓練的問題。深度學習近年來在圖像識別和語音識別上取得了突破性的進展,深度學習的成功主要歸功于 3 大因素,即大數據、大模型和大算力。深度學習的優越性能將人工智能推向了新的高潮。

目前,大數據背景下機器學習的研究又成為人們研究和關注的熱點。傳統機器學習的分類算法很難直接應用到大數據環境下,不同的分類算法面臨著不同的挑戰。大數據環境下的并行分類算法的研究成為一個重要的研究方向。目前,針對并行機器學習的研究方法主要有:基于多核與眾核的并行機器學習、基于集群或云的并行機器學習、基于超算的機器學習和基于混合體系結構的并行機器學習。

“數據倉庫之父”比爾·恩門(Bill Inmon)早在20世紀90年代就經常提起大數據。自2008年9 月國際著名的期刊《自然》(Nature)出版了大數據專刊以來,大數據的處理、分析和利用已經成為各行各業和科研人員關注的焦點。美國把大數據視為“未來的新石油”,我國將大數據上升為國家戰略,大數據產業正在逐步地進入成熟期。目前,大數據幾乎是家喻戶曉,成為當今非常熱門的話題。從電視上經常可以看到有關大數據的新聞,比如:中央電視臺將大數據分析技術應用于新聞報道中,推出了兩會大數據、春運大數據等相關欄目。

當今世界是一個“數據為王”的時代,數據的重要性已經引起各個國家政府、企業和科研人員的高度重視,大數據背后的價值也在發揮著重要的作用。IBM智力競賽機器人沃森(Watson)收集了2億頁知識文本數據,并采用并行處理集群,利用大數據處理技術進行數據分析,可在1秒內完成對大量非結構化信息的檢索。目前,軟硬件技術與行業需求正在極大地推動大數據的發展。

大數據首先要有數據,因此大數據的采集技術是非常重要的。物聯網技術、電商平臺等各種采集技術和方法為大數據的采集提供了有力的支撐。另外,數據采集的完整性、準確性和穩定性,決定了數據采集的質量及數據是否能真實可靠地發揮作用。例如:傳統農業田間數據的采集有時必須采用人工手段來進行,由于環境的復雜性等原因,往往存在數據采集不完整和不準確等問題。利用物聯網技術進行農業數據的采集具有實時性、多樣性和可靠性,又如:農業小氣候站采集的氣象數據具有實時性、多樣性和可靠性的特點,為農業的輔助決策提供較為準確的依據。

研究大數據不僅僅是各種數據的采集和存儲,更重要的是如何利用好大數據,通過分析和挖掘海量數據,發現其內在有價值和有規律的知識,并服務于各個領域。大數據的分析挖掘技術又為機器學習的發展和應用提供了廣闊的空間。

目前,深度學習成為機器學習熱點的同時,又為人工智能的發展提供了巨大的發展空間,例如:利用深度學習感知、識別周圍環境,以及各種對車輛有用的信息,使得無人駕駛汽車成為可能;微軟和谷歌利用深度置信網絡,將語音識別的錯誤率降低了20%~30%。

深度學習在云計算和大數據背景下取得實質性進展,云計算為深度學習提供了平臺。云計算平臺服務的優點:搭建快速、操作簡捷、智能管理、運行穩定、安全可靠和彈性擴展。國內云計算平臺有很多,如著名的阿里巴巴公司和百度公司等。

物聯網(Internet of Things)的概念是由麻省理工學院自動識別(MIT Auto-ID)中心阿什頓(Ashton)教授1999年提出的,其原理是利用各種傳感設備,如射頻識別裝置、紅外感應器、全球定位系統、激光掃描器等種種裝置與互聯網結合起來從而形成的一個巨大網絡。《傳感器通用術語》(GB7665—87)對傳感器的定義是:“能感受規定的被測量并按照一定的規律轉換成可用信號的器件或裝置,通常由敏感元件和轉換元件組成”。通俗地講,物聯網就是物與物相連的互聯網。目前,各種傳感器廣泛地應用到我們的衣食住行等日常生活中,如濕度傳感器、氣體煙霧傳感器、超聲波傳感器和空氣質量傳感器等。傳感器正在朝著微型化、智能化、多功能化和無線網絡化的方向發展。與發達國家相比,我國自主傳感器核心技術仍需不斷提高,高端傳感器芯片以進口為主,市場競爭較為激烈。

當前,新一代信息技術革命已經成為全球關注的重點。同時,新產品、新應用和新模式不斷涌現,改變了傳統經濟發展方式,極大地推動了新興產業的發展壯大。這也給研究計算機技術的專業人員和企業帶來新的機遇和挑戰,這就需要加速學科深度交叉和融合,需要學術界和企業界深度交叉和融合,需要充分利用各行各業大數據,學習和研究人工智能、深度學習和大數據等新技術的基本概念、基本思想、基本理論和技術,掌握常用的相關開發工具,需要挖掘大數據背后的價值,發現規律、預測趨勢,并輔助決策。

大數據必須和具體的領域、行業相結合,才能真正地為政府和企業決策提供幫助,才能產生巨大的實用價值和應用前景。本書以農業為應用背景,重點研究機器學習、深度學習、圖像處理技術,以及大數據技術在農業領域中的應用。

主站蜘蛛池模板: 靖宇县| 九龙县| 东方市| 横山县| 东兰县| 怀安县| 加查县| 上饶市| 平乐县| 英超| 兴宁市| 满城县| 博罗县| 吴旗县| 呼玛县| 洮南市| 海原县| 永修县| 合江县| 佛坪县| 三亚市| 铜鼓县| 竹北市| 兴业县| 金乡县| 兴安县| 焦作市| 六安市| 德清县| 吉隆县| 巴林右旗| 宁陕县| 天津市| 萨迦县| 唐山市| 德江县| 呼图壁县| 普宁市| 保靖县| 商南县| 伊通|