官术网_书友最值得收藏!

前言

近幾年,人工智能無疑成為人們口中的熱點話題,先是谷歌的AlphaGo,后有百度的度秘、無人車,微軟必應搜索推出的小冰。這一系列人工智能產品的推陳出新,令人眼花繚亂,一時間給人的感覺是人工智能遍地開花。無論人們接受還是不接受,人工智能都在迅速滲透各行各業。網絡安全相比之下是一個傳統行業,基于規則以及黑白名單的檢測技術已經發展到了一定的瓶頸,而利益驅動的黑產團伙,其技術的發展已經遠遠超乎我們的想象。如何借助人工智能的力量,提升安全行業的整體檢測與防護能力,成為各大安全廠商研究的課題。在國內安全行業,BAT以及大量新興的創業公司先后進入企業安全領域,他們憑借著自身數據搜集、處理、積累以及人工智能方面的優勢,正在逐漸改變著整個安全行業。安全產品的形態也從硬件盒子逐步走向混合模式以及云端SaaS服務,安全技術從重防御逐步走向數據分析以及智能驅動。傳統安全廠商也憑借其強大的安全人才儲備,迅速推進人工智能在安全產品的落地。

我在網絡安全這個行業搬了好幾年磚,前五年做大型互聯網公司的企業安全建設,從準入系統到WAF、SIEM、IPS等,基本都開發或者使用過,最近三年一直負責云安全產品,從抗D、WAF產品到、SIEM、入侵檢測等,使用的技術從規則、黑白名單、模型、沙箱再到機器學習,從單機的OSSIM到Hadoop、Storm、Spark、ELK,也算目睹了安全技術或者更準確地說是數據分析處理技術的迅猛發展。我深深感到,使用人工智能技術改變這個行業不是我們的選擇,而是必經之路。我在真正意義上接觸機器學習是2014年年底,當時帶領了一個很小的團隊嘗試使用機器學習算法解決安全問題,磕磕絆絆一直走到現在,變成幾十人的一個產品團隊。

本書是我機器學習三部曲的第一部,主要以機器學習常見算法為主線,以生活中的例子和具體安全場景介紹機器學習常見算法,定位為機器學習入門書籍,便于大家可以快速上手。全部代碼都能在普通PC上運行。第二部將重點介紹深度學習,并以具體的十個案例介紹機器學習的應用,主要面向具有一定機器學習基礎或致力于使用機器學習解決工作中問題的讀者,全書的重點集中在問題的解決而不是算法的介紹。由于深度學習通常計算量已經超過了PC的能力,部分代碼需要在服務器甚至GPU上運行,不過這不影響大家的閱讀與學習。第三部將重點介紹強化學習和對抗網絡,并以若干虛構安全產品或者項目介紹如何讓機器真正具備AlphaGo級別的智能。

本書的第1章概括介紹了機器學習的發展以及互聯網目前的安全形勢。第2章介紹了如何打造自己的機器學習工具箱。第3章概括介紹機器學習的基本概念。第4章介紹Web安全的基礎知識。第5章到第13章介紹淺層機器學習算法,包括常見的K近鄰、決策樹、樸素貝葉斯、邏輯回歸、支持向量機、K-Means、FP-growth、Apriori、隱式馬爾可夫、有向圖。第14章到第17章介紹神經網絡以及深度學習中常用的遞歸神經網絡和卷積神經網絡。每章都會以生活中的例子開頭,讓讀者有一個感性的認識,然后簡短介紹基礎知識,最后以安全領域的2~3個例子講解如何使用該算法解決問題。全書定位是能讓更多的安全愛好者以及信息安全從業者了解機器學習,動手使用簡單的機器學習算法解決實際問題。在寫作中盡量避免生硬的說教,能用文字描述的盡量不用冷冰冰的公式,能用圖和代碼說明的盡量不用多余的文字。正如霍金所言“多寫1個公式,少一半讀者”,希望反之亦然。

機器學習應用于安全領域遇到的最大問題就是缺乏大量的黑樣本,即所謂的攻擊樣本,尤其相對于大量的正常業務訪問,攻擊行為尤其是成功的攻擊行為是非常少的,這就給機器學習帶來了很大挑戰。本書很少對不同算法進行橫向比較,也是因為確實在不同場景下不同算法表現差別很大,很難說深度學習就一定比樸素貝葉斯好,也很難說支持向量機就比不過卷積神經網絡,拿某個具體場景進行橫向比較意義不大,畢竟選擇算法不像購買SUV,可以拿幾十個參數評頭論足,最后還是需要大家結合實際問題去選擇。

這里我要感謝我的家人對我的支持,本來工作就很忙,沒有太多時間處理家務,寫書以后更是花費了我大量的休息時間,我的妻子無條件承擔起了全部家務,尤其是照料孩子等繁雜事務。我很感謝我的女兒,寫書這段時間幾乎沒有時間陪她玩,她也很懂事地自己玩,我想用這本書作為她的生日禮物送給她。我還要感謝吳怡編輯對我的支持和鼓勵,讓我可以堅持把這本書寫完。最后還要感謝各位業內好友尤其是我boss對我的支持,排名不分先后:馬杰@百度安全、馮景輝@百度安全、林曉東@百度基礎架構、黃穎@百度IT、李振宇@百度AI、Lenx@百度安全、黃正@百度安全、程巖@百度云、郝軼@百度云、云鵬@百度無人車、趙林林@微步在線、張宇平@數盟、謝忱@Freebuf、李新@Freebuf、李琦@清華、徐恪@清華、王宇@螞蟻金服、王珉然@螞蟻金服、王龍@螞蟻金服、周濤@啟明星辰、姚志武@借貸寶、劉靜@安天、劉袁君@醫渡云、廖威@易寶支付、尹毅@sobug、宋文寬@聯想、團長@宜人貸、齊魯@搜狐安全、吳圣@58安全、康宇@新浪安全、幻泉@i春秋、雅馳@i春秋、王慶雙@i春秋、張亞同@i春秋、王禾@微軟、李臻@paloalto、西瓜@四葉草、鄭偉@四葉草、朱利軍@四葉草、土夫子@XSRC、英雄馬@樂視云、sbilly@360、侯曼@360、高磊@滴滴、高磊@愛加密、高漸離@華為、劉洪善@華為云、宋柏林@一畝田、張昊@一畝田、張開@安恒、李碩@智聯、阿杜@優信拍、李斌@房多多、李程@搜狗、Tony@京東安全、簡單@京東安全、姚聰@face+、李鳴雷@金山云,最后我還要感謝我的親密戰友陳燕、康亮亮、蔡奇、哲超、新宇、子奇、月升、王磊、碳基體、劉璇、錢華鉤、劉超、王胄、吳梅、馮偵探、馮永校。

本書面向信息安全從業人員、高等院校計算機相關專業學生以及信息安全愛好者,機器學習愛好者,對于想了解人工智能的CTO、運維總監、架構師同樣也是一本不錯的科普書籍。當讀者在工作學習中遇到問題時可以想起本書中提到的一兩種算法,那么我覺得就達到效果了,如果可以讓讀者像使用printf一樣使用SVM、樸素貝葉斯等算法,那么這本書就相當成功了。

我平時在FreeBuf專欄以及i春秋分享企業安全建設以及人工智能相關經驗與最新話題,同時也運營我的微信公眾號“兜哥帶你學安全”,歡迎大家關注并在線交流。

本書使用的代碼和數據均在GitHub上發布,地址為:https://github.com/duoergun0729/1book,代碼層面任何疑問可以在GitHub上直接反饋。

主站蜘蛛池模板: 沂南县| 乐至县| 常州市| 乡宁县| 贵德县| 喀什市| 富阳市| 靖安县| 白朗县| 堆龙德庆县| 米泉市| 德清县| 寿宁县| 防城港市| 图木舒克市| 固始县| 青州市| 将乐县| 应城市| 芦山县| 砀山县| 定州市| 皮山县| 余干县| 宁夏| 外汇| 泗洪县| 吉水县| 香河县| 大化| 虞城县| 肥西县| 介休市| 贺州市| 海门市| 泾川县| 上饶县| 陕西省| 洛扎县| 左贡县| 巨野县|