官术网_书友最值得收藏!

前言

2013年8月19日和20日,習近平總書記出席全國宣傳思想工作會議并發(fā)表重要講話;2014年10月15日,習近平總書記主持召開文藝工作座談會并發(fā)表重要講話;2015年12月25日,習近平總書記視察解放軍報社并發(fā)表重要講話;2016年2月19日,習近平總書記到人民日報社、新華社、中央電視臺三家中央新聞單位進行了實地調(diào)研后,主持召開黨的新聞輿論工作座談會并發(fā)表重要講話。從這些講話中,我們可以深刻地領會到:黨中央高度重視輿論宣傳工作,根據(jù)形勢發(fā)展的需要,更是把網(wǎng)絡輿情監(jiān)督和引導當作重中之重來抓。

在當前的互聯(lián)網(wǎng)及大數(shù)據(jù)的時代背景下,網(wǎng)絡輿情形成迅速,影響著社會生活的方方面面,如何高效全面地采集輿情數(shù)據(jù)并利用數(shù)據(jù)挖掘算法及數(shù)據(jù)分析工具將輿情文本中有價值的信息挖掘出來,對于輿情監(jiān)管、輿情研判、輿情引導至關重要。網(wǎng)絡信息的不斷膨脹給輿情工作提出了新的挑戰(zhàn),為了更好地進行輿情收集、輿情研判、加快構(gòu)建輿情引導新格局,輿情工作方式、輿情管理思維、輿情數(shù)據(jù)分析技術等都需要不斷創(chuàng)新。

作者在本書的寫作過程中閱讀了大量的相關文獻。文獻研究表明,目前,越來越多的學者加入到了網(wǎng)絡輿情的基礎理論、支撐技術和演化機制等的研究中,網(wǎng)絡輿情的研究視角日益多樣化,研究內(nèi)容也越來越深入。從網(wǎng)絡輿情分析的視角來看,其核心技術主要包括自然語言處理、文本分類、文本聚類、關聯(lián)分析、智能預測等,相應的理論、算法等也日臻成熟。但是,在實際的網(wǎng)絡輿情分析各個環(huán)節(jié)中,輿情信息如何有效地采集、輿情分析算法如何高效地實現(xiàn)、輿情分析結(jié)果如何可視化展示等問題仍然困擾著很多研究者和輿情分析人員。

基于上述考慮,本書以R語言作為輿情分析工具,在闡述相關原理的基礎上,介紹了網(wǎng)絡輿情信息采集、輿情信息預處理、輿情文本分類、輿情文本聚類、輿情數(shù)據(jù)關聯(lián)規(guī)則挖掘、輿情預測等的技術和方法。作為數(shù)據(jù)分析的利器,與其他流行的統(tǒng)計分析軟件(如Excel、Matlab、SAS、SPSS等)相比,R語言的優(yōu)勢主要體現(xiàn)在開源免費、易于擴展、數(shù)據(jù)包豐富、可視化功能強大、可運行于多種平臺。

本書力求簡明扼要、提供有價值的知識,以最淺顯的語言、詳盡的R語言實現(xiàn)代碼向讀者循序漸進地展現(xiàn)網(wǎng)絡輿情分析的完整過程。本書共8章,具體章節(jié)結(jié)構(gòu)如下。

第1章 網(wǎng)絡輿情與輿情分析概述:主要介紹了網(wǎng)絡輿情的定義及特征,并對網(wǎng)絡輿情的研究熱點及相關技術做了概述。

第2章 R語言基礎:為了幫助不熟悉R語言的讀者盡快入門,本章主要從數(shù)據(jù)讀寫、基本語法、繪圖三方面對R語言的使用做了言簡意賅的介紹。

第3章 網(wǎng)絡輿情信息采集及R爬蟲的實現(xiàn):介紹了網(wǎng)絡輿情信息采集的基本原理、八爪魚數(shù)據(jù)采集器的使用,并通過示例講解了如何使用R語言開發(fā)一個簡單的信息采集爬蟲。

第4章 基于R語言的輿情信息預處理:介紹輿情信息預處理中分詞、去停用詞、詞頻統(tǒng)計、文本向量化等的基本原理以及R語言實現(xiàn)方法。

第5章 基于R語言的網(wǎng)絡輿情分類:從分類的基本原理入手,介紹了決策樹分類算法、網(wǎng)絡輿情分類的基本原理,并通過“微信公眾號文章分類”這一示例講解了使用R語言進行網(wǎng)絡輿情分類的方法和步驟。

第6章 基于R語言的網(wǎng)絡輿情熱點話題聚類:介紹了聚類的基本原理、經(jīng)典的聚類算法、聚類算法在輿情分析中的應用,并通過“電商顧客評論熱點話題聚類”這一商務輿情分析示例講解了使用R語言進行網(wǎng)絡輿情聚類的方法和步驟。

第7章 基于R語言的網(wǎng)絡輿情關聯(lián)規(guī)則挖掘:介紹了關聯(lián)規(guī)則挖掘的基本原理、常用的關聯(lián)規(guī)則挖掘算法、關聯(lián)規(guī)則在輿情分析中的應用,并通過“霧霾輿情熱點詞關聯(lián)模式挖掘”這一示例講解了使用R語言進行網(wǎng)絡輿情關聯(lián)分析的方法和步驟。

第8章 基于R語言與BP神經(jīng)網(wǎng)絡的網(wǎng)絡輿情分析:介紹了BP神經(jīng)網(wǎng)絡的算法原理、BP神經(jīng)網(wǎng)絡在輿情分析中的應用,并通過“微博轉(zhuǎn)發(fā)數(shù)與評論數(shù)預測”這一示例講解了使用R語言與神經(jīng)網(wǎng)絡進行網(wǎng)絡輿情相關指標預測的方法和步驟。

本書系2015年度教育部人文社會科學研究規(guī)劃基金項目“微信環(huán)境下基于大數(shù)據(jù)的高校輿情監(jiān)管機制研究”(項目編號:15YJAZH102)研究成果之一。本書內(nèi)容淺顯易懂、代碼詳盡,希望能對輿情工作者及研究人員有所裨益。由于作者學識有限,書中難免有所疏漏,在此表示歉意,并請讀者朋友們不吝賜教。最后感謝清華大學出版社為本書的出版所做的努力。

大連海事大學 于衛(wèi)紅

2017年3月

主站蜘蛛池模板: 工布江达县| 徐水县| 贡觉县| 浠水县| 任丘市| 会理县| 紫金县| 四川省| 绿春县| 西贡区| 西吉县| 普定县| 莱西市| 炎陵县| 杭锦旗| 宾阳县| 鄂伦春自治旗| 庆元县| 普定县| 金山区| 远安县| 独山县| 抚顺市| 鹤庆县| 积石山| 亳州市| 社旗县| 加查县| 七台河市| 怀集县| 内丘县| 区。| 连平县| 石首市| 祁门县| 都昌县| 舞钢市| 白山市| 廊坊市| 永春县| 罗江县|