- R語言與網(wǎng)絡輿情處理
- 于衛(wèi)紅
- 1727字
- 2019-12-12 17:31:38
前言
2013年8月19日和20日,習近平總書記出席全國宣傳思想工作會議并發(fā)表重要講話;2014年10月15日,習近平總書記主持召開文藝工作座談會并發(fā)表重要講話;2015年12月25日,習近平總書記視察解放軍報社并發(fā)表重要講話;2016年2月19日,習近平總書記到人民日報社、新華社、中央電視臺三家中央新聞單位進行了實地調(diào)研后,主持召開黨的新聞輿論工作座談會并發(fā)表重要講話。從這些講話中,我們可以深刻地領會到:黨中央高度重視輿論宣傳工作,根據(jù)形勢發(fā)展的需要,更是把網(wǎng)絡輿情監(jiān)督和引導當作重中之重來抓。
在當前的互聯(lián)網(wǎng)及大數(shù)據(jù)的時代背景下,網(wǎng)絡輿情形成迅速,影響著社會生活的方方面面,如何高效全面地采集輿情數(shù)據(jù)并利用數(shù)據(jù)挖掘算法及數(shù)據(jù)分析工具將輿情文本中有價值的信息挖掘出來,對于輿情監(jiān)管、輿情研判、輿情引導至關重要。網(wǎng)絡信息的不斷膨脹給輿情工作提出了新的挑戰(zhàn),為了更好地進行輿情收集、輿情研判、加快構(gòu)建輿情引導新格局,輿情工作方式、輿情管理思維、輿情數(shù)據(jù)分析技術等都需要不斷創(chuàng)新。
作者在本書的寫作過程中閱讀了大量的相關文獻。文獻研究表明,目前,越來越多的學者加入到了網(wǎng)絡輿情的基礎理論、支撐技術和演化機制等的研究中,網(wǎng)絡輿情的研究視角日益多樣化,研究內(nèi)容也越來越深入。從網(wǎng)絡輿情分析的視角來看,其核心技術主要包括自然語言處理、文本分類、文本聚類、關聯(lián)分析、智能預測等,相應的理論、算法等也日臻成熟。但是,在實際的網(wǎng)絡輿情分析各個環(huán)節(jié)中,輿情信息如何有效地采集、輿情分析算法如何高效地實現(xiàn)、輿情分析結(jié)果如何可視化展示等問題仍然困擾著很多研究者和輿情分析人員。
基于上述考慮,本書以R語言作為輿情分析工具,在闡述相關原理的基礎上,介紹了網(wǎng)絡輿情信息采集、輿情信息預處理、輿情文本分類、輿情文本聚類、輿情數(shù)據(jù)關聯(lián)規(guī)則挖掘、輿情預測等的技術和方法。作為數(shù)據(jù)分析的利器,與其他流行的統(tǒng)計分析軟件(如Excel、Matlab、SAS、SPSS等)相比,R語言的優(yōu)勢主要體現(xiàn)在開源免費、易于擴展、數(shù)據(jù)包豐富、可視化功能強大、可運行于多種平臺。
本書力求簡明扼要、提供有價值的知識,以最淺顯的語言、詳盡的R語言實現(xiàn)代碼向讀者循序漸進地展現(xiàn)網(wǎng)絡輿情分析的完整過程。本書共8章,具體章節(jié)結(jié)構(gòu)如下。
第1章 網(wǎng)絡輿情與輿情分析概述:主要介紹了網(wǎng)絡輿情的定義及特征,并對網(wǎng)絡輿情的研究熱點及相關技術做了概述。
第2章 R語言基礎:為了幫助不熟悉R語言的讀者盡快入門,本章主要從數(shù)據(jù)讀寫、基本語法、繪圖三方面對R語言的使用做了言簡意賅的介紹。
第3章 網(wǎng)絡輿情信息采集及R爬蟲的實現(xiàn):介紹了網(wǎng)絡輿情信息采集的基本原理、八爪魚數(shù)據(jù)采集器的使用,并通過示例講解了如何使用R語言開發(fā)一個簡單的信息采集爬蟲。
第4章 基于R語言的輿情信息預處理:介紹輿情信息預處理中分詞、去停用詞、詞頻統(tǒng)計、文本向量化等的基本原理以及R語言實現(xiàn)方法。
第5章 基于R語言的網(wǎng)絡輿情分類:從分類的基本原理入手,介紹了決策樹分類算法、網(wǎng)絡輿情分類的基本原理,并通過“微信公眾號文章分類”這一示例講解了使用R語言進行網(wǎng)絡輿情分類的方法和步驟。
第6章 基于R語言的網(wǎng)絡輿情熱點話題聚類:介紹了聚類的基本原理、經(jīng)典的聚類算法、聚類算法在輿情分析中的應用,并通過“電商顧客評論熱點話題聚類”這一商務輿情分析示例講解了使用R語言進行網(wǎng)絡輿情聚類的方法和步驟。
第7章 基于R語言的網(wǎng)絡輿情關聯(lián)規(guī)則挖掘:介紹了關聯(lián)規(guī)則挖掘的基本原理、常用的關聯(lián)規(guī)則挖掘算法、關聯(lián)規(guī)則在輿情分析中的應用,并通過“霧霾輿情熱點詞關聯(lián)模式挖掘”這一示例講解了使用R語言進行網(wǎng)絡輿情關聯(lián)分析的方法和步驟。
第8章 基于R語言與BP神經(jīng)網(wǎng)絡的網(wǎng)絡輿情分析:介紹了BP神經(jīng)網(wǎng)絡的算法原理、BP神經(jīng)網(wǎng)絡在輿情分析中的應用,并通過“微博轉(zhuǎn)發(fā)數(shù)與評論數(shù)預測”這一示例講解了使用R語言與神經(jīng)網(wǎng)絡進行網(wǎng)絡輿情相關指標預測的方法和步驟。
本書系2015年度教育部人文社會科學研究規(guī)劃基金項目“微信環(huán)境下基于大數(shù)據(jù)的高校輿情監(jiān)管機制研究”(項目編號:15YJAZH102)研究成果之一。本書內(nèi)容淺顯易懂、代碼詳盡,希望能對輿情工作者及研究人員有所裨益。由于作者學識有限,書中難免有所疏漏,在此表示歉意,并請讀者朋友們不吝賜教。最后感謝清華大學出版社為本書的出版所做的努力。
大連海事大學 于衛(wèi)紅
2017年3月
- Python 深度學習
- C語言程序設計
- jQuery從入門到精通 (軟件開發(fā)視頻大講堂)
- Getting Started with Python Data Analysis
- 算法訓練營:提高篇(全彩版)
- Instant Ext.NET Application Development
- FPGA Verilog開發(fā)實戰(zhàn)指南:基于Intel Cyclone IV(進階篇)
- C/C++程序員面試指南
- Android驅(qū)動開發(fā)權(quán)威指南
- Java SE實踐教程
- Unity&VR游戲美術設計實戰(zhàn)
- Beginning C++ Game Programming
- Angular應用程序開發(fā)指南
- Mastering Adobe Captivate 7
- Natural Language Processing with Python Quick Start Guide