舉報

會員
文本數(shù)據(jù)挖掘:基于R語言
最新章節(jié):
11.3 關鍵詞提取案例:根據(jù)CRAN的介紹文本提取R包關鍵字
文本是一種特殊的非結構化數(shù)據(jù),在當今的大數(shù)據(jù)時代,其價值日趨凸顯。本書利用開源而強大的R軟件,對文本數(shù)據(jù)挖掘的概念、技術及技巧進行了系統(tǒng)的介紹。本書共11章,內(nèi)容包括:走進文本數(shù)據(jù)挖掘,R語言快速入門,字符串的基本處理,用好正則表達式,導入各類文本數(shù)據(jù),對各類文本數(shù)據(jù)進行預處理,文本特征提取的4種方法,基于機器學習的文本分類方法,文本情感分析,文本可視化,文本數(shù)據(jù)挖掘項目實踐。本書還提供了豐富的應用案例和程序源代碼引導讀者高效學習。本書適合對文本數(shù)據(jù)挖掘感興趣的學生、科研人員和數(shù)據(jù)科學從業(yè)者閱讀。同時,本書還可以作為工具書,為需要經(jīng)常進行文本數(shù)據(jù)挖掘的讀者提供快速檢索。
最新章節(jié)
- 11.3 關鍵詞提取案例:根據(jù)CRAN的介紹文本提取R包關鍵字
- 11.2 文本分類案例:基于詞袋模型對英文期刊摘要來源進行分類
- 11.1 情感分析案例:量化中文新聞報道中的情感走勢
- 第11章 舉一反三——文本數(shù)據(jù)挖掘項目實踐
- 10.7 雙文檔對比可視化
- 10.6 網(wǎng)絡圖
品牌:機械工業(yè)出版社
上架時間:2021-07-08 10:09:06
出版社:機械工業(yè)出版社
本書數(shù)字版權由機械工業(yè)出版社提供,并由其授權上海閱文信息技術有限公司制作發(fā)行