書名: 自己動手寫分布式搜索引擎作者名: 羅剛本章字?jǐn)?shù): 141字更新時間: 2020-11-28 15:52:39
1.3.5 文本挖掘
搜索文本信息需要理解人類的自然語言。文本挖掘是指從大量的文本數(shù)據(jù)中抽取隱含的、未知的、可能有用的信息。
常用的文本挖掘方法包括:全文檢索、中文分詞、句法分析、文本分類、文本聚類、關(guān)鍵詞提取、文本摘要、信息提取、智能問答等。文本挖掘相關(guān)技術(shù)的結(jié)構(gòu)如圖1-8所示。

圖1-8 文本挖掘的結(jié)構(gòu)
推薦閱讀
- 中文版Photoshop入門與提高(CS6版)
- Word論文排版之道
- 對比Excel,輕松學(xué)習(xí)SQL數(shù)據(jù)分析
- Flash CS6標(biāo)準(zhǔn)教程(全視頻微課版)
- RESTful PHP Web Services
- Apache Maven 3 Cookbook
- 邊做邊學(xué):平面廣告設(shè)計與制作(Photoshop 2020+Illustrator 2020·第3版·微課版)
- 三維建模與3D打印從入門到精通
- Photoshop手繪從新手到高手
- iPad Procreate風(fēng)格繪畫之美
- 修片有道:PHOTOSHOP攝影后期專業(yè)技法
- KNIME視覺化數(shù)據(jù)分析
- 剪映真?zhèn)鳎?8招玩轉(zhuǎn)短視頻剪輯
- 中文版CorelDRAW X7基礎(chǔ)培訓(xùn)教程
- Photoshop CS6圖像處理立體化教程