官术网_书友最值得收藏!

第3章 從基礎(chǔ)做起1——字符串的基本處理

本章概述:

我們已經(jīng)知道R語言中有字符型的數(shù)據(jù)結(jié)構(gòu),字符串是指由多個(gè)單字符構(gòu)成的長(zhǎng)文本,這種非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)中往往包含著價(jià)值。本章將會(huì)闡述如何在R中對(duì)這些字符串進(jìn)行基本的清洗與統(tǒng)計(jì),主要使用stringr包中的函數(shù)。學(xué)習(xí)完本章后,讀者將會(huì)習(xí)得如何對(duì)字符串進(jìn)行拼接、拆分、計(jì)數(shù)等基本操作,從而為后面學(xué)習(xí)更加高級(jí)的文本分析實(shí)現(xiàn)奠定基礎(chǔ)。在學(xué)習(xí)本章之前,需要先加載stringr包,這個(gè)包是tidyverse包的一部分,直接加載tidyverse包即可。

主站蜘蛛池模板: 宜良县| 奎屯市| 孝义市| 莱州市| 东辽县| 西吉县| 奉化市| 遂平县| 马龙县| 南川市| 梧州市| 津市市| 辽源市| 建水县| 宝应县| 连南| 沙坪坝区| 丽江市| 醴陵市| 集贤县| 革吉县| 昌乐县| 吐鲁番市| 田阳县| 扎赉特旗| 梧州市| 盐城市| 郑州市| 和田县| 柳州市| 抚顺县| 甘孜县| 藁城市| 连平县| 东光县| 抚州市| 渝中区| 和静县| 秦安县| 印江| 大丰市|