官术网_书友最值得收藏!

1.4 大數據的發展

如果僅僅是從數據量的角度來看,大數據在過去就已經存在了。例如,波音的噴氣發動機每30min就會產生10TB的運行信息數據,安裝有4臺發動機的大型客機,每次飛越大西洋就會產生640TB的數據。世界各地每天有超過2.5萬架的飛機在工作,可見其數據量是何等龐大。生物技術領域中的基因組分析,以及以NASA(美國國家航空航天局)為中心的太空開發領域,從很早就開始使用十分昂貴的高端超級計算機來對龐大的數據進行分析和處理。

現在和過去的區別之一,就是大數據已經不僅產生于特定領域中,而且還產生于人們每天的日常生活中,領英(LinkedIn)、微信、QQ等社交媒體上的文本數據就是最好的例子。而且,盡管人們無法得到全部數據,但大部分數據可以通過公開的API(應用程序編程接口)相對容易地進行采集。在B2C(商家對顧客)企業中,使用文本挖掘(Text Mining)和情感分析等技術,就可以分析消費者對于自家產品的評價。

主站蜘蛛池模板: 贵德县| 景洪市| 乡宁县| 绥滨县| 怀来县| 维西| 尉犁县| 凤庆县| 祁东县| 嘉兴市| 敦煌市| 霍城县| 商洛市| 乐至县| 黎川县| 东乡| 濮阳市| 洛隆县| 苍南县| 孝感市| 隆昌县| 商洛市| 望都县| 团风县| 宜良县| 汽车| 夏邑县| 三台县| 镇原县| 柞水县| 鲜城| 砀山县| 集贤县| 凉城县| 双城市| 宝清县| 行唐县| 社会| 南充市| 社旗县| 日照市|