官术网_书友最值得收藏!

1.3.4 分布式計算

算法設計是一件非常困難的工作,需要有很好的數據結構基礎。本書中采用的算法設計技術主要有迭代法、分治法、動態規劃法等。

互聯網搜索經常面臨海量數據。需要分布式的計算框架來執行對網頁重要度打分等計算。有的計算數據很少,但是計算量很大;還有些計算數據量比較大,但是計算量相對比較小。例如,計算圓周率是計算密集型,互聯網搜索中的計算往往是數據密集型。所以出現了數據密集型的云計算框架。MapReduce是一種常用的云計算框架。但是MapReduce是批處理的操作方式。一般來說,直到完成上一階段的操作后才能啟動下一階段的操作。

要有一種計算,可以盡快出結果,隨著時間的延長,計算結果會越來越好。很多計算可以用迭代的方式做,迭代次數越多,結果往往越好,比如PageRank或者KMeans、EM算法。當然,這個應該不只需要迭代,還需要向最優解收斂。

主站蜘蛛池模板: 渝中区| 安仁县| 永修县| 鸡泽县| 馆陶县| 邯郸县| 龙陵县| 渑池县| 启东市| 卢龙县| 都江堰市| 监利县| 额尔古纳市| 巴楚县| 德格县| 梅河口市| 阿克| 浙江省| 紫阳县| 平阳县| 思南县| 卢龙县| 仙游县| 沙坪坝区| 天镇县| 乐安县| 左贡县| 廊坊市| 商洛市| 和田县| 英吉沙县| 永吉县| 鸡西市| 昆山市| 黄龙县| 呼图壁县| 托里县| 陵川县| 徐水县| 米泉市| 宁德市|