- 深入大型數據集:并行與分布化Python代碼
- (美)J.T.沃勒翰
- 244字
- 2021-03-04 19:24:15
1.1 你將從本書中學到什么
在本書中,你將學習一種使并行化變得容易的編程風格。你將學習如何編寫可伸縮的并行代碼,這些代碼在一臺機器上的工作效果與在數千臺機器上一樣好。你會學習到
■ 如何把大問題分成多個小問題。
■ 如何使用map函數和reduce函數。
■ 如何在你的個人計算機上并行運行程序。
■ 如何在分布式云環境中并行運行程序。
你還將學習兩個用來處理大型數據集的流行框架:Apache Hadoop和Apache Spark。
本書是為那些已經可以編寫數據轉換程序,以及現在需要擴展這些程序的程序員而編寫的。他們需要能夠處理更多的數據并且更快地完成數據的處理。
推薦閱讀