官术网_书友最值得收藏!

第2章
Spark 2.2技術及原理

Apache官方網站于2017年7月11日發布了Spark Release 2.2.0版本。Apache Spark 2.2.0版本是Spark 2.2系列上的第3個版本。Spark 2.2.0是Spark 2.2中第一個在生產環境可以使用的版本,對于Spark具有里程碑意義。Spark 2.2.0版本中,Structured Streaming的實驗性標記(Experimental Tag)已經被移除,此版本更多側重于系統的可用性(Usability)、穩定性(Stability)以及代碼的polish,解決了1100個tickets。此外,只要安裝pyspark,在Spark 2.2.0版本中,pyspark可用于pypi。Spark 2.2.0版本移除了對Java 7以及Hadoop 2.5及其之前版本的支持,移除了對Python 2.6的支持。

Apache Spark 2.2.0版本的一些新變化:

 Core and Spark SQL核心和Spark SQL。

 Structured Streaming結構化流。

 MLlib機器學習。

 SparkR SparkR計算。

 GraphX圖計算。

 Deprecations棄用。

 Changes of behavior行為變化。

 Known Issues已知的問題。

 Credits貢獻者。

如無特殊說明,本書所有內容都基于最新最穩定的Spark 2.2.0版本的源碼編寫,為體現Spark源碼的演進過程,部分核心源碼在Spark 1.5.X、Spark 1.6.X、Spark 2.2.X源碼的基礎上,新增Spark 2.2.0版本的源碼,便于讀者系統比對、研習Spark源碼。

主站蜘蛛池模板: 涡阳县| 揭西县| 灵璧县| 彩票| 本溪市| 格尔木市| 拜泉县| 泸溪县| 调兵山市| 视频| 辉南县| 永善县| 扶余县| 全南县| 永新县| 忻州市| 西盟| 呼伦贝尔市| 普宁市| 新沂市| 石家庄市| 乌兰察布市| 庆安县| 平潭县| 玉门市| 拉孜县| 泸溪县| 勃利县| 咸丰县| 隆安县| 永年县| 宜君县| 沅江市| 满城县| 阜康市| 民和| 安远县| 滦南县| 北川| 句容市| 揭东县|