官术网_书友最值得收藏!

  • PySpark Cookbook
  • Denny Lee Tomasz Drabas
  • 75字
  • 2021-06-18 19:06:37

.filter(...) transformation

The filter(f)  transformation returns a new RDD based on selecting elements for which the f function returns true. Therefore, look at the following code snippet:

# User filter() to filter where second column == "WA"
(
airports
.map(lambda c: (c[0], c[1]))
.filter(lambda c: c[1] == "WA")
.take(5)
)

This will produce the following output:

# Output
[(u'Bellingham', u'WA'),
(u'Moses Lake', u'WA'),
(u'Pasco', u'WA'),
(u'Pullman', u'WA'),
(u'Seattle', u'WA')]
主站蜘蛛池模板: 于田县| 安泽县| 屏东县| 云林县| 曲沃县| 宝应县| 石台县| 五大连池市| 贵阳市| 安泽县| 申扎县| 隆昌县| 十堰市| 上饶县| 长丰县| 福海县| 嘉鱼县| 焦作市| 唐山市| 宽城| 太保市| 绥化市| 长白| 福州市| 曲靖市| 霍山县| 都兰县| 贵定县| 循化| 仙桃市| 民勤县| 赤城县| 江源县| 瑞金市| 株洲市| 松阳县| 青岛市| 鹰潭市| 睢宁县| 辽源市| 襄城县|