官术网_书友最值得收藏!

3.3 數(shù)據(jù)集

數(shù)據(jù)集是數(shù)據(jù)的集合,是機(jī)器學(xué)習(xí)的基礎(chǔ),本節(jié)使用tf.data.Dataset API構(gòu)建管道,為模型提供數(shù)據(jù)。

1.創(chuàng)建源數(shù)據(jù)集

在使用數(shù)據(jù)集之前,需要先創(chuàng)建一個(gè)源數(shù)據(jù)集,使用工廠函數(shù)(如Dataset.from_tensors,Dataset.from_tensor_slices)或從TextLineDataset和TFRecordDataset等文件中讀取的對(duì)象來(lái)創(chuàng)建源數(shù)據(jù)集,代碼如下。

代碼的運(yùn)行結(jié)果如下。

打開(kāi)返回的文件,如下。

2.轉(zhuǎn)換函數(shù)

將map、batch和shuffle等轉(zhuǎn)換函數(shù)應(yīng)用于數(shù)據(jù)集記錄。這里以map和shuffle函數(shù)為例,代碼如下。

代碼的運(yùn)行結(jié)果如下。

3.迭代

迭代是處理數(shù)據(jù)集的常用方法,tf.data.Dataset對(duì)象支持迭代循環(huán)記錄,示例代碼如下。

代碼的運(yùn)行結(jié)果如下。

本節(jié)使用幾個(gè)簡(jiǎn)單的例子對(duì)數(shù)據(jù)集進(jìn)行了初步的介紹。在后面的章節(jié)中,會(huì)經(jīng)常使用數(shù)據(jù)集。

主站蜘蛛池模板: 临汾市| 乐山市| 密山市| 潜山县| 兰州市| 乐安县| 天柱县| 台前县| 红桥区| 南平市| 上林县| 同德县| 营口市| 上杭县| 浦城县| 威海市| 习水县| 武强县| 惠安县| 茶陵县| 常德市| 漯河市| 长治县| 龙海市| 吉安市| 长葛市| 嘉荫县| 万盛区| 沙洋县| 团风县| 康保县| 延边| 六枝特区| 临泽县| 寻乌县| 丹凤县| 盐池县| 上栗县| 衡东县| 泉州市| 武功县|