官术网_书友最值得收藏!

第25章 數(shù)據(jù)采集的困難

紫金市八月上旬的白晝穿行在馬路上已經(jīng)很是炎熱,因而林遠(yuǎn)選擇一早便起床。

他沒有選擇坐地鐵,而是騎上了他的小電驢。因?yàn)榻o系統(tǒng)建設(shè)數(shù)據(jù)途徑必定是需要在區(qū)域的每一戶商家都跑一遍,他可不想靠自己的雙腳去跑。

劉胡子包攬的這片區(qū)域涵蓋了整個(gè)HX區(qū)最繁華的地段。在這里有無數(shù)的寫字樓,好團(tuán)外賣紫金分部也在附近。

林遠(yuǎn)跟公司方面申請(qǐng)了外出派送測(cè)試的機(jī)會(huì),因?yàn)橥赓u平臺(tái)有些更新上線之前還是需要實(shí)地專人測(cè)試一下的。一般來說不會(huì)讓程序猿親自出去跑,但林遠(yuǎn)為了在工作時(shí)間外出,就主動(dòng)請(qǐng)纓把這個(gè)事情攬了過來。

林遠(yuǎn)并不清楚針對(duì)商家做數(shù)據(jù)途徑建設(shè),應(yīng)該是怎么個(gè)流程。

為此,他特地沒有吃早飯,然后一早找了家早餐店,坐進(jìn)去方便仔細(xì)觀察。

按照先前的經(jīng)驗(yàn),算力系統(tǒng)完成數(shù)據(jù)載入時(shí)是會(huì)有相關(guān)提示的。可是林遠(yuǎn)坐進(jìn)這家早餐店后,已經(jīng)都快吃完兩個(gè)包子了,系統(tǒng)還是沒有任何反應(yīng)。

最終,直到他喝完豆?jié){走出門,系統(tǒng)都沒有給出任何回應(yīng)。

【你難道只能載入已經(jīng)采集完成的數(shù)據(jù)?不能自行根據(jù)位置主動(dòng)整理獲取?】

【身為系統(tǒng),你好歹有點(diǎn)逼格嘛。】

盡管林遠(yuǎn)不停朝著系統(tǒng)吐槽抱怨,可是系統(tǒng)裝死起來是不會(huì)有任何回音的。

清早的大馬路上,林遠(yuǎn)就那么站在路邊,看著來來往往的車流,陷入了淡淡的失落之中。

如果不能對(duì)商家完成數(shù)據(jù)途徑建設(shè),那自然也不可能對(duì)騎手完成同樣的建設(shè)。那這樣一來,整個(gè)外賣路徑和派送問題中最關(guān)鍵的兩個(gè)點(diǎn)--商家和騎手,就徹底和算法是斷聯(lián)狀態(tài)。

什么AI,什么人工智能,什么chatGPT。別管它名頭喊得有多響,逼格吹得有多高。最后都逃不出一點(diǎn)--數(shù)據(jù)驅(qū)動(dòng)。

再厲害的AI模型也是由數(shù)據(jù)驅(qū)動(dòng)的,數(shù)據(jù)是一切的源頭。哪怕對(duì)于算力系統(tǒng)來說,也是同樣的。

數(shù)據(jù)代表著方向和目的地,沒有它的話,即便是千萬級(jí)別的豪車也不知往哪開。

假如林遠(yuǎn)設(shè)想的這種數(shù)據(jù)途徑建設(shè)方式是行不通的,那麻煩還不僅止于眼前的這個(gè)外賣算法優(yōu)化項(xiàng)目,更大的麻煩來自于這算力系統(tǒng)的使用方式。

算力系統(tǒng)能在簡(jiǎn)單引導(dǎo)下能主動(dòng)完成數(shù)據(jù)采集,相比于采集好了數(shù)據(jù)再丟給算力系統(tǒng)。這就好比是自動(dòng)駕駛和手動(dòng)駕駛的區(qū)別。

這其中區(qū)別可就大了。

就像手動(dòng)駕駛的時(shí)候不能分心干別的事情一樣,如果數(shù)據(jù)必須手動(dòng)采集后再丟給算力系統(tǒng),那今后林遠(yuǎn)將耗費(fèi)N多的時(shí)間去處理這類數(shù)據(jù)采集問題。

而更進(jìn)一步的麻煩是。如果以自動(dòng)駕駛和手動(dòng)駕駛為例,要是車子的目的是將人送到某個(gè)地方,那兩者區(qū)別也就是車上的人是否可以分心而已。可要是本身的目的不是為了送人而就是為了讓車子開到一個(gè)地方呢。

也就是說,假如駕駛的目的就是為了讓車子從一個(gè)地方到另一個(gè)地方。那自動(dòng)駕駛和手動(dòng)駕駛就將是天壤之別。

因?yàn)樽詣?dòng)駕駛的話,人可以不用在車?yán)铩H酥恍枰o車子設(shè)定好目的地后就不用管了,一個(gè)人就可以應(yīng)付成千上萬輛車子。可手動(dòng)駕駛就不行了,一個(gè)人就只能應(yīng)付一輛車子。

這叫什么。

這叫底層原理影響上層應(yīng)用。

底層原理的優(yōu)勢(shì)反饋到上層應(yīng)用上常常會(huì)產(chǎn)生指數(shù)級(jí)的差別。

數(shù)據(jù)采集的道理就是如此。

手動(dòng)采集就像手動(dòng)駕駛一樣,一個(gè)人只能應(yīng)付一個(gè)數(shù)據(jù)節(jié)點(diǎn)。可自動(dòng)采集的話,一個(gè)人就能應(yīng)付N個(gè)數(shù)據(jù)節(jié)點(diǎn)。

如果真讓林遠(yuǎn)去手動(dòng)采集數(shù)據(jù),那外賣算法優(yōu)化這個(gè)項(xiàng)目就不用做了。因?yàn)樗麩o論如何也不可能每天蹲在所有商家的門口,以及坐在所有騎手們小電驢的后座上,不停地記錄他們產(chǎn)生的數(shù)據(jù)。

科學(xué)法則就是如此。當(dāng)你的目光只看到一輛車的時(shí)候,你并不覺得自動(dòng)駕駛和手動(dòng)駕駛差別多大。可是將視野投射出去,涵蓋無數(shù)輛車的時(shí)候,巨大的差距就體現(xiàn)出來了。

這也是那么多科技大公司心甘情愿燒巨資押寶自動(dòng)駕駛的原因之一。

不過這是題外話了,林遠(yuǎn)這時(shí)候站在清晨的微風(fēng)中。空氣中逐漸上升的氣溫就像他此時(shí)慢慢焦灼的心情。

真正走上IT這條路后,林遠(yuǎn)漸漸有了兩個(gè)最大的感悟。

一個(gè)是遇到問題必須習(xí)慣性地去探究,抓住問題的本質(zhì)。二是真正明白了方向的重要。

這兩點(diǎn)并非是空話。

林遠(yuǎn)并沒有因?yàn)槭涠^望,他開始仔細(xì)分析系統(tǒng)數(shù)據(jù)途徑的特點(diǎn)。試圖去抓住問題的本質(zhì)。

算力系統(tǒng)可以輕松獲取好團(tuán)公司從后臺(tái)導(dǎo)出的已經(jīng)采集好的外賣數(shù)據(jù),并且對(duì)數(shù)據(jù)總量大小無感,再大的數(shù)據(jù)也能很快載入。那也就是說:系統(tǒng)更加關(guān)心的是數(shù)據(jù)的形式。

那些被采集好的外賣數(shù)據(jù)也并非是最終可被AI模型執(zhí)行的向量形態(tài)。

外賣數(shù)據(jù)一般是這樣:某年某月,張三在A地接到訂單(編號(hào):order123),然后去商家所在的B地,花了多少時(shí)間等餐,之后再走什么樣的路徑什么時(shí)間送到客戶所在的C地。

這樣的數(shù)據(jù)是不可能直接丟給現(xiàn)實(shí)世界的AI模型去計(jì)算的,特么的AI指的是AI最終生產(chǎn)出來的那個(gè)玩意兒,又不是指生產(chǎn)AI的玩意兒本身就是個(gè)AI。

這一點(diǎn)是很反普通人的常識(shí)的--AI其實(shí)就是算法,而AI算法是被生產(chǎn)制造出來的,而這個(gè)生產(chǎn)制造的過程卻一點(diǎn)也不AI。

這就好比你給地里的瓜果澆大糞,地里就能長出好吃的瓜果一樣。瓜果好吃,但澆下去的那玩意兒顯然不能吃。

但是,這僅僅是對(duì)現(xiàn)實(shí)世界的AI模型來說。算力系統(tǒng)卻并非如此,算力系統(tǒng)直接就可以載入這些未經(jīng)處理的數(shù)據(jù)進(jìn)行計(jì)算。

現(xiàn)實(shí)世界的AI模型在計(jì)算之前,通常的做法是:把這些外賣數(shù)據(jù)處理成矩陣向量。

AI模型是冰冷的,它才不管你丟給它的數(shù)據(jù)是什么意思,反正在它眼里都是矩陣向量。于是外賣數(shù)據(jù)就需要先被轉(zhuǎn)化為:[-1, 23, 321,......]這種冰冷的數(shù)字。

這些數(shù)字代表了真實(shí)的外賣數(shù)據(jù)。比如:某條外賣訂單配送時(shí)的天氣是大晴天,那矩陣向量中的某一個(gè)參數(shù)可能就會(huì)用數(shù)字“1”來表示,進(jìn)而用數(shù)字“0”來表示陰天。

但算力系統(tǒng)則不同,林遠(yuǎn)之前測(cè)試過。外賣的數(shù)據(jù)根本不需要經(jīng)過預(yù)處理,直接讓系統(tǒng)載入也能處理。貌似系統(tǒng)自身就可以進(jìn)行數(shù)據(jù)預(yù)處理。

這倒是符合系統(tǒng)的尿性--畢竟這系統(tǒng)就像一臺(tái)可以按需改變自己硬件參數(shù)的活的電腦。

于是林遠(yuǎn)自然而然想著從這一點(diǎn)上尋找突破口。

主站蜘蛛池模板: 雅安市| 黎平县| 文安县| 清苑县| 工布江达县| 山东省| 仁寿县| 鄂伦春自治旗| 丹凤县| 斗六市| 巨鹿县| 南城县| 永修县| 清镇市| 合阳县| 石楼县| 高唐县| 辽源市| 台北市| 敦煌市| 苍南县| 三江| 苗栗市| 雷波县| 栖霞市| 淮北市| 深泽县| 边坝县| 峨眉山市| 孟州市| 高碑店市| 疏勒县| 牟定县| 濉溪县| 奇台县| 南投市| 永丰县| 甘孜| 奉贤区| 云阳县| 邢台市|