- 數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow
- 謝梁 繆瑩瑩 高梓堯 王子玲等
- 821字
- 2021-06-24 11:29:36
序二
人類對知識的探尋過程大致是實驗、觀察、歸納、驗證,數據科學就是這樣一個格物致知的過程。
20年前互聯網初起時,系統為記錄Debug而留下日志信息,后來人們發現其中蘊含著業務的細節,體現了互聯網經濟模式的規律。這個經濟模式塑造了人類歷史上一批偉大的公司,成就了新商業模式的奇跡。數據科學脫胎于互聯網行業,得以通過分析大量的微觀經濟行為來理解宏觀經濟規律。
可是數據科學距離這個偉大的愿景差距還不小,我在互聯網行業工作了14年,身邊很多朋友覺得數據科學只是科學家用于進行數據預處理的工具,也有人說數據科學就是給領導做報表用的。其實我一度也有這樣的偏見,直到2018年加入螞蟻金服,見到很多具備豐富行業經驗的分析師被AI背后復雜的數學性質牽絆,難以實現更高的業務價值。為此我和團隊成員努力嘗試在Python之上建立一個抽象層SQL來提供AI的能力,于是有了探索性開源項目SQLFlow。
“AI平民化”這個想法是Andrew Ng告訴我的,當時我在百度硅谷研究院跟他做Deep Speech 2模型的開發。離開百度后的休假期間,我受Paddle作者徐偉老師的啟發,想到從SQL入手實現“AI平民化”的計劃。SQLFlow作為一個開源項目,得到了螞蟻金服CTO胡喜的諸多支持。2019年云棲大會上,老友賈揚清為與會朋友們介紹了SQLFlow。SQLFlow在滴滴的部署和業務探索期間承蒙滴滴CTO張博和SVP章文嵩大哥的支持。
所有這些鼓勵背后給予我最大動力的是滴滴首席科學家謝梁老師。SQLFlow產品的很多想法都來自謝老師和團隊在使用和實踐過程中給出的寶貴建議。可以說是這本書中介紹的很多場景,塑造了SQLFlow。
給行業專家帶來AI助力是一個改變人們想法的過程。SQLFlow只是漫漫盤山道上的一段石階。我2021年初離開螞蟻金服任Facebook首席工程師時,有幾個硅谷創業公司的朋友告訴我,他們的系統受到了SQLFlow的諸多啟發。大家奮力開山修路的動力是數據科學的宏大愿景,是“AI平民化”的理想。最終實現這個理想的,一定是行業專家中最具開拓精神,不懼深入理解AI思路的跨界者。期待謝老師和團隊對我們這一合作探索的總結能啟發后生繼續努力!
王益Facebook首席工程師/SQLFlow發明者
2021年5月