1.10 大數據之我見
從技術層面看,大數據分析=數據+算法。如果算法有了,就缺數據。數據如果是分散的,需要數據整合平臺;數據可能還是別人的,需要數據交易所。算法怎么來?一個是自己的行業積累,一個是業界的公認算法。一些行業,比如,金融行業,業界已經出了不少的算法,不需要我們自己折騰了。另外一些行業,算法可能還在摸索階段。
數據整合平臺怎么做?本書的前面9章都是在講數據整合的各個步驟,以及相關的產品和技術。第10章重點講了已經有的算法和它們的用法。弄清楚了這些,技術上的大數據分析就清楚了。歸根到底,就是怎么弄數據了,到時候才真正地到了“數據為王”的時代了。