官术网_书友最值得收藏!

第二節(jié) 大數(shù)據(jù)時(shí)代的管理研究

上述這套撰寫研究報(bào)告的規(guī)范雖然乍一看有點(diǎn)“八股”的味道,但其真正的作用就像公路上的行車線之于司機(jī):在循規(guī)蹈矩的司機(jī)眼中這些規(guī)矩幾乎不存在或不需存在,但對(duì)胡作非為的司機(jī)來(lái)說(shuō)這些規(guī)矩足以將他們罰下道路。同理,研究者即便是對(duì)研究課題駕輕就熟,也須恪守科學(xué)的規(guī)范,不能因一時(shí)興起而信口開河。這一點(diǎn)對(duì)于從事高等教育研究特別是大學(xué)管理研究的人來(lái)說(shuō)尤其重要,因?yàn)樗麄冄芯康男哦扰c效度直接關(guān)系到大學(xué)的存在與發(fā)展。

在西方,尤其是在美國(guó),雖然教育學(xué)院或教育研究所的專家教授們亦以大學(xué)管理為其研究課題,但大量的日常研究工作卻發(fā)生在院校研究辦公室(Office of Institutional Research)。2003年,我在與周川教授合編的《院校研究與美國(guó)高校管理》一書前言中曾對(duì)院校研究做過這樣一個(gè)描述:

“院校研究是在一定的理論指導(dǎo)下運(yùn)用科學(xué)的方法,尤其是信息科學(xué)的方法,對(duì)單個(gè)高等院校的運(yùn)行狀況及其影響因素進(jìn)行定量和定性的分析,從而為高校的運(yùn)作、管理、決策和發(fā)展提供現(xiàn)實(shí)依據(jù)的一種研究。……院校研究與傳統(tǒng)的高等教育研究之間最大的區(qū)別在于它的研究對(duì)象及目的。傳統(tǒng)的高等教育研究將人類的高等教育實(shí)踐作整體或部分的研究,旨在提高人們對(duì)高等教育性質(zhì)與規(guī)律的把握和認(rèn)識(shí);而院校研究則以個(gè)別學(xué)校為研究對(duì)象,研究者就高校機(jī)構(gòu)某方面或各方面收集數(shù)據(jù)并進(jìn)行分析,旨在為決策者從規(guī)劃、管理及日常運(yùn)作等各方面提供信息和決策輔助。”[5]

好奇的看客一定會(huì)問:本書所關(guān)注的大學(xué)管理研究,不就是院校研究嗎?有必要在此故弄玄虛、另立門戶嗎?說(shuō)來(lái)話長(zhǎng)。想當(dāng)初我在20世紀(jì)90年代初開始介紹院校研究時(shí),曾經(jīng)生搬硬套,將國(guó)外的“institutional research”直譯為“機(jī)構(gòu)研究”。[6]后經(jīng)潘懋元教授提議改為院校研究,沿用至今。潘老雖僅改動(dòng)一詞,卻直擊要害,將研究的重點(diǎn)放在個(gè)別院校的管理,而非作為一個(gè)整體的高等教育領(lǐng)域。然而,院校研究進(jìn)入中國(guó)高校之后,實(shí)為南橘北枳,并未如西方那樣在大學(xué)里形成院校研究辦公室。究其原因,于院校于研究均無(wú)干系,卻與體制息息相關(guān)。在美國(guó)大學(xué),院校研究人員屬于行政體制,故其職責(zé)不在發(fā)表而在輔助決策;反之,中國(guó)大學(xué)的“院校研究”人員屬于教研體制,不發(fā)表就要走人(publish or perish),故其精力全部放在理論研究上,根本無(wú)暇顧及大學(xué)的管理問題。(行文至此,我們似乎應(yīng)該對(duì)錢鍾書先生半個(gè)多世紀(jì)前的冷嘲熱諷背后的深意有點(diǎn)覺悟了吧!)為了避免任何可能產(chǎn)生的概念上的歧義,我在本書中堅(jiān)持用“管理研究”來(lái)指稱以大學(xué)管理決策為目的的高等教育研究。

然而,隨著大數(shù)據(jù)時(shí)代的來(lái)臨,教育研究的詞典中又添新術(shù)語(yǔ):“analytics”——一般將其譯作分析學(xué)、解析學(xué)或分析論。為統(tǒng)一起見,我在本書中采用“分析論”這個(gè)譯法。2006年達(dá)文波特(Daven-port, T.H.)教授在《哈佛商業(yè)評(píng)論》上發(fā)表文章指出,在許多類似的產(chǎn)品充斥市場(chǎng)的今天,一個(gè)企業(yè)出奇制勝的法寶就是具有極高專業(yè)水準(zhǔn)的數(shù)據(jù)收集、儲(chǔ)存、分析以達(dá)致決策。事實(shí)上,亞馬遜、萬(wàn)豪酒店等成功的企業(yè)早已借助分析論來(lái)指導(dǎo)企業(yè)管理和營(yíng)運(yùn)的方方面面。[7]他隨后出版的同名專著《以分析取勝》[8]更是將分析論推向各個(gè)行業(yè),在商界內(nèi)外掀起一股以大數(shù)據(jù)分析支持戰(zhàn)略決策的熱潮。

達(dá)文波特的書雖然在分析論的推廣方面極具煽動(dòng)性,但對(duì)于究竟什么是分析論卻語(yǔ)焉不詳。華生和納爾遜在他們合著的《管理分析論》一書中給出的定義似較為全面、準(zhǔn)確:

“分析論是所有運(yùn)用數(shù)據(jù)洞察現(xiàn)象以求改善決策的學(xué)科的總和。它包含三個(gè)組成部分:描述分析(descriptive analytics)重在對(duì)數(shù)據(jù)進(jìn)行描述、報(bào)道及圖像化;預(yù)測(cè)分析(predictive analytics)重在根據(jù)數(shù)據(jù)預(yù)測(cè)趨勢(shì),確認(rèn)關(guān)聯(lián);指導(dǎo)分析(prescriptive analytics)則是基于現(xiàn)有的數(shù)據(jù)以及可預(yù)測(cè)的趨勢(shì)對(duì)最佳決策提出指導(dǎo)意見并伴以行動(dòng)步驟。”[9]

換言之,描述分析告訴你已經(jīng)發(fā)生和正在發(fā)生的事情,預(yù)測(cè)分析告訴你將要發(fā)生的事情,而指導(dǎo)分析則告訴你應(yīng)當(dāng)如何行動(dòng)。值得注意的是,作者在這個(gè)有關(guān)分析論的定義中明確指出,許多運(yùn)用數(shù)據(jù)洞察現(xiàn)象以求改善決策的學(xué)科其實(shí)早已存在,因而分析論亦非新生事物。據(jù)此,美國(guó)大學(xué)從20世紀(jì)60年代初開始進(jìn)行院校研究,便是“運(yùn)用數(shù)據(jù)洞察現(xiàn)象以求改善決策”的最佳例證,只是當(dāng)時(shí)還沒有分析論這一說(shuō)。今天,分析論在一夜之間受到如此熱捧,其中最重要的原因當(dāng)是大數(shù)據(jù)或體量巨大的數(shù)據(jù)突然之間變得唾手可得。像我這樣曾以數(shù)據(jù)為業(yè)的人(說(shuō)俗一點(diǎn)就是吃數(shù)據(jù)飯的)都不難體會(huì),當(dāng)你需要通過實(shí)證研究解決一個(gè)問題時(shí),得到充足的相關(guān)數(shù)據(jù)是一件多么不容易的事!分析員們?yōu)榇私g盡腦汁,以“上窮碧落下黃泉”來(lái)形容都不為過。可如今,隨著網(wǎng)絡(luò)時(shí)代的來(lái)臨,特別是社交媒體在2000年后異軍突起,我們身邊的數(shù)據(jù)突然以幾何速度增長(zhǎng),這情景,在任何一個(gè)分析員眼中都是辛棄疾詩(shī)句的電影版本:“眾里尋他千百度,驀然回首,那人卻在燈火闌珊處”!

大數(shù)據(jù)激活了人們潛藏已久的想象力。牛津大學(xué)教授邁耶勛伯格(Mayer-Sch?nberger, V.)和《經(jīng)濟(jì)學(xué)人》雜志編輯庫(kù)克耶(Cuki-er, K.)在其合著的《大數(shù)據(jù)》一書[10]開頭講了這么一個(gè)激動(dòng)人心的故事。

2009年一個(gè)新的流感病毒H1N1在美國(guó)大地肆虐,引起世界的恐慌。美國(guó)疾病控制中心(簡(jiǎn)稱CDC)要求全國(guó)的醫(yī)生在接到病例后及時(shí)通知CDC,以便采取對(duì)策防止病毒擴(kuò)散。然而,信息收集起碼有兩個(gè)星期的滯后,因?yàn)椴∪藭?huì)在出現(xiàn)癥狀后等一兩天才去看醫(yī)生,醫(yī)生報(bào)告CDC再花幾天時(shí)間,加上CDC每周一次匯總信息,所以政府公共衛(wèi)生部門完全無(wú)法有效預(yù)測(cè)病毒的發(fā)展及其走向。然而就在此前不久,谷歌的工程師剛在《自然》雜志上發(fā)表一篇關(guān)于如何利用搜索引擎發(fā)現(xiàn)并預(yù)測(cè)流行疾病的文章。[11]他們假設(shè),當(dāng)人們感到身體不適時(shí)會(huì)上網(wǎng)搜索相關(guān)信息,如“咳嗽與發(fā)燒如何用藥”等。谷歌將2003年至2008年的5000萬(wàn)條搜索信息與CDC數(shù)據(jù)中有關(guān)信息進(jìn)行比對(duì),用搜索頻率與搜索人所在地區(qū)的相關(guān)系數(shù)建立數(shù)學(xué)模式,最后確認(rèn)的45條搜索詞匯,輔以數(shù)學(xué)模式,使他們能夠成功預(yù)測(cè)疾病的傳染區(qū)域和病例。他們比CDC棋高一著的地方在于數(shù)據(jù)的實(shí)時(shí)性。

這個(gè)故事有兩個(gè)看點(diǎn)。

其一,傳統(tǒng)實(shí)證研究的起點(diǎn)是搜集與課題相關(guān)的各種數(shù)據(jù)并加以描述,在此基礎(chǔ)上就事件的過去總結(jié)規(guī)律,對(duì)未來(lái)作出預(yù)測(cè),并為決策者找到解決問題的途徑。在這個(gè)過程中最具挑戰(zhàn)性的工作無(wú)疑是數(shù)據(jù)的搜集,因?yàn)檫@關(guān)系到以后的步驟能否進(jìn)行,并直接影響到研究的結(jié)果是否可靠。因?yàn)檠芯空卟皇侨艿纳系郏該碛袛?shù)據(jù)的全本(population)對(duì)于他們來(lái)說(shuō)純屬奢望,能做的只是盡力設(shè)計(jì)合理樣本(sample),希望數(shù)量有限的樣本數(shù)據(jù)能夠最大限度地描述它們所代表的那個(gè)全本(假如這個(gè)想象中的全本確實(shí)存在的話)。可現(xiàn)在,“幸福來(lái)得太突然”,研究者不僅能夠全本在握,而且還具有實(shí)時(shí)性,怎不讓人喜出望外?

在傳統(tǒng)的樣本設(shè)計(jì)中,研究者為了增加樣本的代表性,必須在研究開始之前就先行決定抽樣方法,其可供選擇的科學(xué)抽樣方法包括簡(jiǎn)易隨機(jī)抽樣(simple random sampling)、系統(tǒng)抽樣(systematic sampling)、分層抽樣(stratified sampling)、類聚抽樣(cluster sam-pling)、多重類聚抽樣(multi-stage cluster sampling),等等。雖然多年的統(tǒng)計(jì)實(shí)踐足以證明這些抽樣方法的有效性,但因?yàn)槌闃臃椒ò凑仗囟ㄑ芯磕康亩ǎ芯空咴谘芯块_始后一旦遇到新的情況需要對(duì)所研究的問題進(jìn)行調(diào)整時(shí),修改樣本的空間幾乎不存在。可現(xiàn)在,比如谷歌搜索引擎的電子記錄是全方位、多層次的,研究者可以隨時(shí)調(diào)整其研究的方向,并能捕捉樣本數(shù)據(jù)中常常容易被人忽略的小團(tuán)體、弱信號(hào)。

其二,大數(shù)據(jù)及其成功應(yīng)用開始挑戰(zhàn)我們認(rèn)識(shí)世界的方式。之前,統(tǒng)計(jì)思維給我們的信心是,盡管人類的認(rèn)知能力有限,但通過科學(xué)的樣本設(shè)計(jì),我們完全能夠?qū)崿F(xiàn)以小見大、以偏概全。因此經(jīng)過傳統(tǒng)統(tǒng)計(jì)訓(xùn)練的人都相信,只要方法得當(dāng),我們透過統(tǒng)計(jì)分析的顯微鏡看世界,一樣能夠看到事物的本質(zhì)、規(guī)律和因果關(guān)系。大數(shù)據(jù)似乎正在顛覆這種信心。假如我們不再需要抽樣,而是能夠直接進(jìn)入研究對(duì)象數(shù)據(jù)的全本,那么,之前我們根據(jù)樣本所做的各種統(tǒng)計(jì)測(cè)試和推斷不是都失去了必要性?谷歌以對(duì)大數(shù)據(jù)的分析向CDC表明,了解病人的行為、他們所在的地區(qū)、發(fā)病的某些癥狀等看似無(wú)關(guān)的變量之間的相關(guān)性已經(jīng)足夠。假如僅僅是為了輔助決策,CDC并不需要知道這些變量背后的因果關(guān)系。換言之,知道“What”,決策者便能知道“How”,大可不必深究“Why”。

關(guān)于這一點(diǎn),邁耶勛伯格和庫(kù)克耶為我們作了如下的解讀:

“大數(shù)據(jù)的核心是預(yù)測(cè)。雖然所謂的人工智能被認(rèn)為是計(jì)算機(jī)科學(xué)領(lǐng)域的一個(gè)分支,更具體地說(shuō),是一個(gè)被稱為機(jī)器學(xué)習(xí)的領(lǐng)域,但這樣的表述會(huì)引起誤導(dǎo)。大數(shù)據(jù)根本不會(huì)試圖‘教’一部電腦像人類那樣去‘思考’。相反,它是將數(shù)學(xué)運(yùn)用到體量巨大的數(shù)據(jù)上以此來(lái)推斷概率:如一份電郵屬于垃圾郵件的可能性;當(dāng)一個(gè)人打出‘teh’時(shí)可能心里想的是‘the’;一個(gè)人亂穿馬路時(shí)的軌跡與速度是否意味著他在趕時(shí)間——因此無(wú)人駕駛的汽車只需稍稍減速。關(guān)鍵在于,這些系統(tǒng)能夠得到足夠多的數(shù)據(jù)來(lái)幫助它們作出預(yù)測(cè),以保證運(yùn)作正常。更重要的是,系統(tǒng)的設(shè)計(jì)中包含了自我改善的能力,因?yàn)樗鼈兡軌蛟谛碌臄?shù)據(jù)進(jìn)入時(shí)自動(dòng)尋找那些先前記錄在案的最佳信號(hào)和模式。”[12]

不得不承認(rèn),大數(shù)據(jù)的出現(xiàn)為我們提供了一個(gè)全新的視角。以前我們也許很少想到,各種變量之間的相關(guān)性具有如此神奇的預(yù)測(cè)潛能。它對(duì)于傳統(tǒng)的統(tǒng)計(jì)思維的沖擊幾乎難以抵擋。然而有趣的是,在市面上潮水般涌來(lái)的各種關(guān)于大數(shù)據(jù)和分析論的文章書籍中,我們見到最多的還是大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用。從事教育研究、特別是高等教育管理研究的人們?cè)谶@來(lái)勢(shì)兇猛的時(shí)代大潮面前何去何從?他們?nèi)绾卧u(píng)估這個(gè)行業(yè)的走向及他們自己作為研究者未來(lái)的命運(yùn)?他們的工具箱里是否具有足夠的收藏來(lái)應(yīng)對(duì)行業(yè)的挑戰(zhàn)?

主站蜘蛛池模板: 齐齐哈尔市| 陇西县| 沁源县| 栾城县| 柏乡县| 同江市| 海安县| 山阴县| 安平县| 霍林郭勒市| 慈溪市| 搜索| 马公市| 华阴市| 阳原县| 澄迈县| 五峰| 黎平县| 株洲市| 玛纳斯县| 梧州市| 旬邑县| 两当县| 巴楚县| 阜康市| 道孚县| 荆门市| 泗洪县| 泰来县| 清流县| 通榆县| 湘潭县| 东安县| 建德市| 万山特区| 平阴县| 永州市| 吉林市| 云霄县| 边坝县| 南昌市|