官术网_书友最值得收藏!

  • 拆穿數據胡扯
  • (美)卡爾·伯格斯特龍 杰文·韋斯特
  • 3438字
  • 2022-04-18 11:13:21

前言

當今社會胡扯現象隨處可見,令人不勝其煩。政治家無視事實信口開河,科研人員把發新聞稿視為科學研究,硅谷的初創公司將胡扯發展到了藝術的高度,大學獎勵的是胡扯而不是分析思維,大多數管理活動似乎只不過是一個對胡扯進行編排組合的復雜過程。心懷不軌的廣告商朝我們眨眨眼,誘導我們和他們一起把胡扯進行到底,而我們也眨眨眼表示回應——與此同時,我們就會放松警惕,對他們奉送的修飾過的胡扯信以為真。胡扯在具體問題上誤導我們,破壞我們對一般信息的信任,因此會污染我們這個社會。盡管能力有限,但我們希望可以通過本書,對這一現象給予回擊。

哲學家哈里·法蘭克福認為,胡扯現象無處不在是我們這個時代的一個典型特征。他在他的大作《論胡扯》的開頭指出:

我們文化的一大特點就是胡扯太多。人人都知道,而且人人都有份,但我們往往會把這種情況視為理所當然。(不過,)我們不清楚胡扯是什么,為什么如此之多,也不知道它有什么作用。我們沒有認真探討胡扯的真正含義。換句話說,我們沒有形成理論。

要徹底消滅胡扯,就需要準確地了解它是什么。這就有點兒棘手了。

首先,“胡扯”(bullshit)既是名詞也是動詞。我不僅聽膩了你的胡扯(名詞),也可以反過來跟你胡扯(動詞)。這很好懂。簡單地說,胡扯作為動詞就是指說一些胡扯的話。

但是,“胡扯”這個名詞到底指的是什么呢?和許多人試圖用哲學概念匹配日常語言的努力一樣,試圖為它制定一個涇渭分明的定義的努力也必然徒勞無功。因此,我們將從例子著手,描述一些可以稱之為胡扯的東西。

大多數人都認為自己擅長發現胡扯。當胡扯以修辭或花哨的語言形式出現(我們稱之為老派胡扯)時,他們這樣想也許沒有錯。例如:

? 我們的共同使命是發揮雙方解決方案的作用,使未充分利用的人力資源組合機會得到充分利用。(換句話說,我們是短期工中介公司。)

? 我們存在的意義在于傳播。要開始這個神話,就要成為它的一部分。(我們可以把這稱為新時代的老派胡扯。)

? 我們像先輩一樣,懷著堅定的思想和滿腔的熱忱,眼光掠過偉大祖國的無垠疆土,重新點燃我們共同命運的火花。(算了吧,你還是說說如何讓我們這個地區重新得到更多的就業機會吧。)

老派胡扯似乎并沒有消失,但隨著新派胡扯的興起,它似乎沒有那么引人注目了。新派胡扯使用數學、科學和統計語言來制造嚴謹準確的印象。它們利用數字、統計數據和數據圖表粉飾那些可疑的論斷,給它們披上了一層合理的外衣。新派胡扯可能會采用下面這些形式:

? 根據貨幣匯率加以調整后,我們表現最好的全球基金在過去9年中有7年跑贏了市場。

(回報率到底是如何調整的?該公司有多少基金未能跑贏市場,相差多少?就這個問題而言,是某一只基金在9年中有7年跑贏了市場,還是在這7年中每年都有一只不同的基金跑贏了市場?)

? 雖然沒有統計意義(p = 0.13),但我們取得的結果突出表明了我們靶向治療腫瘤的臨床意義(5年生存率比為1.3),并對當前的治療范式提出了挑戰。

(如果一個結果沒有統計意義,那么討論它的臨床意義又有什么意義呢?5年生存率是這種特定癌癥的相關指標,還是說大多數患者在3年內死亡?為什么我們要認為這“對當前的治療范式提出了挑戰”?)

? 該團隊的卷積神經網絡算法可以從一個由人類代謝組、轉錄組和蛋白質組構成的多層網絡中提取底層控制邏輯。

(什么是多層網絡?這些不同的“組”之間的連接有什么重要意義?如何測量?作者所說的“控制邏輯”是什么意思?我們如何知道這些系統真的是通過一個底層控制邏輯連接到一起的?我們如何確證這種方法可以提取這個底層控制邏輯呢?)

? 我們的系統篩查顯示,34%的有行為障礙的二年級學生承認在過去一年里至少聞過一次神奇馬克筆。

(這個數據很重要嗎?如果真的很重要,那么聞馬克筆這個行為是“行為障礙”的原因還是結果?有多少沒有行為障礙的二年級學生承認聞過馬克筆?也許這個比例更高!)

新派胡扯之所以特別有效,是因為我們中的許多人覺得沒有資格質疑以數量形式呈現的信息。這讓那些新派胡扯者們正中下懷。要反擊,就必須學會在合適的時機,以合適的方式質疑這些言論。

< ◇ >

在教學中,我們一直在教導學生如何對數據進行邏輯和定量思考。本書源于我們在華盛頓大學教授的一門叫作“Calling Bullshit”的課程,目的是說明一個事實:即使你不是一名專業的統計學家、計量經濟學家或數據科學家,你也能批判性地思考那些定量論證;無須大量數據和數周時間,也能看穿胡扯。只要有基本的邏輯推理,在需要的時候,再輔以通過搜索引擎輕松獲取的信息,通常就足以解決問題了。

作為公民,我們肯定希望可以幫助人們發現并駁斥胡扯。這不是左翼或右翼意識形態的問題;這兩個陣營的成員都證明了自己善于制造和傳播錯誤信息。相反(盡管有夸大其詞的危險),我們認為擁有足夠的辨別胡扯的能力對民主的存續來說至關重要。民主一直依賴于選民的批判性思維,但在當今這個時代,社交媒體的傳播導致選舉過程深受假新聞和國際干預的影響,這同時也賦予了批判性思維前所未有的重要地位。在2016年12月的《紐約時報》專欄文章中,馬克·加萊奧蒂總結了應對這種信息戰的最有效防御措施:

美國政府不應該試圖直接打擊每一次泄密,而是應該教育公眾,讓他們知道自己什么時候被操縱了。通過學校、非政府組織和公共服務活動,美國人應該掌握成為精明的媒體消費者所必需的基本技能,包括核實新聞的真實性、識別說謊圖片的能力。

本書兩名作者都是擁有數十年數據科學、統計學和相關學科教學經驗的公立大學教師,對于如何教授這種思維并不陌生。我們認為,批判性思維并不要求我們在政治上偏向某一方。你可能在多個問題上(例如聯邦政府的最佳規模,政府介入我們私人生活的可接受程度,或者國家在世界舞臺上應該如何表現自己)與我們的觀點不一致,但沒有關系,我們只是想幫助持各種政治觀點的人當面指斥胡扯。因為我們認為,當選民能夠看穿來自各個方面的胡扯時,民主才是最健康的。

我們不是在建立一個平臺,讓我們可以就不喜歡的事情胡扯。因此,本書中的例子很少是我們所知道的最惡劣的例子,更不可能是那些讓我們憤怒不已的例子。相反,我們選擇的例子都是為了達到教學目的,找出特定的陷阱,突出適當的應對策略。我們希望你通過閱讀和思考,學會當面指斥胡扯。

< ◇ >

一個多世紀前,哲學家約翰·亞歷山大·史密斯在對牛津大學新生發表演講時說:

你在學校學到的東西對你(將來的生活)幾乎毫無用處,但它有一個好處:只要你認真學習,方法得當,那么在別人胡說八道的時候你會有所察覺。我認為,這即使不是教育的唯一目的,也是它的一個主要目的。

盡管取得了一些成功,但我們認為從這個角度看,高等學校STEM學科(科學、技術、工程和數學教育)的教學存在一些問題。一般而言,我們在操作方法教學,也就是在引導學生學習如何操作矩陣、轉染細胞、運行基因組掃描和運用機器學習算法這些方面做得很好。但這種關注事實和技能的做法是以犧牲批判性思維藝術的訓練和實踐為代價的。在人文和社會科學領域,學生們被教導要讓相互沖突的觀點相互碰撞,要與不一致的觀點做斗爭;但在STEM領域,學生們解決悖論、調和相互矛盾的證據、批判錯誤論斷的機會非常少。因此,大學畢業生往往精于質疑言語論證過程、識別邏輯謬誤,但令人驚訝的是,在面對通過數據提出的論斷時他們往往會默然接受。當然,中學教育也是如此?,F在的學生可以坦然拒絕政治、倫理、藝術和哲學論斷中的胡扯,但如果STEM教育采用在人文學科中已經習以為常的質詢式教學方式,培養出來的學生就能以同樣駕輕就熟的方式,拒絕統計報表和人工智能分析中的胡扯。

出于若干原因,我們在接下來的章節中大量引用了科學和醫學研究中的例子。我們熱愛科學,這也是我們的專長所在??茖W依賴于我們在這本書中提到的定量論證。在人類創立的所有體系中,科學似乎最不應該受到胡扯的影響——但事實并非如此。我們認為,公眾對科學的理解受到了諸多因素的妨礙,而理解正確與否,對于選民能否做出明智的決定具有至關重要的意義。本書的目的就是找出癥結所在。

但我們必須著重指出,我們絕不否認科學是理解物理世界的一個成功的標準手段。不管我們抱怨什么,不管我們發現了什么偏見,不管我們遇到什么問題,不管我們說了什么廢話,科學最終還是會成功的。有了科學的支持,我們才能乘坐飛機環游世界,通過視頻電話交談,移植器官,根除傳染病,理解大爆炸后的早期階段、生命的分子基礎等現象。

新的信息技術已經改變了我們的科學和社會交流方式。隨著信息獲取途徑得到改善,信息超載的現象愈演愈烈。我們希望本書能幫助你面對沖擊,將事實與虛構區分開來。

主站蜘蛛池模板: 临江市| 铁岭市| 土默特左旗| 新晃| 手游| 惠州市| 临湘市| 武夷山市| 乌拉特前旗| 金塔县| 册亨县| 睢宁县| 彝良县| 泰州市| 宜兰市| 夏津县| 民勤县| 濉溪县| 喜德县| 北宁市| 青岛市| 余庆县| 轮台县| 抚顺市| 汕头市| 阿拉善盟| 桂阳县| 河池市| 大竹县| 无为县| 晋中市| 涞水县| 康乐县| 内江市| 桃江县| 万载县| 泰和县| 台州市| 临漳县| 法库县| 龙里县|