官术网_书友最值得收藏!

第二節 研究方法

通過文獻分析與實地調研,建立基礎數據庫,借助季節性強度指數、地理集中度指數、重心模型、ArcGIS、回歸分析、格蘭杰因果關系檢驗、社會網絡分析法、內容分析等方法,采用文獻分析與實地調查結合、定性研究與定量研究結合、歸納與演繹結合的基本思路,分析旅游地網絡關注度時空分布特征及其與客流量相互關系。

一 季節性強度指數

季節性強度指數是反映旅游需求時間分布集中性的一個指標,也可用于網絡關注度年內時間分布集中性的分析,計算公式如式(2-1)所示。

式(2-1)中,R為旅游需求季節性強度指數或為整體(PC/移動)網絡關注度的季節性強度指數,xi為各月旅游需求或整體(PC/移動)網絡關注度量占全年的比重。R值越接近零,旅游需求或整體(PC/移動)網絡關注度年內各月分布越均勻;R值越大,旅游需求或整體(PC/移動)網絡關注度年內季節差異越大。

二 地理集中度指數

地理集中度指數主要用來考察旅游需求或網絡關注度空間地域分布的集中性,計算公式如式(2-2)所示。

式(2-2)中,G為旅游需求或整體(PC/移動)網絡關注度的地理集中指數,xii景區、城市、省(市、區)的旅游需求或整體(PC/移動)網絡關注度數量,T為旅游需求或整體(PC/移動)網絡關注度總量,n為景區、城市、?。ㄊ?、區)總數。G值越小,則旅游需求或整體(PC/移動)網絡關注度越分散。

三 重心模型

重心模型經常用于描述某指標的時空變化過程。本書主要將其用于分析景區(酒店)旅游需求或整體(PC/移動)網絡關注度地域結構的季節變化,計算公式如式(2-3)所示。

式(2-3)中,、為某時段內景區(酒店)旅游需求或整體(PC/移動)網絡關注度重心的經度值和緯度值,xi、yii景區(酒店)、城市、?。ㄊ小^)經度值和緯度值,若研究對象為省(區)則以各省(區)省會城市的經緯度為基準,Qi該時段內i景區(酒店)、城市、?。ㄊ小^)的旅游需求或整體(PC/移動)網絡關注度量。

四 偏差系數

在分析PC與移動網絡關注度空間分布差異時,由于兩者規模大小不一,不能直接進行對比分析,需要對兩者進行標準化處理,方法如式(2-4)所示。

式(2-4)中,PIYI)為I省(市、區)PC(移動)網絡關注度標準化值,pIyI)為I?。ㄊ?、區)PC(移動)網絡關注度值,為31個?。ㄊ小^)PC(移動)網絡關注度平均值。在此基礎上,將兩者進行比較,分析兩者空間分布的異同,公式如式(2-5)所示。

式(2-5)中,α為偏差指數,本書規定α=1時,該?。ㄊ?、區)PC和移動網絡關注度規模無偏差;0.9≤α≤1.1時,該?。ㄊ小^)PC和移動網絡關注度規模偏差小;α>1.1或α<0.9時,該?。ㄊ?、區)PC和移動網絡關注度規模分布偏差大;且α值偏離1越遠說明PC和移動網絡關注度規模分布差異越大。

五 格蘭杰因果關系檢驗

格蘭杰因果關系檢驗,是經濟學中分析兩個經濟變量之間有無因果關系的一種重要方法。它檢驗的是時間序列在一定滯后期上是否存在因果關系。主要檢測現在的Y在多大程度上被過去的X解釋,如果X在Y的預測上有幫助,或者X與Y的相關系數在統計上顯著時,可以解釋為“Y是由X的格蘭杰引起的”。進行格蘭杰因果關系檢驗的一個前提條件是時間序列必須具有平穩性,否則可能會出現虛假回歸的問題。因此,在進行格蘭杰因果關系檢驗之前,首先應對各指標時間序列的平穩性進行單位根檢驗(unit root test)。常用增廣的迪基—富勒檢驗(ADF檢驗)來分別對各指標序列的平穩性進行單位根檢驗。書中主要將其用于分析游客網絡關注度與客流量之間的互動關系。

六 社會網絡分析法

(一)方法概述

網絡是用來分析一個社會群體中主體及主體之間關系的集合,用多個點、線段表示主體之間的關聯關系。社會網絡分析法是從關系的角度研究社會群體現象和社會結構。其中,社會結構除了行為、政治結構之外,還包括經濟結構。因此,社會網絡分析法在多個學科中都有所應用。根據網絡類型的分類,可以將社會網絡研究分為個體網、局域網、整體網三個層次。個體網研究的是與中心節點直接相連的所有節點構成的網絡。局域網是指個體網加上與個體網的網絡成員有關聯的其他非個體網節點一起構成的網絡,按相連步數可分為2—步局域網、3—步局域網等。整體網指的是組織中所有成員之間關系所構成的網絡。整體網研究內容包括成員構成、網絡規模(成員數量),規模越大、結構越復雜,分派現象越普遍。成員間距離就是圖論中的相連距離,可以通過距離矩陣測算。除了簡單地描述整體網特征之外,還可以深層次地研究整體網的橫向構成,加強對整體網絡結構的認識。

(二)關聯性分析

測量有向網絡關聯度常用的指標有關聯度、網絡等級度、網絡效率、網絡密度等。

1.關聯度(Correlation)

關聯度表示的是網絡中各成員之間關聯可達程度。任意成員之間至少存在一條直接、間接關聯,證明該網絡具有關聯性。可達關聯線段越多,關聯度越大,網絡自身越穩健,取值范圍在[0,1]。在一個有向網絡圖中,任何兩點之間都可以建立聯系,稱為關聯圖,關聯圖的關聯度為1。網絡中,點總數為N,不可達的點對數為V,則關聯度C的計算公式如式(2-6)所示。

2.網絡等級度(Hierarchy)

網絡等級度表示的是網絡中各成員之間的非對稱性程度,反映網絡中各點的支配地位,H取值范圍[0,1]。對稱可達指的是有向網絡中直接、間接可達,可基于有向矩陣、可達距離矩陣、二值化可達矩陣計算。R為網絡中對稱可達的點對數,max(R)為最大可能的對稱可達點對數,則等級度H的計算公式如式(2-7)所示。

3.網絡效率(Efficiency)

網絡效率表示在網絡確定的前提下,存在的多余關聯線段的比例。網絡效率低,意味著網絡擁有較多的溢出線路,多余線路效率較大,多余線路接近最大可能多余線路,網絡結構較為穩健,網絡效率取值范圍為[0,1]。M為網絡中多余的線,max(M)為最大可能多余的線條數,則網絡效率E的計算公式如式(2-8)所示。

4.網絡密度(Density)

網絡密度表示的是網絡中各成員之間關聯緊密程度,即實際關聯數與理論最大可能關聯數的比值。整體網網絡密度越大,網絡聯系越緊密,網絡對其中行動者的影響越大。當整體網是有向關系網時,有N個成員,理論最大可能關系數為N(N-1),實際關聯數為M,則網絡密度D的計算公式如式(2-9)所示。

(三)中心性分析

中心性研究是為了認知網絡中某一成員對其他成員的控制能力。個體在網絡中處于什么樣的地位,對應相應的權利。個體網的網絡中心性用中心度表示,整體網網絡中心性用中心勢表示。具體包括度數、中間、接近中心性三種類型。當圖的規模(成員數量)不同時,各中心性指標不能直接比較,需要進行標準化處理。首先計算各個點的“絕對中心性”指標,即點的絕對中心度與網絡中最大可能的中心性指標,二者再進行比較,標準化處理為“相對中心性”指標。

1.度數中心性

(1)度數中心度(又稱局部中心度)

度數中心度用于測算直接相連的點數,而非間接相連的點數。有多個點與中心節點直接相連,則該中心節點具有較高的度數中心度。度數中心度測算的是直接相連的點,所以又稱為“局部中心度”。標準化處理為相對度數中心度,取值范圍[0,1]。CADNi)為點Ni的絕對度數中心度,成員為n的網絡中,任何點的最大可能的度數為n-1,故點的相對度數中心度CRDNi)的計算公式如式(2-10)所示。

(2)度數中心勢

度數中心勢用于測算整個網絡的度數中心度差異。差異越大,中心勢越大;反之,中心勢越小。度數中心勢的計算,首先找到圖中最大中心度的值,并計算與其他點的中心度的差值,對這些差值求和,與理論上的各個差值總和的最大可能值相比,此處使用相對度數中心勢。特別是,在規模數為n的完備網絡中,任何點的度數等于n-1,則該網絡的度數中心勢為0。具體計算公式如式(2-11)所示。

2.中間中心性

(1)中間中心度

中間中心度用于測量中心節點多大程度上處于其他點對的捷徑上。一個點位于圖中其他點的中間的概率,即在兩點的所有關聯中,含有點i的捷徑數量,與這兩點捷徑總數之比值,為中間中心度。若點的中間中心度為1,中心節點越處于網絡的中心,則中介作用越強,擁有很大的權力,可以100%控制其他點;點的中間中心度為0,說明該點處于網絡的邊緣,對網絡中其他成員不具備控制能力。CABi為絕對中心度,標準化的相對中間中心度,其中,bjki)表示為i處于點jk之間的概率,jkI,并且jk,取值范圍[0,1],具體計算公式如式(2-12)所示。

(2)中間中心勢

中間中心勢的構造原理與度數中心勢相同,此處不再贅述。中間中心勢是用來刻畫整個網絡的中間中心度差異的指數,取值范圍為[0,1],星形網絡為1,環形網絡為0,計算公式如式(2-13)所示。

3.接近中心性

(1)接近中心度(整體中心度)

接近中心度測量的是中心節點與其他點的最短間接關系之和,如果中心節點與其他點捷徑距離都很短,該點表現出較高的接近中心度。但在圖中,這樣的點與許多其他點都“接近”。為了便于比較,標準化處理成相對接近中心度,接近中心度值越小,中心節點與其他點捷徑距離越遠,說明該點越不是網絡的核心,對其他點的控制能力越弱。其中,dij是點ij之間的捷徑距離。計算公式如式(2-14)所示。

(2)接近中心勢

接近中心勢的構造原理同上,它是用來刻畫整個網絡的接近中心度差異的指數,取值范圍為[0,1]。星形網絡為1,完備網絡、環形網絡為0。計算公式如式(2-15)所示。

(四)塊模型分析

塊模型關注的是整體網絡結構中小群體關系。根據接收、發送關系將行動者分為四類:孤立點、發送點、接收點、傳遞點。波特針對接收關系以及發送關系將成員區分為兩類位置,即研究所關心的溢出與受溢位置。根據位置的成員針對自己位置成員發送關系數是否占總關系的一半,結合位置是否接收、發送關系以及位置內部關系緊密程度,區分為四類關系。孤立位置,位置內成員與其他位置沒有任何關系,又稱主受溢板塊。諂媚位置,位置內成員發送關系多于接收關系,并且與其他位置成員發生的關系數,比位置內部成員關系更多,對內溢出沒有對外溢出多,內部呈現向外溢出的能力,屬主溢出板塊。交互位置,位置發送關系、接收關系要多于位置內部關系數,內部關系并不緊密,因其接收關系也是發送關系,故又稱經紀人板塊。首屬位置,位置內成員主要接收外部位置的關系,同時位置內部關系緊密,為雙向受溢板塊。

參考瓦瑟曼的計量方法,期望關系為最大限度關聯,即模塊中的關系數與板塊在總體網絡中最大可能存在的關系數比值。假設板塊Agk個成員,則板塊中最大可能關系數為gkgk-1),整體網絡共有g個行動者,因此,板塊A成員在整體網絡中最大可能的關系數為gkg-1),化簡后為(gk-1)/(g-1)。位置內部實際的關系比例為板塊Bk實際發生的關系數與板塊Bk實際主動發生關系數的比值。當內部實際存在的關系數要大于期望值時,說明內部關系較多,板塊較為活躍,板塊整體結構較為穩定,主要考察的是板塊內部在整體網絡中的受溢程度。同時,觀察板塊與其他板塊之間的關系時,主要考慮板塊與外部的關系是溢出還是受溢,接收到的關系數較少,比例趨近0時,代表板塊溢出作用大于受溢作用,有雙向溢出板塊、主溢出板塊兩種。反之,接收外部關系較多,受溢作用大于溢出作用,板塊表現為整體受溢,為主受溢板塊、經紀人板塊兩種,具體如表2-1所示。

表2-1 塊模型位置分類

七 旅游流集聚指數

旅游流集聚指數是指一定區域內旅游目的地對所有客源地旅游流的集聚強度,計算公式如式(2-16)所示。

式(2-16)中,Xji是由j市(州)居民搜索i市(州)景區的網絡關注度,即由j市(州)向i市(州)集聚的游客數量。Xi為其他市(州)向i市(州)集聚的總網絡關注度,即i市(州)接待的游客總量。ni市(州)接收游客集聚的市(州)數量。Ggi越大,說明旅游流向i市(州)集聚的區域越集中,不利于i市(州)旅游客源的均衡發展;Ggi越小,表明旅游流向i市(州)集聚的市(州)就越分散,利于i市(州)旅游客源的均衡發展。

八 旅游流擴散指數

旅游流擴散指數是指一定區域內旅游客源地對所有目的地旅游流的擴散強度,計算公式如式(2-17)所示。

式(2-17)中,Xij是由i市(州)搜索j市(州)景區的網絡關注度,即由i市(州)向j市(州)擴散的游客數量。Xii市(州)向其他市(州)擴散的總網絡關注度,即i市(州)擴散的游客總量。n為接收i市(州)游客擴散的市(州)數量。Gdi越大,說明i市(州)旅游流擴散的區域越集中,不利于i市(州)旅游目的地的均衡發展;Gdi越小,表明i市(州)旅游流擴散的區域就越分散化,利于i市(州)旅游目的地的均衡發展。

九 旅游需求偏好系數

國內外關于旅游偏好的定量分析方法有多種,其中,孫根年(2001)提出的旅游偏好系數簡單易行,能較為直觀地反映游客對某景區的偏好程度,本書借鑒該方法分析居民對旅游景區的旅游需求偏好,計算公式如式(2-18)所示。

式(2-18)中,βj是某地居民對于j景區的偏好系數,Χj是某地居民對于j景區的旅游需求(網絡關注度),為某地居民對所有景區旅游需求(網絡關注度)的總值。βj值在0—1,值越大說明對某景區的需求偏好越強。

十 內容分析法

(一)內容分析法概述

第二次世界大戰期間,內容分析成為一種正式的研究方法,歷經多年的發展演化,產生了不同的定義和理解。國外,Berelson(1952)、Kirppendofr(1980)對內容分析法的概念界定比較權威。前者認為“內容分析法是客觀、系統并量化地描述顯性傳播內容的一種研究方法?!痹摳拍畋灰米疃啵瑥娬{了“客觀”“系統”,并認為內容分析法是描述“顯性”內容的,而且是一個“量化”的過程。后者則認為“內容分析是一種從文本(或者其他意義體)到它們使用環境進行可重復、有效推論的研究方法。”該概念強調了“可重復”“有效”,內容分析法應當兼具內在和外在的效度,結論具有可推廣性。朱峰(2006)認為,內容分析法是一種將不系統的、定性的、符號性的內容,如文字、圖像等轉化成系統的、定量的數據資料的研究方法,該概念強調了研究數據在分析前和分析后的屬性,由“不系統”到“系統”,由“定性”到“定量”。范向麗(2010)認為,內容分析法不僅能厘清或歸納文獻中本質性的事實與規律,還可以對文獻所含有的隱性信息內容進行揭示,預測事物發展趨勢。盡管不同學者的定義不盡相同,但大部分學者基本認同內容分析法具有“客觀性”,是一個“系統化”的過程,是一種“定性和定量相結合”的研究方法。綜合以上觀點,本書將內容分析法定義為一種將雜亂無序的資料內容進行客觀描述、系統化并將其量化的一種研究方法,將資料內容由表征含義演化成為準確意義的過程,是一個層層遞進的過程。

內容分析法的主要特點:一是客觀性,內容分析法的研究對象不是有意識、思想的人,研究資料一般是客觀的傳播資料,不受主觀影響。二是可重復性,一般認為,在內容分析法中評判標準、類目、分析元素確定之后,其他過程都認定為客觀、可重復。三是定性與定量相結合,內容分析法是將定性的傳播內容描述量化的過程,并運用統計方法進行分析。同時,內容分析法存在以下缺點:一是一般只適用于明確、顯性的內容分析,而對隱含的意識/價值等信息不易識別,但是,實際執行過程中隱性內容可以顯性化,但必須操作定義。二是過程煩瑣,因為涉及大量的定性內容,使編碼過程十分復雜。三是容易出現誤差,特別是人工編碼,容易出現編碼的主觀錯誤。

(二)內容分析法分析過程

如表2-2所示,李本乾(2000)、黃靜(2005)、盧小麗(2006)、張安民(2008)、范向麗(2010)、孫小培(2011)、朱明芳(2015)等學者基于不同角度/研究對象采用了略有差異的內容分析流程。產生差異的原因可能是隱含了一些步驟沒有完整列出,但實際有實施,其基本流程大同小異。內容分析法的基本流程如圖2-1所示,主要步驟是確定分析目標和范圍、抽樣、收集數據、確定分析要素、建立分析類目、編碼計劃、統計數據、分析匯總。

表2-2 內容分析法基本流程

續表

圖2-1 基于不同角度/研究對象的內容分析法步驟

本書根據內容分析法的基本流程,參考前人的相關做法,結合游客旅游信息需求這個研究對象,充分考慮研究資料提問文本的特殊性,采用樣本選擇及抽樣、類目構建、樣本整理和分解、編碼、信度分析、統計數據、匯總分析共7個步驟,具體如圖2-2所示。

圖2-2 基于游客提問文本的內容分析流程

(三)主要工具

1.八爪魚數據采集軟件

八爪魚數據采集軟件在本書中的主要功能是提取網頁中的提問文本。八爪魚數據采集軟件是由深圳視界信息技術有限公司研發的一款業界領先的網頁數據采集軟件,通過配置數據采集規則可以實現單網頁數據采集、列表或表格數據采集、列表及詳情數據采集、URL列表數據采集。具有使用簡單、程序自動化等特點。攜程網和馬蜂窩問答模塊中提問文本羅列結構相似,是重復的列表及詳情數據。在本書中,需要采集的是問答列表中的提問標題及提問內容,即提問文本,工作流程如圖2-3所示。

圖2-3 八爪魚數據采集過程

本書使用八爪魚數據采集軟件進行網頁數據采集。首先打開數據所在頁面,確定頁面中所需要提取的數據,在軟件中打開需要采集數據的網頁,然后根據該軟件規則編寫的程序化流程編寫數據采集規則,最后運行該規則即可獲得網頁可以顯示的所有與主題相關的提問文本,導出即可。該軟件可以自動識別重復的提問文本,不導出重復的提問文本。

2.詞頻統計工具ROSTCM6

ROSTCM6,是一款由武漢大學沈陽教授帶領的“ROST虛擬學習團隊”研發編碼的國內用以輔助人文社會科學研究的大型免費社會計算平臺。該軟件集多功能于一體,具有微博分析、全網分析、聊天分析等功能模塊,以及中文分詞、詞頻統計、英文詞頻統計、社會網絡與語義網絡分析等功能性分析。具有界面簡潔、操作簡便、可行性高,一般人員即可以操作的特點。本書利用該軟件進行特征詞詞頻分析,其工作基本流程如圖2-4所示。

圖2-4 詞頻統計過程

主站蜘蛛池模板: 奉化市| 津南区| 民勤县| 贡嘎县| 九江市| 西宁市| 会昌县| 兴海县| 大埔区| 辽阳县| 米易县| 明星| 玛纳斯县| 余姚市| 长白| 阿拉尔市| 双辽市| 灵丘县| 永靖县| 宜兰市| 手游| 南宫市| 乌鲁木齐县| 迁安市| 通化县| 壶关县| 宁陕县| 贵溪市| 禄丰县| 陆河县| 张家港市| 龙川县| 交口县| 枝江市| 溧水县| 湖州市| 芮城县| 江陵县| 玉龙| 枣阳市| 盐津县|