官术网_书友最值得收藏!

第一節(jié) 浙江傳媒學(xué)院視頻監(jiān)測與分析系統(tǒng)

一 概況

“浙江傳媒學(xué)院視頻監(jiān)測與分析系統(tǒng)”是對娛樂視頻和明星進(jìn)行用戶態(tài)度測評的系統(tǒng)。自2016年6月開始監(jiān)測上星頻道黃金時間(19:30—22:30)播出的電視劇和綜藝節(jié)目;2017年1月開始監(jiān)測100位娛樂明星;2017年5月開始監(jiān)測主要院線上映的電影和6家主流視頻網(wǎng)站的網(wǎng)絡(luò)綜藝;2018年8月開始監(jiān)測5家主流視頻網(wǎng)站的網(wǎng)劇;2019年3月開始監(jiān)測愛奇藝、騰訊視頻、優(yōu)酷視頻3家視頻網(wǎng)站的網(wǎng)絡(luò)電影。

視頻監(jiān)測與分析系統(tǒng)的建設(shè)旨在服務(wù)于我校的課程教學(xué)和學(xué)術(shù)研究工作。系統(tǒng)的運(yùn)作分四步:

第一步:設(shè)置監(jiān)測對象。學(xué)生團(tuán)隊完成監(jiān)測對象的設(shè)置,同時錄入監(jiān)測對象的主要屬性。

第二步:自動采集數(shù)據(jù)。計算機(jī)自動收集與監(jiān)測對象相關(guān)的新聞、論壇、微博、彈幕、微信公眾號、視頻網(wǎng)站評價、豆瓣電影網(wǎng)站評論等信息,形成大數(shù)據(jù)。

第三步:褒貶值計算。利用語義分析技術(shù),計算出每一條新聞、論壇、微博、彈幕、微信公眾號、視頻網(wǎng)站評價的褒貶值,褒貶值設(shè)定在-5到+5。

第四步:數(shù)據(jù)輸出。根據(jù)收集和計算的數(shù)據(jù),系統(tǒng)生成結(jié)果。目前有三類輸出結(jié)果:一是統(tǒng)計圖表,二是原始數(shù)據(jù),三是月度匯總數(shù)據(jù),供進(jìn)一步分析使用。

二 功能

“浙江傳媒學(xué)院視頻監(jiān)測與分析系統(tǒng)”由熱點趨勢、褒貶分析、數(shù)據(jù)導(dǎo)出、監(jiān)測對象信息、后臺管理、月度匯總、在線褒貶打分七個功能模塊組成[1]

(一)熱點趨勢

熱點趨勢主要反映監(jiān)測對象的行為指標(biāo),包括熱點趨勢、傳播形態(tài)分布、相關(guān)熱詞、媒體關(guān)注分布等數(shù)據(jù)。例如,圖1-1是因新型冠狀病毒性肺炎春節(jié)檔院線電影改為網(wǎng)絡(luò)電影的《囧媽》2020年1月的熱點趨勢。系統(tǒng)可顯示最近24小時的前10個熱詞,并可以Excel數(shù)據(jù)文件格式導(dǎo)出具體數(shù)據(jù)。

圖1-1 網(wǎng)絡(luò)電影《囧媽》熱點趨勢(2020年2月9日截圖)

(二)褒貶分析

褒貶分析是系統(tǒng)最具特色的功能模塊,包括褒貶趨勢、褒貶總體分析等數(shù)據(jù)。圖1-2是明星李現(xiàn)2020年1月10日到2月8日的褒貶趨勢。

圖1-2 明星“李現(xiàn)”褒貶趨勢(2019年2月9日截圖)

(三)數(shù)據(jù)導(dǎo)出

數(shù)據(jù)導(dǎo)出可以靈活地查詢并導(dǎo)出原始數(shù)據(jù),本書的主要數(shù)據(jù)通過這一功能模塊獲取。圖1-3是以“三生三世枕上書”為關(guān)鍵詞,進(jìn)行條件設(shè)置,獲取的部分檢索結(jié)果。設(shè)置時間范圍從2020年1月9日到2月9日,獲取騰訊視頻網(wǎng)絡(luò)劇《三生三世枕上書》的微信數(shù)據(jù)有1423條,得出平均褒貶值為1.9097。

點擊標(biāo)題欄,可鏈接到相關(guān)網(wǎng)址,查看具體的評論內(nèi)容。點擊“導(dǎo)出Excel”,可以將這1423條數(shù)據(jù)以Excel數(shù)據(jù)文件的形式導(dǎo)出,包括了標(biāo)題、來源、褒貶值、發(fā)布日期(精確到秒)等內(nèi)容。點擊“按日期分組統(tǒng)計導(dǎo)出Excel”,能將按日統(tǒng)計各類數(shù)據(jù)條數(shù)和褒貶值導(dǎo)出為Excel數(shù)據(jù)文件。

圖1-3 數(shù)據(jù)導(dǎo)出檢索結(jié)果(2020年2月10日截圖)

數(shù)據(jù)導(dǎo)出的條件設(shè)置靈活,可以選擇不同的“來源類別”(新聞、論壇、微博、彈幕、微信、網(wǎng)站評論、豆瓣評論)、“態(tài)度”(正面、中性、負(fù)面)和“時間范圍”。數(shù)據(jù)導(dǎo)出可以多關(guān)鍵詞檢索,并能進(jìn)行簡單的邏輯運(yùn)算。例如,“A B”(AB之間為空格)表示“A”和“B”同時存在(和運(yùn)算),“A-B”表示有“A”但沒有“B”(非運(yùn)算),“A|B”表示有“A”或有“B”(或運(yùn)算)。需要特別注意的是,檢索的第一個關(guān)鍵詞需要通過后臺管理預(yù)先設(shè)定,否則監(jiān)測與檢索的結(jié)果將不完整。

多對象檢索是可以實現(xiàn)分對象評價,即對同一句、一段、一篇中的多個評價對象給出不同的評分。圖1-4是對湖南衛(wèi)視《聲臨其境》和主持人“周濤”的檢索結(jié)果,2020年1月有新聞數(shù)據(jù)52條,系統(tǒng)對評價對象《聲臨其境》和“周濤”計算出不同的褒貶值,分別為0.8656和1.4489。

圖1-4 多對象數(shù)據(jù)導(dǎo)出檢索結(jié)果(2020年2月10日截圖)

(四)后臺管理

后臺管理包括監(jiān)測對象設(shè)置、監(jiān)測對象屬性設(shè)置、褒貶詞庫管理、數(shù)據(jù)導(dǎo)出記錄等功能。此功能僅管理員有權(quán)限使用,一般用戶不能使用。監(jiān)測對象的設(shè)置是系統(tǒng)最基礎(chǔ)的操作,也是一項持續(xù)的工作。在系統(tǒng)中添加和設(shè)置監(jiān)測對象的信息,包括名稱、關(guān)鍵詞、類型、等級、監(jiān)控起始時間等。

圖1-5 被監(jiān)測對象的設(shè)置(2020年2月10日截圖)

系統(tǒng)允許同時設(shè)置多個關(guān)鍵詞,其邏輯運(yùn)算規(guī)則同數(shù)據(jù)導(dǎo)出模塊的設(shè)定。系統(tǒng)將監(jiān)測對象分為“一般”“重點”“研究”三個等級,所抓取的信息量隨等級依次增加。圖1-5是網(wǎng)絡(luò)綜藝《演技派(2019)》的監(jiān)測設(shè)置,系統(tǒng)將自動收集含有“演技派”的信息,監(jiān)測等級是“重點”,監(jiān)測日期自2020年1月6日至2月29日。

系統(tǒng)中的被監(jiān)測的關(guān)鍵詞庫可以進(jìn)行編輯,包括查詢、編輯、關(guān)閉、刪除、導(dǎo)出被監(jiān)測對象數(shù)據(jù)等功能。圖1-6顯示了監(jiān)測的關(guān)鍵詞列表。建議用戶將查詢和編輯功能結(jié)合使用,便于對重播和季播節(jié)目進(jìn)行監(jiān)測設(shè)置。操作方式是,在“關(guān)鍵詞”一欄輸入所需查詢的關(guān)鍵詞,點擊任意處,以前設(shè)置的關(guān)鍵詞,包括已關(guān)閉的和時間過期的關(guān)鍵詞就會顯示,可對其進(jìn)行編輯修改。

圖1-6 網(wǎng)絡(luò)劇監(jiān)測對象列表(2020年2月10日截圖)

在系統(tǒng)中可添加和設(shè)置監(jiān)測對象,包括名稱、關(guān)鍵詞、類型、等級、監(jiān)控起始時間等信息。例如圖1-5,對于重播和季播的節(jié)目不需重復(fù)設(shè)置,重新編輯其信息即可。點擊“導(dǎo)出Excel”可以定期(目前為每月一次)提供監(jiān)測對象清單,包括監(jiān)測對象的名稱、關(guān)鍵詞、監(jiān)測開始和結(jié)束時間、監(jiān)測等級、是否關(guān)閉等信息。

(五)監(jiān)測對象信息

監(jiān)測對象信息用于設(shè)置監(jiān)測對象屬性,包括播出平臺、制作機(jī)構(gòu)、主創(chuàng)人員、類型等。圖1-7是電視劇《上古密約》的信息設(shè)置。該模塊僅管理員有權(quán)限使用,一般用戶不能使用。

圖1-7 電視劇《上古密約》信息設(shè)置(2020年2月11日截圖)

點擊“導(dǎo)出Excel”可以定期(目前為每月一次)獲取監(jiān)測對象信息清單的Excel文件,包括監(jiān)測對象的名稱、關(guān)鍵詞、播出平臺、類型、主創(chuàng)人員名單、設(shè)置者等信息。重播和季播的節(jié)目不改變原來的信息,而是新增一條記錄。

(六)月度匯總

“月度匯總”模塊用于生成電視綜藝、電視劇、明星、電影、網(wǎng)絡(luò)綜藝、網(wǎng)劇等監(jiān)測對象類型的月度匯總數(shù)據(jù)的Excel文件。匯總的時間原則主要有三類:其一,對于月內(nèi)開始監(jiān)測,月內(nèi)未結(jié)束的監(jiān)測對象,統(tǒng)計監(jiān)測“開始時間”到當(dāng)月最后一天的數(shù)據(jù);其二,對于當(dāng)月以前開始監(jiān)測,當(dāng)月尚未結(jié)束監(jiān)測的對象,則統(tǒng)計當(dāng)月全月數(shù)據(jù);其三,對于當(dāng)月以前開始監(jiān)測,當(dāng)月結(jié)束監(jiān)測的對象,統(tǒng)計當(dāng)月1日到“結(jié)束日期”的數(shù)據(jù)。

表1-1是2019年監(jiān)測對象概況,“監(jiān)測”是每月系統(tǒng)監(jiān)測的對象數(shù)量,“有效”是每月有效監(jiān)測的對象數(shù)量。本團(tuán)隊規(guī)定了有效數(shù)據(jù)原則為:每天新聞、微博、論壇、彈幕、微信、視頻網(wǎng)站評論、豆瓣評論的信息量之和大于等于15條;或者每月新聞、微博、論壇、彈幕、微信、視頻網(wǎng)站評論豆瓣評分的數(shù)據(jù)量之和大于等于400條。2019年5月,電影、電視劇、電視綜藝、網(wǎng)劇、網(wǎng)綜、明星的“有效”標(biāo)準(zhǔn)調(diào)整為每天新聞、微博、論壇、微信、視頻網(wǎng)站評論、豆瓣評論的數(shù)據(jù)量之和大于等于10條;或者每月新聞、微博、論壇、微信、視頻網(wǎng)站評論豆瓣評分的數(shù)據(jù)量之和大于等于300條;網(wǎng)絡(luò)大電影為每天5條,或每月100條。4月份開始有效監(jiān)測不包括彈幕數(shù)據(jù),主要原因是系統(tǒng)無法獲取愛奇藝的彈幕數(shù)據(jù)。10月份開始有效監(jiān)測不包括微信數(shù)據(jù),原因是系統(tǒng)無法獲取微信公眾號的數(shù)據(jù)。

表1-1 2019年監(jiān)測對象和有效監(jiān)測對象數(shù)量

月度匯總的褒貶值為各條數(shù)據(jù)褒貶值的簡單算術(shù)平均數(shù)。研究者也可以進(jìn)一步設(shè)計各種權(quán)重,得出不同的綜合褒貶值。

(七)在線褒貶打分

在線褒貶打分是一個對非系統(tǒng)抓取的數(shù)據(jù)進(jìn)行語義分析的接口。有三個功能:一是研究者上傳需要評價的Excel數(shù)據(jù)文件,系統(tǒng)自動計算出文本的褒貶值。這是無對象測評,可以對褒貶值的計算結(jié)果進(jìn)一步分析。二是研究者提供一段文本,系統(tǒng)顯示分詞、褒貶詞、程度副詞、原始分值、不分對象評價的褒貶值等詳細(xì)信息。三是比較句分析,顯示比較對象與被比較對象不同的褒貶值。

三 主要特征

(一)定量評價

大數(shù)據(jù)時代背景下的專業(yè)性評價,是主觀現(xiàn)實與客觀現(xiàn)實交互的評價體系。我們應(yīng)用元評價意識——保持廣泛性、深刻性的數(shù)據(jù)收集和評價態(tài)度,建立專業(yè)性的評價標(biāo)準(zhǔn)。本團(tuán)隊開發(fā)的視頻監(jiān)測與分析系統(tǒng)基于詞、句和篇進(jìn)行語義分析,得出從正5到負(fù)5的褒貶值。系統(tǒng)建立娛樂視頻和明星的專業(yè)詞庫并及時更新,截至2020年3月,詞庫共有詞語22381個。詞語的詞性分為褒貶詞和程度詞。程度詞和褒貶詞均有正負(fù)之分,精確到小數(shù)點后1位。雙性褒貶詞和雙性程度詞是特殊詞匯,語義分析時選擇不同的值。圖1-8是詞語設(shè)定和維護(hù)的實例。

圖1-8 詞語設(shè)定和維護(hù)

(二)分對象評價

分對象評價是對同一句、一段、一篇中的多個評價對象給出不同的評分。評價對象是本系統(tǒng)所有的監(jiān)測對象,包括正在監(jiān)測和停止監(jiān)測的電影、電視劇、電視綜藝、網(wǎng)絡(luò)綜藝、網(wǎng)劇、明星、網(wǎng)絡(luò)電影。系統(tǒng)進(jìn)行語義分析時,評價對象作為一個詞,系統(tǒng)不再對其進(jìn)行分詞,也不予評分。具體的請參閱《中國影視產(chǎn)品網(wǎng)絡(luò)滿意度研究(2019)》第一章。

(三)比較句評價

一個句子中有兩個或兩個以上評價對象和一個及以上比較詞,界定為比較句。評價對象為所有監(jiān)測對象,含電影、電視劇、網(wǎng)劇、明星、電視綜藝、網(wǎng)絡(luò)綜藝、網(wǎng)絡(luò)大電影,包括停止監(jiān)測的對象。比較詞是判斷比較句的關(guān)鍵標(biāo)識。比較詞可以是多次詞,但比較句的比較詞之間沒有標(biāo)點符號。比較詞是作為一種特殊的褒貶詞,有褒貶值。

根據(jù)比較句的一般句型,分差比、等比兩大類,再分肯定和否定。相關(guān)規(guī)則通過句式和賦值規(guī)則表達(dá)。句式只列出比較句的必需成分,可以增加成分(程度副詞等);賦值規(guī)則中的褒貶詞值等于褒貶詞與程度副詞之值的乘積。具體的請參閱《中國影視產(chǎn)品網(wǎng)絡(luò)滿意度研究(2019)》第一章。

主站蜘蛛池模板: 望都县| 贡嘎县| 抚顺市| 瓦房店市| 南漳县| 桐梓县| 长武县| 西贡区| 邯郸县| 喀喇沁旗| 三门县| 集安市| 通道| 旬邑县| 平南县| 凤山县| 诸暨市| 周至县| 施甸县| 衡阳县| 双鸭山市| 鞍山市| 武威市| 蓝山县| 西藏| 天全县| 通海县| 慈溪市| 广汉市| 富川| 富锦市| 新郑市| 溆浦县| 高雄县| 铜鼓县| 娄底市| 名山县| 邳州市| 铜川市| 福安市| 肃北|