- 深入淺出Python數據分析
- 張維元編著
- 453字
- 2023-09-15 17:12:19
1.2.1 定義數據項目
數據項目的核心在于數據。要解決好問題,相關人員必然要先了解有哪些常見的方法與技術可以應用在數據分析上。下面我們先來快速了解一下數據分析模型。
根據要解決的目標,數據分析模型可分成3種類型:監督式學習、非監督學習與半監督學習(Semi-Supervised Learning)。監督式學習指的是數據有一個明確的欄位,用來做預測或分類的目標變量。例如,人們可以利用過去的天氣數據,包含“有沒有下雨”這個欄位,來預測明天“會不會下雨”。此時,就可以稱“下雨與否”為目標變量或統計學上的反應變量。簡單來說,就是從過去數據中的其他欄位,找出與“有沒有下雨”這個欄位之間的關系,并將其關系套用到一組未知數據“會不會下雨”的其他欄位中,得出“會不會下雨”的預測值。以上這個例子也是監督式學習的典型案例。監督式學習可以想象成根據目標找關系,有一個明確學習的欄位,因此被稱為監督式學習。
數據驅動(Data Driven)的方法論是數據分析的一個概念。對于初學者而言,可以先聚焦在特定的問題上討論,再在一個最小可解上進行優化;當熟悉各種方法論之后,再試著進行更泛化的數據驅動。
推薦閱讀
- Getting Started with Gulp(Second Edition)
- ASP.NET MVC4框架揭秘
- C語言程序設計(第2 版)
- Python量化投資指南:基礎、數據與實戰
- Angular UI Development with PrimeNG
- SQL語言從入門到精通
- Quarkus實踐指南:構建新一代的Kubernetes原生Java微服務
- Securing WebLogic Server 12c
- D3.js 4.x Data Visualization(Third Edition)
- Haxe Game Development Essentials
- Statistical Application Development with R and Python(Second Edition)
- Visual Studio Code 權威指南
- Raspberry Pi Robotic Projects(Third Edition)
- Mastering Leap Motion
- Monitoring Docker