- 聯(lián)邦學(xué)習(xí)實(shí)戰(zhàn)
- 楊強(qiáng)等
- 464字
- 2021-05-19 18:07:05
5.2 邏輯回歸
根據(jù)上一節(jié)對(duì)數(shù)據(jù)集的描述,可知本章的實(shí)驗(yàn)是一個(gè)二分類(lèi)的模型訓(xùn)練,即對(duì)乳腺癌數(shù)據(jù)集中惡性腫瘤M(1)和良性腫瘤B(0)的分類(lèi)。邏輯回歸(Logistic Regression)是當(dāng)前最常用的二分類(lèi)模型,屬于廣義線性模型(Generalized Linear Model)家族,因其模型簡(jiǎn)單且效果較好被廣泛使用。本章采用邏輯回歸作為實(shí)驗(yàn)?zāi)P汀?/p>
我們先簡(jiǎn)要回顧線性回歸的定義。線性回歸模型是通過(guò)對(duì)特征值x=(x1,x2,· · ·,xn)進(jìn)行線性組合來(lái)預(yù)測(cè)標(biāo)簽值y,即滿(mǎn)足:

通常使用向量的形式簡(jiǎn)化表示為

其中W=(w1;w2;· · ·;wn),X=(x1,x2,· · ·,xn)。
利用式(5.2)得到的y值是一個(gè)連續(xù)值,而二元分類(lèi)的輸出是一個(gè)只包含0和1的離散值,為此,我們可以在式(5.2)連續(xù)值輸出的基礎(chǔ)上,再進(jìn)行非線性的映射,即尋找一個(gè)可微的非線性函數(shù)f將離散標(biāo)簽值y與線性回歸的預(yù)測(cè)連續(xù)值聯(lián)系起來(lái):

在邏輯回歸中,我們使用邏輯斯蒂函數(shù)來(lái)充當(dāng)這個(gè)非線性映射的角色,邏輯斯蒂函數(shù)的表示形式為

其函數(shù)圖像如圖5-2所示。

圖5-2 邏輯斯蒂函數(shù)
可以看出,利用邏輯回歸進(jìn)行分類(lèi)預(yù)測(cè)時(shí),當(dāng)線性回歸預(yù)測(cè)值WT+b≥0時(shí),則判斷為正例,輸出為1;否則,判斷為負(fù)例,輸出0。
- 機(jī)器學(xué)習(xí)的算法分析和實(shí)踐
- 成為提問(wèn)工程師
- 互聯(lián)網(wǎng)下半場(chǎng)
- 不會(huì)被機(jī)器替代的人:智能時(shí)代的生存策略
- AI時(shí)代程序員開(kāi)發(fā)之道:ChatGPT讓程序員插上翅膀
- 玩轉(zhuǎn)ChatGPT:秒變AI提問(wèn)和追問(wèn)高手
- 機(jī)器學(xué)習(xí)實(shí)戰(zhàn):模型構(gòu)建與應(yīng)用
- 智能化社會(huì):未來(lái)人們?nèi)绾紊睢⑾鄲?ài)和思考
- 深度學(xué)習(xí)
- 洞見(jiàn)未來(lái)的“元宇宙”世界(套裝8冊(cè))
- 不止DeepSeek!:職場(chǎng)AI效率提升一本通
- AI:人工智能的本質(zhì)與未來(lái)
- 中國(guó)人工智能創(chuàng)新鏈產(chǎn)業(yè)鏈技術(shù)專(zhuān)利發(fā)展研究
- 計(jì)算機(jī)應(yīng)用與數(shù)據(jù)分析+人工智能
- 如何創(chuàng)造可信的AI