官术网_书友最值得收藏!

1.2.3 使用大模型為工作提效

吳老師:隨著科技的發展,“模型”在AI系統中的地位呈日益上升的趨勢(見圖1-11)。你看,從最初依賴規則和搜索算法的AI,到如今生成式AI的廣泛應用,背后的核心就是復雜的深度學習模型。2020年,OpenAI發布了GPT-3,這是一項標志性成果。隨著GPT-3到GPT-4o的迭代,包括擴散模型在內,AI的能力和應用場景得到了極大擴展。生成式AI能生成文本、圖像、音頻等各種形式的內容,不僅豐富了AI的應用,也讓模型在AI系統中所占的比重變得越來越大。

圖1-11

小紅:AI的發展真的好快啊。

吳老師:是的。世界正在全面擁抱AI,很多大公司已搶先布局。比如Meta,2021年9月,Meta股價暴跌75%,很多人認為是元宇宙不成功,但根本原因是廣告業務下滑,而廣告占到了Meta營收的99%。于是Meta開始在AI上布局,之后,股價在兩年內翻了4倍,僅次于英偉達,遠超蘋果、谷歌、特斯拉和微軟。

小紅:竟然能有這么大的提升,Meta具體是怎么利用AI的呢?

吳老師:當時,蘋果的隱私政策升級,80%的用戶拒絕跨應用數據追蹤,導致Meta難以獲取用戶行為數據,廣告精準度下降。Meta隨即調整策略,專注分析用戶在自己平臺上的行為數據,比如瀏覽內容、停留時長、點贊和評論,借此優化廣告推送。他們在AI上投入巨資,僅英偉達H100顯卡就買了60萬塊。Meta的廣告系統Advantage+非常智能,廣告主只需提供產品信息和預算,系統就會自動分析受眾、匹配素材并分配預算,大幅提高了投放效率。AI不僅恢復了Meta廣告的ROI(Return on Investment,投資回報率),還能幫助廣告主更好地理解用戶行為,提升用戶體驗和留存率。此外,Meta還開源了大模型Llama,增強了他們在AI領域的影響力。

小紅:感覺AI還提升了用戶體驗呢。

吳老師:是的。說完Meta,再來聊聊蘋果。2024年2月,蘋果公司做了一個重大的戰略調整,決定放棄他們的電動汽車項目,轉而大力投資AI。這個消息一出來,蘋果的股價就上漲了超過1%。

這是一次戰略調整,表明蘋果看到了AI的巨大潛力。數據分析師預測,AI功能會縮短設備更換周期,因為更多人想體驗新推出的智能功能。特別是蘋果推出的Apple Intelligence體系,它能跨iPhone、iPad和Mac平臺,提升語言和圖像處理能力。在2024年全球開發者大會上,蘋果展示了如何利用自家芯片來支持這些功能。

小紅:聽了Meta和蘋果的例子,我感到世界在擁抱AI,我們數據分析師也要使用AI產品為工作提能增效。

吳老師:對我們來說,目前重要的是能用GPT這個工具提升生產效率,并解決工作中的實際問題。了解GPT能做什么、不能做什么,我們在使用大模型的過程中就會有的放矢,也知道哪里應該自己思考,哪里用大模型來提高效率。GPT如何幫數據分析師?我們直接來問一問。

提問:

如何使用GPT為數據分析工作賦能?

對于數據分析工作,GPT可以如下方式賦能。

(1)數據分析指導:為數據分析師提供理論指導、技術指導和最佳實踐建議,幫助他們更有效地進行數據處理和分析。

(2)編程和腳本撰寫:輔助數據分析師編寫和調試用于數據處理和分析的腳本,使用Python、R 語言等常用于數據分析的編程語言。

(3)數據可視化建議:提供數據可視化的創意和建議,幫助數據分析師選擇最合適的圖表類型,以有效地展示數據。

(4)報告撰寫輔助:幫助數據分析師撰寫分析報告,提供清晰的結構和表達方式,使報告更加專業和易于理解。

(5)學習和發展:為數據分析師提供最新的數據分析工具、技術和行業動態,幫助他們不斷學習和進步。

通過這些方式,GPT 不僅可以提高數據分析的效率和質量,還可以幫助數據分析師更好地發揮創造力,做出更加明智的決策。

小紅:能做這么多事情呢。能給我編寫代碼、幫助我寫報告,還能指導我的學習發展。

吳老師笑笑:GPT的功能遠不止于此,它不僅能幫助你完成工作中的具體任務,還能為你提供方向性的建議和指導。對于任何具體問題,你都可以向它尋求幫助和解答。

小紅一笑:我現在花時間最多的就是寫代碼,先讓它算個留存率。

提問:

有一張訂單全量表order_base,字段信息包括order_date(訂單日期)、order_id(訂單id)、user_id(用戶id)。計算新增用戶的次日留存率,腳本如何寫?說明:(1)新增用戶:當日為其首次下單日期。(2)次日留存率:第一天有訂單的用戶中,第二天依舊有訂單的用戶的占比。

為了計算新增用戶的次日留存率,我們可以使用以下SQL腳本:

WITH FirstOrder AS (
    -- 計算每個用戶的首次下單日期
    SELECT user_id, MIN(order_date) AS first_order_date
    FROM order_base
    GROUP BY user_id
),
Retention AS (
    -- 計算次日留存的用戶數
    SELECT
        a.user_id,
        a.first_order_date,
        CASE
            WHEN b.order_date IS NOT NULL THEN 1
            ELSE 0
        END AS retained_next_day
    FROM FirstOrder a
    LEFT JOIN order_base b
    ON a.user_id = b.user_id
    AND DATE_ADD(a.first_order_date, INTERVAL 1 DAY) = b.order_date
)
-- 計算次日留存率
SELECT
    first_order_date,
    COUNT(user_id) AS total_new_users,
    SUM(retained_next_day) AS retained_users,
    SUM(retained_next_day) / COUNT(user_id) AS next_day_retention_rate
FROM Retention
GROUP BY first_order_date
ORDER BY first_order_date;

這個腳本的邏輯如下。

(1)FirstOrder子查詢:計算每個用戶的首次下單日期。

(2)Retention子查詢:對于每個新增用戶,檢查其是否在首次下單的次日也有訂單。如果有,則retained_next_day為1,否則為0。

(3)對于每個首次下單日期,計算總的新增用戶數、次日留存的用戶數和次日留存率。

請注意,這個腳本假設order_date字段是日期類型。如果order_date是日期時間類型,你可能需要使用日期函數(如DATE())來確保只比較日期部分。

小紅瞪大了眼睛:真是太驚艷了!不但能識別出來要寫腳本解決這個問題,而且每一段代碼都有解釋。我感覺找到了一個全能的伙伴,大大提升了工作效率。

主站蜘蛛池模板: 门头沟区| 双峰县| 堆龙德庆县| 将乐县| 自贡市| 秦皇岛市| 峡江县| 丽江市| 嘉鱼县| 辛集市| 东安县| 淳安县| 晴隆县| 陆河县| 邢台县| 惠来县| 贡嘎县| 兴文县| 报价| 新化县| 景东| 永登县| 上犹县| 铅山县| 镶黄旗| 邹城市| 巴彦县| 喀什市| 四平市| 信阳市| 错那县| 岫岩| 岗巴县| 邻水| 武汉市| 日土县| 农安县| 汝阳县| 灵武市| 奉新县| 静宁县|