官术网_书友最值得收藏!

1.2.2 國內的大模型

國內大模型正在經歷從“百模大戰”轉向“主要玩家凸顯”階段。據統計,2023年我國累計發布200余個大模型,主要包括訊飛星火、文心一言、通義千問、清華GLM、智譜清言,以及字節豆包、騰訊混元、華為盤古、月之暗面的kimi等。本節不會介紹全部大模型,讀者可自行了解。

1.訊飛星火

2023年5月6日,科大訊飛發布訊飛星火大模型,經過持續迭代,先后推出V1.5、V2.0、V3.5、V4.0版本。訊飛星火大模型擁有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執行任務。它能夠利用海量數據和大規模知識持續進化,實現從提出、規劃到解決問題的全流程閉環。

訊飛星火大模型擁有七大能力(見圖1-4),包括多風格多任務長文本生成能力、多層次跨語種語言理解能力、泛領域開放式知識問答能力、情景式思維鏈邏輯推理能力、多題型步驟級數學能力、多功能多語言代碼能力、多模態輸入和表達能力。其中,語言理解、數學能力超越GPT-4 Turbo,代碼能力達到GPT-4 Turbo的96%,多模態能力達到GPT-4V的91%。星火語伴、智慧教育、星火App、訊飛曉醫、星火教師助手、訊飛智作、智能編程助手iFlyCode、星火科研助手等AI應用,加速了行業產品的創新。

圖1-4 訊飛星火七大能力及行業產品創新示例

2.文心一言

2023年3月,百度新一代大模型文心一言(ERNIEBot)正式啟動邀測。2023年8月,文心一言向全社會全面開放。文心一言是在ERNIE及PLATO系列模型的基礎上研發的新一代知識增強大模型,多輪對話表現出色,能夠與人對話互動、回答問題、協助創作,高效便捷地幫助人們獲取信息、知識和靈感。

文心一言對數萬億數據和數千億條知識進行融合學習,得到預訓練大模型,在此基礎上利用有監督微調(SFT)、RLHF、提示工程等技術,具備了知識增強、檢索增強和對話增強的優勢。文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等使用場景中具有強大的綜合能力。

2023年10月17日,百度發布文心大模型4.0,實現了基礎模型的全面升級,它在理解、生成、邏輯和記憶能力上都有顯著的提升,據悉綜合能力“與GPT-4相比毫不遜色”。

3.通義千問

2023年4月,阿里推出通義千問大模型;2023年10月,阿里發布千億級參數大模型通義千問2.0,在性能上取得巨大飛躍。

通義千問2.0在復雜指令理解、文學創作、通用數學、知識記憶、幻覺抵御等能力上均有顯著提升。通義千問2.0在指令遵循、工具使用、精細化創作等方面進行了技術優化,能夠更好地被下游應用場景集成。通義千問大模型官網上線了多模態和插件功能,支持圖片輸入、文檔解析等細分任務。用戶可以在官網上直接體驗模型功能,開發者可以通過網頁嵌入、API/SDK調用等方式,將模型能力集成到自己的大模型應用和服務中。

2024年5月,阿里云發布通義千問2.5版本,該版本在理解能力、邏輯能力、指令遵循和代碼能力方面有了顯著提升,經過權威基準OpenCompass評測,該模型的中文性能(比如文本理解、文本生成、知識問答等),全面趕超GPT-4 Turbo。

阿里云已與60多個行業頭部企業進行深度合作,推動通義千問在辦公、文旅、電力、政務、醫保、交通、制造、金融、軟件開發等領域的落地。

4.清華GLM

2022年5月,清華大學發布大模型GLM。GLM采用了wudao2.0中文語料,以及Wikipedia、BookCorpus等13GB英文語料。主要創新點是提出了自回歸空白填充(Autoregressive Blank Infilling)的自監督訓練方式,通過調整空白塊的大小,GLM既可像Encoder-only模型一樣執行文本分類等NLU任務,也可以像Decoder-only模型一樣執行文本生成等NLG任務,還可以像Seq-to-Seq模型一樣執行對話、機器翻譯等條件NLG任務,通過一個預訓練任務實現了預訓練模型三個結構的統一。

ChatGLM-6B是基于GLM架構的一個開源的、支持中英雙語的對話語言模型,具有62億個參數。結合模型量化技術,用戶可以在消費級的顯卡上進行本地部署(INT4量化級別下最低只需6GB顯存)。

ChatGLM-6B使用了和ChatGPT相似的技術,針對中文問答和對話進行了優化。經過約1T個標識符的中英雙語訓練,輔以監督微調、反饋自助、RLHF等技術,62億個參數的ChatGLM-6B已經能生成相當符合人類偏好的回答。

5.智譜清言

2023年8月,北京智譜華章科技有限公司發布“智譜清言”。智譜清言已具備“通用問答、多輪對話、創意寫作、代碼生成以及虛擬對話”等功能,未來還將開放多模態等生成能力。

智譜清言是基于智譜AI自主研發的中英雙語對話模型ChatGLM2,經過萬億字符的文本與代碼預訓練,并采用SFT技術,以通用對話的形式為用戶提供智能化服務。

主站蜘蛛池模板: 玛沁县| 怀宁县| 大姚县| 赞皇县| 柘荣县| 兴义市| 唐海县| 洛川县| 呼和浩特市| 邵阳市| 兴隆县| 建德市| 财经| 木里| 潞西市| 邵阳县| 禄劝| 平果县| 瑞金市| 佛教| 西畴县| 临邑县| 轮台县| 隆昌县| 安徽省| 永仁县| 利辛县| 鹿邑县| 英吉沙县| 兴国县| 苗栗市| 新宁县| 尼玛县| 土默特左旗| 扶风县| 正阳县| 华坪县| 武穴市| 崇礼县| 喀喇沁旗| 太和县|