當(dāng)前位置：首頁 > 新聞資訊 > 行業(yè)動態(tài) > 語言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識密度增強(qiáng)和強(qiáng)化學(xué)習(xí)等

語言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識密度增強(qiáng)和強(qiáng)化學(xué)習(xí)等

來源：中國信息通信研究院編輯：創(chuàng)澤時間：2024/12/13 主題：其他 [加盟]

OpenAI 等基于大量工程實驗和反復(fù)驗證提出縮放定律，揭示了模型能力與計算能力、參數(shù)量和數(shù)據(jù)量間的定量關(guān)系，業(yè)界也遵循該定律指導(dǎo)資源要素投入、推動模型創(chuàng)新發(fā)展，近年來在模型技術(shù)能力、通用泛化水平等方面取得一系列突破性進(jìn)展。目前，大模型支持模態(tài)已逐步從自然語言處理拓展到多模態(tài)理解和生成等場景。

從 2023 年至今的基準(zhǔn)測試結(jié)果來看，全球大模型能力已經(jīng)出現(xiàn) 階躍式提升。語言大模型能力提升主要體現(xiàn)為以下四方面。

一是上下文窗口長度擴(kuò)展，提升全局能力。大模型的上下文窗口長度是指模型在執(zhí)行文本生成任務(wù)時，能夠處理的前置文本的數(shù)量或長度，決定了模型對信息的理解深度和廣度，對于理解和生成連貫、一致且準(zhǔn)確的文本具有重要意義。當(dāng)前，國內(nèi)外主流大語言模型均具備 128k 以上的上下文長度處理能力，可一次性處理數(shù)十萬單詞或漢字。

二是知識密度增強(qiáng)，儲存更多知識。隨著數(shù)據(jù)、算力、算法協(xié)同發(fā) 展，大模型知識密度持續(xù)增強(qiáng)，平均每 8 個月翻一番。2020 年 6 月發(fā)布的 GPT-3 大模型有 1750 億個參數(shù)，2024 年 2 月面壁智能發(fā)布 MiniCPM-2.4B 模型在實現(xiàn)同等性能的同時，參數(shù)規(guī)模降至 24 億，相當(dāng)于知識密度提高了約 86 倍。

三是 MoE 混合專家架構(gòu)能夠容納更多知識，精準(zhǔn)刻畫任務(wù)。MoE 稀疏激活多個專家子模型支路，加權(quán) 融合多個子模型結(jié)果，實現(xiàn)更加準(zhǔn)確的輸出，提高推理計算效率。目前，谷歌的 Gemini-1.5 Pro、Mistral AI 的 8x7B 與 8x22B、阿里云 Qwen-1.5 MoE、階躍星辰 Step-2 等頭部大模型均采用 MoE 架構(gòu)，已成為當(dāng) 前大模型的重要演進(jìn) 趨勢。

四是通過強(qiáng)化學(xué)習(xí) （Reinforcement Learning，RL）將思維鏈（Chain of Thought，CoT）內(nèi)化進(jìn)模型，提升復(fù)雜推理能力。2024 年 9 月 OpenAI 發(fā)布的 o1 系列模型在后訓(xùn)練（Post-Training）階段采用強(qiáng)化學(xué)習(xí)和思維鏈的技術(shù)方案，不僅在“慢思考”后回答復(fù)雜問題的表現(xiàn)優(yōu)異（尤其是在 STEM 領(lǐng)域的推理能力顯著增強(qiáng)），還具有了自我反思與錯誤修正能力，使自博弈強(qiáng)化學(xué)習(xí)有望成為提升語言大模型邏輯推理能力的技術(shù)新范式。

农村AV网站在线播放_2020国产免费看_狠狠综合亚洲综合亚洲色_a级av免费观看在线

語言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識密度增強(qiáng)和強(qiáng)化學(xué)習(xí)等

人工智能產(chǎn)業(yè)穩(wěn)中有進(jìn)迎來新動能:規(guī)模6233 億,增長21.5%

人工智能工程化邁向新階段:應(yīng)用工具鏈拓展大模型應(yīng)用廣度

人工智能技術(shù)演進(jìn)走向新范式：單任務(wù)智能到多任務(wù)智能

人工智能發(fā)展報告 (2024 年):技術(shù)創(chuàng)新方向,產(chǎn)業(yè)升級重點,行業(yè)落地趨勢和安全治理進(jìn)展,展望人工智能發(fā)展機(jī)遇

全球人形機(jī)器人產(chǎn)品數(shù)據(jù)庫(2024 年)：智元機(jī)器人均勝集團(tuán) 帕西尼感知科技追覓科技星動紀(jì)元

2024全球人形機(jī)器人企業(yè)畫像與能力評估報告：企業(yè)總計超150家,任務(wù)級能力占40%,技能級能力占60%

人本智能的產(chǎn)業(yè)實踐:經(jīng)歷了三個階段，原則爆發(fā),共識尋求,倫理實踐

人本智能的內(nèi)涵和原則：三個維度的升級,四個發(fā)展原則

構(gòu)建新型“三線”人機(jī)關(guān)系:人機(jī)協(xié)作,人機(jī)共生,人在機(jī)器之上是底線

新一輪AI下的人機(jī)關(guān)系:人類社會治理和倫理中的AI

新一輪AI下的人機(jī)關(guān)系:人類生產(chǎn)中的AI

新一輪AI下的人機(jī)關(guān)系:人類情感世界中的AI

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人底盤

語言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識密度增強(qiáng)和強(qiáng)化學(xué)習(xí)等

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人底盤

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)