3月11日,度小滿宣布“軒轅”系列金融大模型新增開源6B、13B、70B三種參數12款金融大模型。這12款大模型具有“以小博大”的實力,在用戶信息分析、業務數據洞察等十余種金融實際任務評測中,達到自身2倍甚至5倍參數量的模型水平。
三種參數的基座模型、對話模型、int4量化模型、int8量化模型完全開源,開發者可在GitHub、HuggingFace、Model Scope等開源社區內下載使用。
在“軒轅”模型矩陣中,70B及以上模型適合針對需要深度分析、復雜指令執行以及全方位Agent調用的場景,而6B、13B的模型則更加適用于對響應速度有高要求、面向小規模場景和單任務的應用。”軒轅”6B-4-bit量化Chat模型則以其低推理部署成本,進一步降低大模型的應用門檻。
專注中文金融領域任務FinanceIQ大模型金融自動評測集顯示,在注冊會計師(CPA)、銀行從業資格、基金從業資格、證券從業資格等多項金融領域考試中,“軒轅”展示出金融領域專家的水平。
(“軒轅”系列大模型擁有遠超同參數水平的金融能力)
“軒轅”系列大模型在訓練方式上進行了多項創新,例如將人類偏好對齊技術引入了金融大模型訓練。通常多數垂類大模型僅在微調階段引入特定領域數據,但這種方法在實際應用中常常顯示出局限性,金融行業的復雜性要求模型能夠更深入地理解并適應行業特定的需求。為此,度小滿構建了涵蓋通用性、安全性和金融特性的Prompt數據集,并組織了專業的標注團隊對成對的回答進行偏好標注,從而收集到了一批高質量、廣覆蓋的偏好數據,并通過一系列實踐、分析和改進成功完成了獎勵模型和后續的強化訓練。
度小滿在2023年5月開源國內首個千億級中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU兩大權威榜單上位列所有開源模型榜首。本次度小滿“軒轅”模型矩陣再次升級,十億-百億-千億參數全覆蓋,實現多場景任務適配。
業內普遍認為,金融大模型的價值體現在其能否在核心業務場景中發揮實際作用,如通過綜合分析用戶信息以支持風險評估、刻畫客戶畫像等。目前”軒轅”金融大模型已經應用在度小滿各個業務場景,從營銷、客服、風控、辦公再到研發,已經初見成效。在代碼助手方面,用大模型輔助生成的代碼,采納率能夠達到 42%,幫助公司整體研發效率提升了20%;在客服領域,大模型推動服務效率提升了 25%。
“軒轅”大模型Github下載地址:https://github.com/Duxiaoman-DI/XuanYuan
(CIS)
校對:祝甜婷
推薦閱讀: