• 移動端
    訪問手機端
    官微
    訪問官微

    搜索
    取消
    溫馨提示:
    敬愛的用戶,您的瀏覽器版本過低,會導致頁面瀏覽異常,建議您升級瀏覽器版本或更換其他瀏覽器打開。

    大模型重塑金融業態報告②丨金融基礎設施再進化

    李覽青 楊夢雪 來源:21世紀經濟報道 2024-02-07 09:13:35 大模型 金融AI
    李覽青 楊夢雪     來源:21世紀經濟報道     2024-02-07 09:13:35

    核心提示大模型時代,金融機構已開始重塑基礎設施服務。

    摘要:“大模型”無疑是2023年最熱的關鍵詞之一,隨著大模型概念的崛起和廣泛傳播,金融行業因被視作最優落地場景也同步掀起了一輪熱潮。大模型究竟會給金融行業帶來什么?它會在何種程度上重塑技術和業務,會衍生出怎樣的商業價值?21世紀資管研究院調研了三十多家金融機構和科技公司相關負責人,形成了這份《大模型重塑金融業態報告》,通過梳理機構布局情況以及這些領軍者們的觀點,描繪行業發展趨勢。

    從電子化到數字化再到智能化,金融機構的基礎設施更迭,是其轉型發展最重要的環節之一。

    過去十年,金融基礎設施的改造集中于“上云”,實現了傳統“煙囪式”系統架構的平臺化,如今,大模型的到來也開啟AI原生時代,對金融機構基礎設施進化提出新要求。

    “大模型的發展路徑與云計算在諸多方面表現出很大的相似性,AI基礎模型至少在語言領域已經表現出很強的通用性,并且正在像云計算那樣成長為新型基礎設施?!敝袊磐ㄔ涸朴嬎闩c大數據研究所所長何寶宏在《數字原生》一書中如是說。

    大模型時代,數據、算力、算法共同構成金融機構搭建大模型的“三駕馬車”。GPT-3的勝利,一度被視作“暴力美學”的勝利,高達1750億的參數規模讓模型性能顯著提升,賦予其強大的智能,這就是大模型的能力“涌現”。

    但是數據、算力的暴力堆疊,沒有與模型的精確畫上等號,往往越大的模型在知識量到達一定階段可能出現“幻覺”問題。因此,在資源有限的背景下,金融機構面臨的問題是:如何提高算力的使用效率?如何挖掘可訓練的語料庫?

    大模型時代,金融機構已開始重塑基礎設施服務。

    AI原生時代降臨

    據21世紀資管研究院調研,從傳統IT的IOE架構到業務平移上云,頭部金融機構的“上云”進程已初步完成。特別是大型國有銀行與頭部股份制銀行,在完成以虛擬化為核心的云平臺1.0階段后,從2020年開始發力分布式架構的云平臺建設,招商銀行、平安銀行、中信銀行等已基本完成了傳統科技架構向云架構的轉換。

    2021、2022年是行業步入云原生的2.0階段。云原生源自于云計算,其構建和部署都基于云平臺,是一種構建、運行應用程序的技術方法。傳統的云計算服務包括基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)三大方面,在基礎設施、平臺、軟件都已實現上云后,下一步通過統一標準在云上構建應用,就是云原生。云原生應用從架構設計、開發方式到部署維護,都是在云平臺上進行的。

    相比傳統的硬件基礎設施,云計算平臺打通部門、層級、區域的限制,可以實現資源的高度復用、靈活調度和有效供給。而基于標準化的云原生技術,進一步降低了云上應用開發的難度,將產品不斷拆分成為“微服務”,使得開發決策效率更為敏捷。

    從提升資源效應到業務敏捷化,如今隨著AIGC等技術融合,業務智能化發展對金融機構深度用云提出更高的要求。在云平臺本身就具備的穩定可靠、彈性靈活、安全合規等特性之外,將AIGC引入研發設計、生產控制與運營維護等流程,可以實現業務智能化、決策智能化,降低數字化應用的門檻。

    值得注意的是,目前金融機構探索大模型落地應用的場景依然是“怎樣把已有的事情做得更好”,但在AI驅動下有望獲得新的應用創新。大語言模型與傳統的小模型不同,不僅可以在規則導向下獲得深度學習的能力,實現自主分析、自主決策,生成式AI還可以在全業務領域實現多模態業務內容生成、逆向工程、自然語言交互、自主任務分解等。

    優化基礎設施突破算力瓶頸

    然而,對于金融機構而言,算力資源是布局大模型的最大瓶頸。

    有行業專家曾給21世紀資管研究院算過一筆賬,如果在金融垂直領域把所有公開數據都訓練完,一次達標的預訓練,以彭博旗下BloombergGPT的500億參數計算,需要花費200張以上的英偉達A100顯卡,僅一次訓練支出就在200萬以上,低于這一體量的訓練可能效果會不及預期。

    與以往的AI訓練模型方式不同,大模型的訓練任務是“多機多卡”式的,在分布式任務訓練下需要消耗大量的資源。微軟在2023年的財報中首次將GPU的可用性確定為風險因素,微軟表示將繼續尋找和評估擴大數據中心位置和增加服務器容量的機會,以滿足客戶不斷變化的需求,特別是考慮到對人工智能服務不斷增長的需求。

    對于金融機構而言,訓練自己的大模型路徑包括二次訓練精調與聯合共創兩種方式。在二次訓練精調模式下,基于已有的預訓練模型,金融機構在整個神經網絡的最后一層進行修改,其他參數不變,盡管所需的算力要求相較預訓練小很多,但一次訓練也依然需要數十張A100顯卡。而聯合共創模式下,則是將大模型的智能化能力內置應用于智能客服、智能投研等金融場景下,結合金融機構內部數據進行訓練。

    為解決算力資源瓶頸,據21世紀資管研究院調研,金融機構選擇的路徑有:一是頭部金融機構基于囤積的GPU進行探索,二是嘗試將少量訓練與精調挪到公有云上,解決一部分算力問題,采用向量數據庫等外掛知識庫也是一大選擇。

    不過,金融機構的智能化創新變革,需要一個能夠承載數據量井噴、支持全息影像式客戶數據分析、能夠快速適配各類應用場景的平臺,彈性、靈活、可擴展、韌性成為AI原生時代金融基礎設施的關鍵要素。

    從為金融機構提供相關基礎設施服務的頭部信創廠商的實踐來看,目前常見的AI應用基礎設施架構包括算力層、平臺層、大模型層、應用層等四層架構。

    在底層算力層面,混合多云幫助機構實現靈活跨云應用管理;多地多活的災備體系提高機房容災能力,加強了底層技術架構的穩定性與連續性;應用程序的容器化部署簡化了應用開發、構建、部署、管理的流程,提高了業務資源的利用率;向量數據庫、數據湖、數據倉庫等技術則實現了數據資源的優化布局。

    在平臺層面,可以實現從數據預處理、模型訓練、模型部署的一站式訓練,通過業務共性的沉淀與提煉,大幅提升模型訓練效率。據21世紀資管研究院了解,由于大模型的分布式訓練任務,以“多機多卡”形式推進,更需要對算力資源進行充分的感知與適配。用于大模型訓練的機群下的算力節點在同一時間分配了不同程度的運行任務,提升AI中臺的感知能力以靈活選擇資源調度器更為重要。

    在大模型層面,金融機構可以根據不同細分場景業務需求,選擇通過API接口接入通用大模型,獲取一部分智能化能力,或通過微調訓練自己的垂直大模型,實現技術使用成本的降低。

    責任編輯:王超

    免責聲明:

    中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。

    為你推薦

    猜你喜歡

    收藏成功

    確定
    欧美日韩国产成人_亚洲VA欧洲VA日韩VA忘忧草_无码精品国产va在线观看_久久综合噜噜激激的五月天