• 移動端
    訪問手機端
    官微
    訪問官微

    搜索
    取消
    溫馨提示:
    敬愛的用戶,您的瀏覽器版本過低,會導致頁面瀏覽異常,建議您升級瀏覽器版本或更換其他瀏覽器打開。

    金融業大模型落地之困 疊加小模型實現智能化應用

    李覽青 楊夢雪 來源:21世紀經濟報道 2024-02-02 08:53:40 大模型 金融AI
    李覽青 楊夢雪     來源:21世紀經濟報道     2024-02-02 08:53:40

    核心提示從電子化到數字化到智能化,金融行業在科技應用上始終位于前沿。

    從電子化到數字化到智能化,金融行業在科技應用上始終位于前沿。

    作為推動AI大模型發展的“三駕馬車”,數據、算力、算法關系著大模型商業化落地的成敗,全面啟動數智化轉型、擁有自主創新能力以及龐大數據規模的金融行業,被視作大模型落地的最優選之一。在大模型時代來臨前,金融業已在智能營銷、智能風控、智能投研、智能客服等領域,通過“小模型”實現了場景應用的智能化。

    無疑,大模型對金融機構的基礎設施架構、技術路線應用、數據生態、業務場景等多個方面都帶來全新的機遇。然而,牽一發而動全身,大模型作為一項新興技術的落地應用并不是一蹴而就的,金融機構面臨著數據治理、數據安全保護、科技投入成本以及工程化能力等等多重挑戰。

    圍繞大模型在金融領域的創新應用,以及當下機構布局的難點痛點,近日由南方財經全媒體集團指導、21世紀資管研究院主辦的“金融大模型潮起——大模型如何重塑金融業態”閉門研討會在上海虹口舉行。來自金融機構、科技公司、研究機構的多位嘉賓參與討論。

    以下為21世紀資管研究院整理的部分會議內容。

    落地困境:合規風險與數據治理難題

    在金融行業探索大模型應用時,有三條主流路徑:一是基于現有開源大模型、基礎大模型進行微調落地,二是與廠商聯合創新自研大模型,三是通過API接口接入商用大模型或通過外掛知識庫實現部分功能的使用。

    從2022年末開始,多家金融機構組建了大模型研發相關團隊,對上述路徑均有所嘗試。其中基于開源基礎大模型,將相關業務數據在機構內部進行微調,是機構率先嘗試的辦法,但從行業反饋來看,機構遇到不小的挑戰。

    一家券商金融科技部門大模型業務負責人表示,在大模型落地應用前,首先應梳理好風險點,而法律法規的風險、訓練和應用的風險值得關注。

    他指出,在法律法規的風險方面,一些機構使用基于開源基礎模型進行微調,特別是在直接使用境外大模型提供的SaaS服務,或基于境外大模型進行二次訓練及微調時,需要重視其中涉及的數據合法性和合規性。例如,用戶數據的跨境傳輸問題、不同國家和地區數據保護法規差異問題、數據主權、數據泄露等等問題都值得高度關注。

    在合規風險之外,另一個限制微調效果的因素是巨大參數規模的高質量語料集。

    “相關高校研究成果表明,參數規模在百億級以下的大模型智能化水平不高,而千億級大模型的微調對數據量要求非常高,要達到基礎大模型數據量的20%。以1000億token參數規模的大模型微調為例,需要1000萬篇的專業性萬字長文,這對于金融行業而言是一個巨大的挑戰?!币晃汇y行科技部門人士指出,在微調數據量不充足的情況下,大模型可能會出現“幻覺”、“遺忘”、“胡言亂語”等問題。

    在東方財富人工智能研究院高級研究員張愷看來,依靠純金融的語料來構建一個大模型,還比較困難。因此現階段金融垂直大模型還是以通用語料作為基礎能力,再加上金融語料通過反復試驗后調整一個配比,最終形成一個既具備通用能力,又具備金融理解力的金融大模型。他指出,在金融行業一些對結果輸出要求比較高的場景做適配落地時,通過對通用模型的應用或微調很難快速達到理想效果,原因是通用基礎模型的預訓練過程中就沒有學習較多的金融相關知識和表達方式,因此即使微調,也可能只能學到一些表象,大模型無法理解真正金融任務。

    破局之道:“小模型+大模型”實現場景應用

    一方面合規風險影響基礎模型使用,另一方面數據質量影響微調效果,金融機構如何破局?

    在與會嘉賓看來,出于成本和實際應用場景考量,龐大參數的金融行業通用大模型目前還沒有能力,也或許尚無必要訓練。在已有通用大模型的基礎上,疊加小模型的理解能力,可以實現智能化的應用。

    一家城商行大模型團隊負責人提到,基于他的觀察,金融機構在大模型領域的應用探索主要分為三大類。第一類是極大降低傳統NLP(自然語言處理)的封裝門檻,過去的NLP技術即使有預訓練模型,銀行還是要做下游任務的封裝,有了大模型以后只要用prompt(AI提示詞)就可以驅動它。第二是“知識張成”,即知識向量張成到知識空間,基于大模型的知識學習能力,在實踐過程中發現大模型可以理解一段code(代碼)或者SQL(數據庫語言),但目前讓大模型來生成代碼的可用性還比較低。第三是“零熵模式”,由于大模型原有的知識可能與銀行提供的外部知識庫是沖突的,因此銀行一般希望大模型的信息熵是0,但又可以幫助其建立起企業級知識庫,這種模式下比較常見的應用是RAG(檢索增強生成),但在訓練過程中需要關注部分數據紕漏。

    前述銀行科技部門人士同樣表示,大模型的出現對金融機構的技術演進產生了重要影響。首先是企業級知識庫的梳理,他指出,要解決大模型“幻覺”、“遺忘”、“胡言亂語”等問題,核心就是要打通各個部門的知識體系,統一建立起企業級的知識庫。如今,其所在團隊基于RAG(檢索增強生成)架構,已在探索將各部門的固有知識庫建立起來做增強式檢索,以解決場景應用的難題,提高業務應用的精準性。

    在某股份行大模型技術負責人團隊的實踐中,他們發現以大模型技術基于人機協同的方式賦能一線工作人員提高工作效率是比較可行的方向,通用大模型本身在辦公輔助方面也出現了爆發式增長的趨勢。他同樣認為,大模型不會取代一些小模型,傳統的小模型會跟大模型做一個大小模型的協同,來賦能不同的場景。

    “大模型對商業銀行未來經營模式的影響無疑是顛覆性的?!鄙虾^r商行金融科技部總經理助理查曉雋表示。他認為,各大銀行數字化轉型發展趨勢,目前主要包括場景生態化、產品自助化、渠道綜合化、經營數字化、風控智能化、運營自動化等六個方向。

    對此,金融機構一方面需要積極面對,做好相應的知識儲備,另一方面需要對行業進行持續追蹤,在部分創新業務場景下實現大模型的應用落地。

    責任編輯:王超

    免責聲明:

    中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。

    為你推薦

    猜你喜歡

    收藏成功

    確定
    欧美日韩国产成人_亚洲VA欧洲VA日韩VA忘忧草_无码精品国产va在线观看_久久综合噜噜激激的五月天