AI生成圖片

AI生成圖片


由于銀行業(yè)本身的特性,不管是政府層面還是行業(yè)監(jiān)管層面對(duì)銀行數(shù)據(jù)的合規(guī)性、安全性、準(zhǔn)確性、可信性都存在較高要求,因此運(yùn)用在銀行業(yè)的大模型技術(shù)都是研發(fā)成熟品。從整個(gè)大模型行業(yè)來看,部分業(yè)內(nèi)人士認(rèn)為,銀行業(yè)大模型的落地進(jìn)展略滯后于整體行業(yè)。軟通動(dòng)力孫洪軍表示,他們最初預(yù)測(cè)金融行業(yè)可能會(huì)最先大規(guī)模使用大模型,但從最終對(duì)接客戶的情況來看,金融行業(yè)不如法律、招聘等行業(yè)走得快。

銀行業(yè)的大模型正面臨著落地困境,因此對(duì)于現(xiàn)階段還未開發(fā)大模型的銀行,第一步是列舉出目前銀行的大模型困境,并思考如何解決這些“桎梏”,而不是盲目跟風(fēng)訓(xùn)練大模型。

目前限制銀行大模型發(fā)展的難題主要來源于五個(gè)方面,分別是,開發(fā)階段的技術(shù)門檻、人員和成本問題,數(shù)據(jù)來源、數(shù)據(jù)質(zhì)量和隱私保護(hù)問題,運(yùn)行過程中的算力和存力配置問題,對(duì)客層面的可解釋性和信任度問題,開發(fā)后的內(nèi)部員工“恐懼”問題。

開發(fā)階段的技術(shù)門檻、人員和成本問題

由于銀行大模型需要進(jìn)行大量數(shù)據(jù)的訓(xùn)練和長時(shí)間的實(shí)驗(yàn),因此開發(fā)銀行大模型需要長期戰(zhàn)略發(fā)展規(guī)劃,需要投入高性能設(shè)備、龐大的算力資源、長期的無回報(bào)資金以及專業(yè)的技術(shù)人員支持等,這使得該技術(shù)在開發(fā)階段就存在很高的準(zhǔn)入門檻。據(jù)公開財(cái)報(bào)數(shù)據(jù)顯示,多家國有銀行在金融科技方面投入都是百億級(jí)別,多家股份制銀行投入占比在近幾年出現(xiàn)明顯提升。

除了技術(shù)門檻高,成本高之外,最不確定的是人才的缺失,對(duì)于目前金融人工智能領(lǐng)域,不僅僅是技術(shù)人才的缺失,更多缺乏的是復(fù)合型人才銀行大模型人才不止需要擁有人工智能領(lǐng)域的知識(shí)儲(chǔ)備,還需要具備所處垂直行業(yè)的知識(shí),也可以說即使學(xué)了大模型知識(shí)但缺乏對(duì)于行業(yè)、業(yè)務(wù)流程、數(shù)據(jù)的認(rèn)知也是無法稱之為大模型人才。騰訊云副總裁胡利明表示,AI大模型的人才缺口非常之大,頭部機(jī)構(gòu)目前都在招一些AI專業(yè)相關(guān)人才,如算法博士等。

當(dāng)然,銀行雖然可以從大模型廠商處獲得一定的技術(shù)支持,但落地到場景中還是需要銀行具備一定內(nèi)儲(chǔ)人才,能夠?qū)φ麄€(gè)大模型的場景應(yīng)用進(jìn)行構(gòu)建、運(yùn)營、規(guī)劃以及創(chuàng)新,在內(nèi)部使用中不斷試驗(yàn)新參數(shù)、新場景,不斷與外部廠商協(xié)作,共同調(diào)準(zhǔn)、調(diào)優(yōu)和調(diào)精大模型,不斷拓展大模型應(yīng)用的場景和效果。業(yè)內(nèi)人員表示,“大模型是半生品,離成品還差得很遠(yuǎn),必須是領(lǐng)域內(nèi)的人一塊努力才能做成成品。”大模型的應(yīng)用可以解決傳統(tǒng)效率上的問題,但是歸根到底要使銀行得到真正的提升還是得回歸到打造一支既有技術(shù)又明白銀行戰(zhàn)略規(guī)劃和需求的團(tuán)隊(duì)上。

數(shù)據(jù)來源、數(shù)據(jù)質(zhì)量和隱私保護(hù)問題

銀行內(nèi)部存在海量的數(shù)據(jù),其中包括交易數(shù)據(jù)、客戶信息數(shù)據(jù)、風(fēng)控?cái)?shù)據(jù)、績效數(shù)據(jù)等,由于對(duì)數(shù)據(jù)源頭的存檔要求,銀行數(shù)據(jù)中包含了大量非結(jié)構(gòu)化數(shù)據(jù),如圖片掃描數(shù)據(jù),這些非標(biāo)數(shù)據(jù)不僅占用了大量的存儲(chǔ)資源,還可能產(chǎn)生重復(fù)記錄,但因無法進(jìn)行標(biāo)準(zhǔn)化整合、分析和利用,大大降低了員工和設(shè)備的運(yùn)行效率。大模型的出現(xiàn)可以很好解決這個(gè)問題,但是它也需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練。由于存在改制、變更、優(yōu)化等因素,銀行積累的數(shù)據(jù)可能存在數(shù)據(jù)質(zhì)量問題,包括數(shù)據(jù)遺漏、數(shù)據(jù)約束、數(shù)據(jù)安全等問題。

一是數(shù)據(jù)遺漏,也可以稱為數(shù)據(jù)缺失,它包括完全隨機(jī)丟失、隨即丟失和完全非隨機(jī)丟失,造成數(shù)據(jù)缺失遺漏的原因可能是信息暫時(shí)無法獲取,人為沒有記錄、遺漏或丟失,數(shù)據(jù)采集設(shè)備、存儲(chǔ)介質(zhì)等設(shè)備故障等,特別是年份越久遠(yuǎn)的數(shù)據(jù)越可能出現(xiàn)缺失。在這樣缺失的數(shù)據(jù)庫背景下,訓(xùn)練出來的大模型可能會(huì)產(chǎn)生“偏見”,失去部分有用信息和反饋,特別是對(duì)于特殊案例,由于數(shù)據(jù)量少,這個(gè)數(shù)據(jù)群體表現(xiàn)出顯著的特殊性和不確定性,一旦數(shù)據(jù)產(chǎn)生缺失可能導(dǎo)致確定性成分再次降低,從而使得大模型輸出的結(jié)果不準(zhǔn)確。

二是數(shù)據(jù)約束。由于銀行之間存在信息壁壘,僅僅依靠自家數(shù)據(jù)所訓(xùn)練的大模型可能存在“偏見”,例如有些銀行對(duì)公部門強(qiáng)但零售較弱,就可能出現(xiàn)對(duì)公數(shù)據(jù)較全面但零售數(shù)據(jù)缺失的現(xiàn)象,因此訓(xùn)練來的零售大模型精準(zhǔn)度存在一定偏差。金融大模型需要大量的數(shù)據(jù),而目前銀行業(yè)之間進(jìn)行數(shù)據(jù)共享存在難度,這不僅僅是公司層面的“不愿意”,用戶也會(huì)擔(dān)心隱私信息泄露,因此目前大行的大模型準(zhǔn)確度優(yōu)于其他銀行便是因?yàn)樗紦?jù)了數(shù)據(jù)源更豐富的優(yōu)勢(shì)。

三是數(shù)據(jù)安全,能解決數(shù)據(jù)約束問題最好的方式就是數(shù)據(jù)融合和數(shù)據(jù)共享,但是這便面臨著數(shù)據(jù)安全的問題。由于大模型的普世性較低,更多被理解為“暗箱”、“黑盒”,這也是許多LLM(大語言模型)的通病,而金融行業(yè)對(duì)于決策的容錯(cuò)性很低,一旦發(fā)生問題,后果則非常嚴(yán)重,會(huì)出現(xiàn)公司和客戶隱私泄露、資金損失、金融欺詐等風(fēng)險(xiǎn),因此這樣“不可解釋”的結(jié)果并不能給用戶傳遞安全感,從而導(dǎo)致部分客戶的抵制。

運(yùn)行過程中的算力和存力配置問題

大模型可以將傳統(tǒng)應(yīng)用中耗時(shí)幾月進(jìn)行數(shù)十億級(jí)別的文件處理壓縮到一天內(nèi),這是一個(gè)百倍千倍的提升,這也同樣對(duì)算力和存力進(jìn)行了相應(yīng)的提升要求。

首先是算力建設(shè),對(duì)于大模型的研發(fā)來說,最大的挑戰(zhàn)之一就是對(duì)龐大的算力基礎(chǔ)設(shè)施的需求。訓(xùn)練大模型的算力平臺(tái)并不是算力的簡單累加,隨著模型的規(guī)模的增大,低單卡算力也會(huì)被淘汰,因此伴隨著大模型的升級(jí)以及算力的提升,硬件的成本也在持續(xù)上升。此外,算力平臺(tái)的構(gòu)建的難點(diǎn)在于服務(wù)器、存儲(chǔ)、 網(wǎng)絡(luò)等硬件設(shè)備的集成以及繼承后訓(xùn)練設(shè)備軟硬件兼容性和性能的know-how,要搭建最堅(jiān)實(shí)算力平臺(tái)的方法就是自建算力,但這也存在成本高昂的缺點(diǎn),目前只適用于資金實(shí)力雄厚的大型銀行機(jī)構(gòu)。對(duì)于中小銀行而言,由于投入成本和回報(bào)率原因,更多采用算力混合部署的方式,即在敏感數(shù)據(jù)不出域的情況下,接受從公有云上調(diào)用大模型服務(wù)接口,同時(shí)通過私有化部署的方式處理本地的數(shù)據(jù)服務(wù),但這也存在安全性低的缺點(diǎn)。

其次是存力建設(shè),存儲(chǔ)平臺(tái)實(shí)現(xiàn)數(shù)據(jù)的高效流動(dòng),從而銜接整個(gè)大模型的開發(fā)訓(xùn)練和應(yīng)用,沒有高性能的存力性能則無法支撐大規(guī)模數(shù)據(jù)的存儲(chǔ)、讀寫和傳輸。大模型數(shù)據(jù)集要求加載的速度,這就需要有匹配的存力支持,以避免無法將數(shù)據(jù)及時(shí)加載到GPU中,造成昂貴算力空轉(zhuǎn)。當(dāng)數(shù)據(jù)和處理文件達(dá)到一定數(shù)量時(shí),大模型要求存儲(chǔ)系統(tǒng)具備強(qiáng)大的元數(shù)據(jù)管理能力,這包括數(shù)據(jù)加工處理、數(shù)據(jù)調(diào)度、數(shù)據(jù)異常處理等能力。此外,高存力能夠保證模型訓(xùn)練中斷后能快速回復(fù)訓(xùn)練,且盡可能不出現(xiàn)前后不一致的現(xiàn)象。

對(duì)客層面的可解釋性和信任度問題

大模型的決策過程往往難以解釋,這使得銀行難以向客戶解釋模型背后的計(jì)算邏輯,這也是部分客戶不信任大模型不愿意托付數(shù)據(jù)的原因。此外,大模型在生產(chǎn)內(nèi)容的過程中,可能會(huì)產(chǎn)生“幻覺”,即由于訓(xùn)練數(shù)據(jù)及模型的不全面而產(chǎn)生事實(shí)性的錯(cuò)誤,這更加重了陰謀論者對(duì)大模型的猜忌。目前已有公司正在嘗試解決這一問題,OpenAI 公司加強(qiáng)了對(duì)大模型遷移學(xué)習(xí)和對(duì)抗訓(xùn)練,數(shù)據(jù)顯示,在經(jīng)過調(diào)教過后的大模型回答準(zhǔn)確性提高了40%。由此可見,隨著模型的優(yōu)化和數(shù)據(jù)庫的建設(shè)和完善,大模型的準(zhǔn)確率是可以得到大量提升的,一旦在銀行端的應(yīng)用回答準(zhǔn)確率達(dá)到一定水平就可以解決客戶信任度的問題。

開發(fā)后所引發(fā)的內(nèi)部員工“恐懼”問題

伴隨大模型越來越廣泛的應(yīng)用,已在銀行業(yè)內(nèi)掀起了一波“將本增效”熱潮,這對(duì)金融行業(yè)的人員結(jié)構(gòu)帶來新的挑戰(zhàn)和變革。招行金融科技高層人員分享了大模型對(duì)人的替代效應(yīng),他表示如今招行內(nèi)部已建立文檔信息歸總的大模型,它能夠?qū)γ咳諘?huì)議內(nèi)容快速形成紀(jì)要,能夠撰寫高滿意度的匯報(bào)文案……大模型對(duì)內(nèi)部員工工作的執(zhí)行效率進(jìn)行了質(zhì)的提升,可以說它替代了以前“白嫖”實(shí)習(xí)生和初級(jí)員工所能進(jìn)行的工作。

隨著越來越多工作被人工智能替代,甚至代碼都可自動(dòng)化,這就意味著一切與數(shù)據(jù)、編程相關(guān)的崗位都受到了大模型的“威脅”。據(jù)鈦媒體APP了解,目前許多互聯(lián)網(wǎng)、金融科技公司正在裁員,其中包括大數(shù)據(jù)分析師、產(chǎn)品經(jīng)理等多種與數(shù)據(jù)相關(guān)的崗位,而銀行保險(xiǎn)業(yè)則早就在裁員行列中的,這也是“打工人們”所擔(dān)心的。

大模型設(shè)計(jì)的初衷是將本增效,雖然一定程度上會(huì)減少重復(fù)勞動(dòng)力,但不代表完全替代人類勞動(dòng)力。部分銀行明確不希望大模型帶來減員,如擁有20萬網(wǎng)點(diǎn)員工的工行,它明確向華為提出,他們不希望員工被大模型取代,而應(yīng)該是大模型帶來新的機(jī)會(huì),提升員工的服務(wù)質(zhì)量和工作效率,同時(shí)也釋放出部分員工,做更多高價(jià)值的事情。大模型發(fā)展是人員優(yōu)化為目標(biāo)而非人員縮減,這其中存在對(duì)公司員工和結(jié)構(gòu)穩(wěn)定性的考量,同時(shí)也因?yàn)殂y行仍存在很多機(jī)會(huì)和崗位人才缺口,這部分工作是大模型暫時(shí)無法取代的,因此這部分工作需要員工先進(jìn)行開發(fā)。據(jù)鈦媒體APP了解,重點(diǎn)發(fā)展金融科技銀行的IT部門仍承擔(dān)了很多工作和排期問題,存在“勞動(dòng)力不足”的情況,因此大模型的出現(xiàn)是為了幫助員工將效率提高,更快實(shí)現(xiàn)需求的落地,而非裁員。

目前從學(xué)術(shù)學(xué)校層面出發(fā),人工智能專業(yè)知識(shí)已相對(duì)完備并且學(xué)習(xí)人工智能專業(yè)的人才已比比皆是,相比之下,擁有大模型課程的學(xué)校則少之又少。市面上已有對(duì)人工智能專業(yè)的學(xué)校排名榜單,但對(duì)于大模型專業(yè)的信息卻非常局限,一是缺乏開設(shè)相關(guān)專業(yè)的學(xué)校,二是學(xué)校缺乏相關(guān)專業(yè)的老師進(jìn)行授課,三是缺乏系統(tǒng)性學(xué)習(xí)的材料。目前大模型行業(yè)的專家多是出自于傳統(tǒng)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),由此可見科技的發(fā)展帶動(dòng)人才的轉(zhuǎn)型,專業(yè)并不限定職業(yè)和發(fā)展。

銀行大模型的穩(wěn)定和成熟還需要時(shí)間

有業(yè)內(nèi)人士認(rèn)為,金融大模型的熱度還可能持續(xù)一年至兩年,到第三年在專業(yè)領(lǐng)域或許會(huì)大規(guī)模涌現(xiàn)成熟應(yīng)用,第五年后開始進(jìn)入高速增長期。一項(xiàng)新興技術(shù)大致都需要經(jīng)歷快速涌現(xiàn)、試錯(cuò)發(fā)展、監(jiān)管整治、理性發(fā)展四個(gè)階段,對(duì)于現(xiàn)階段的銀行大模型,技術(shù)仍處于探索和試錯(cuò)階段,因此要解決上述困境并不是技術(shù)上的不可達(dá)到,而是需要時(shí)間上的嘗試和積累。(本文首發(fā)于鈦媒體APP,作者|李婧瀅,編輯|劉洋雪)

更多宏觀研究干貨,請(qǐng)關(guān)注鈦媒體國際智庫公眾號(hào):

 

本文系作者 小李說FIN 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

19:44

維信諾:出資1.9億元參設(shè)股權(quán)投資基金

19:43

英國央行格林:經(jīng)濟(jì)活動(dòng)比一年前預(yù)想的要強(qiáng)勁

19:42

Beyond Meat美股盤前下跌55%

19:42

騰亞精工:實(shí)際控制人之一致行動(dòng)人計(jì)劃減持不超過3%公司股份

19:40

旭輝控股集團(tuán):9月合同銷售金額約9億元

19:39

浦發(fā)銀行:中國移動(dòng)通過可轉(zhuǎn)債轉(zhuǎn)股增持公司股份,持股比例增至18.18%

19:38

九安醫(yī)療:擬回購不低于3億元且不超過6億元公司股份

19:38

3天2板旭光電子:2025年上半年可控核聚變相關(guān)產(chǎn)品收入占公司主營業(yè)務(wù)收入比例不足1%

19:37

濰坊“十四五”開放成效突出,“十五五”劍指新高地

19:32

新亞電纜:擬投資2.98億元建設(shè)綠色環(huán)保電纜產(chǎn)業(yè)項(xiàng)目

19:32

英維克:第三季度凈利潤1.83億元,同比增長8.35%

19:30

太陽電纜:億力集團(tuán)擬減持3%

19:29

中國農(nóng)大發(fā)布神農(nóng)大模型3.0

19:27

威剛:存儲(chǔ)產(chǎn)業(yè)行情“好到讓人頭痛”,韓國廠商合約價(jià)或?qū)q20%-30%

19:26

小鵬匯天:陸地航母中東斬獲海外最大訂單

19:25

羅牛山:9月生豬銷售收入同比增長16.48%

19:24

中遠(yuǎn)??兀簲M回購5000萬股-1億股A股股份并注銷

19:24

合鍛智能:公司未取得核聚變概念相關(guān)業(yè)務(wù)收入

19:23

新疆足球工作會(huì)議召開,切實(shí)推動(dòng)足球振興發(fā)展

19:20

合富中國:1-9月營收降22.80%

掃描下載App