近期簡單探討了“銀行大模型”的應(yīng)用現(xiàn)狀及重點(diǎn)領(lǐng)域,原本打算暢想下大模型在銀行業(yè)務(wù)場景中的落地路徑,然后就看到了下面這篇極度打臉但又人間清醒的“攻略”——如何打造一個(gè)拖垮公司的大模型?
第1步:先砸十個(gè)億買卡。做大模型,要有大格局,舍不得孩子套不著狼。什么X100、Y100……專挑算力強(qiáng)的買。正規(guī)渠道沒貨了?不能慫!加價(jià)也要整起來。
第2步:從頂流公司挖大牛來坐鎮(zhèn)首席科學(xué)家。必須是業(yè)界扛把子級別的大牛,就職于頂流AI公司比如“CloseAI”,經(jīng)常在各種會議上高光出鏡的那種。能把整個(gè)團(tuán)隊(duì)都帶過來最好,成建制、好管理、出活兒快。
第3步:定戰(zhàn)略,當(dāng)卷王。模型參數(shù)至少要萬億級別,當(dāng)不成卷王,就只能被卷死。再來個(gè)“智算中心”,算力至少達(dá)要1000PFLOPS,自己訓(xùn)練完大模型,還能把算力開放出來給同行。
第4步:萬事開頭難,從數(shù)據(jù)準(zhǔn)備開始全員雞血加班。數(shù)據(jù)不夠怎么整?公開一部分,自有一部分,交易一部分。拿到數(shù)據(jù)后,得清洗處理,全體動員做標(biāo)注,老板親自下場,主打一個(gè)陪伴。
第5步:開始玩命訓(xùn)練,不出意外的話快出意外了。服務(wù)器掛了、存儲速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……什么?!Checkpoints沒保存?反復(fù)回退,反復(fù)調(diào)參,反復(fù)排雷。
第6步:內(nèi)部開始自我修正。問題一多,團(tuán)隊(duì)就亂了,人都變得很浮躁。公司原有的主營業(yè)務(wù)停滯不前,業(yè)績下滑。
第7步:不管產(chǎn)品行不行,市場宣傳要先行一步。“我們來了!”廣告要全渠道、全媒體覆蓋。必須要業(yè)界感知到我們來勢洶洶的霸氣。
第8步:生態(tài)伙伴少不了,氣氛必須搞起來。先結(jié)盟5000家合作伙伴,達(dá)成意向合作。第二天,大家聯(lián)合發(fā)發(fā)新聞稿,必須讓吃瓜群眾充滿期待。
第9步:大模型終于“練”出來了。練是練出來了,看上去有點(diǎn)不對勁,莫不是個(gè)“大傻子”吧?落地實(shí)施,那叫一個(gè)難,不知道給誰用,不知道往哪兒用。
第10步:及時(shí)止損,人間清醒。然后開始復(fù)盤,多么痛的領(lǐng)悟……
據(jù)不完全統(tǒng)計(jì),2023年單單中國企業(yè)就累計(jì)發(fā)布了將近300個(gè)大模型,這來勢洶洶的“百模大戰(zhàn)”頗有一番“大煉AI”的架勢。盡管上述“攻略”有夸張的成分在,但也從側(cè)面暴露出被譽(yù)為“下一個(gè)科技風(fēng)口”的AI在資本的裹挾下已經(jīng)開始出現(xiàn)一些浮躁或扭曲的亂象,簡單來說有如下幾類問題:
大模型的應(yīng)用場景尚未清楚就匆匆上馬,盲目跟風(fēng);
熱衷請專家、立概念、講故事,餅?zāi)墚嫸啻缶彤嫸啻螅?/span>
為了能把故事講圓,刻意追求所謂的“自建”和“閉環(huán)”;
本末倒置,過于關(guān)注熱點(diǎn)創(chuàng)新業(yè)務(wù)而耽誤主業(yè);
重推廣輕產(chǎn)品,以吸引投資為導(dǎo)向,而忽略了業(yè)務(wù)價(jià)值創(chuàng)造。
如此看來,在跟集萬千寵愛于一身的大模型套近乎時(shí),最好還是掂量一下,務(wù)必以創(chuàng)造業(yè)務(wù)價(jià)值為導(dǎo)向,在明確業(yè)務(wù)需求的前提下規(guī)劃相應(yīng)的落地路徑,避免出現(xiàn)虎頭蛇尾竹籃打水一場空的情況。
下面我們結(jié)合一個(gè)虛擬案例,簡單聊聊大模型在銀行業(yè)務(wù)場景中的落地路徑。
案例背景:某銀行希望引入大模型來提升其信貸審批流程的效率和準(zhǔn)確性。當(dāng)前,信貸審批過程大量依賴人工審核,效率低下且容易出錯(cuò),銀行希望通過大模型自動化地處理和分析客戶的信貸申請,以快速準(zhǔn)確地做出審批決策。
第1步:業(yè)務(wù)理解和需求分析
與信貸業(yè)務(wù)部門溝通,深入了解信貸審批流程的具體細(xì)節(jié)和業(yè)務(wù)需求。
確定大模型在信貸審批中的應(yīng)用場景,如客戶信用評分、欺詐檢測、還款能力預(yù)測等。
第2步:數(shù)據(jù)收集和處理
收集歷史信貸申請數(shù)據(jù),包括客戶個(gè)人信息、財(cái)務(wù)狀況、信貸歷史等。
對數(shù)據(jù)進(jìn)行清洗和預(yù)處理,去除無效數(shù)據(jù)和異常值,確保數(shù)據(jù)質(zhì)量和一致性。
根據(jù)業(yè)務(wù)需求對數(shù)據(jù)進(jìn)行特征工程和標(biāo)簽化處理,提取出對模型訓(xùn)練有用的特征。
第3步:模型選擇和訓(xùn)練
選擇適合信貸審批場景的大模型架構(gòu),如深度學(xué)習(xí)模型、決策樹模型等(此處可以考慮與成熟供應(yīng)商進(jìn)行合作)。
使用處理后的數(shù)據(jù)對模型進(jìn)行訓(xùn)練,通過調(diào)整模型參數(shù)和超參數(shù)來優(yōu)化模型性能。
在獨(dú)立的驗(yàn)證集上評估模型的準(zhǔn)確性、召回率等指標(biāo),確保模型滿足業(yè)務(wù)需求。
第4步:模型集成和部署
將訓(xùn)練好的模型集成到銀行的信貸審批系統(tǒng)中,確保模型能夠與現(xiàn)有系統(tǒng)無縫對接。
開發(fā)相應(yīng)的API接口,使信貸審批系統(tǒng)能夠調(diào)用模型進(jìn)行實(shí)時(shí)推理。
對模型進(jìn)行部署和測試,確保模型在實(shí)際環(huán)境中能夠穩(wěn)定運(yùn)行并輸出結(jié)果。
第5步:業(yè)務(wù)驗(yàn)證和調(diào)優(yōu)
在實(shí)際業(yè)務(wù)場景中對模型進(jìn)行驗(yàn)證,觀察模型的審批決策是否符合預(yù)期。
收集反饋數(shù)據(jù)并進(jìn)行模型調(diào)優(yōu),改進(jìn)模型的性能和準(zhǔn)確性。
建立模型性能的監(jiān)控機(jī)制,定期評估模型的性能并進(jìn)行必要的調(diào)整和優(yōu)化。
第6步:上線和監(jiān)控
經(jīng)過充分驗(yàn)證和調(diào)優(yōu)后,將模型正式上線并投入生產(chǎn)環(huán)境使用。
對模型進(jìn)行持續(xù)的監(jiān)控和維護(hù),確保模型在實(shí)際運(yùn)行中的穩(wěn)定性和可靠性。
定期評估模型的效果和業(yè)務(wù)價(jià)值,為后續(xù)的模型優(yōu)化和迭代提供依據(jù)。
或許有朋友會問,上述案例中所描述的信貸審批業(yè)務(wù)需求,通過小模型同樣能夠?qū)崿F(xiàn),為何還要勞神費(fèi)力上大模型呢?
簡單來說,選擇大模型還是小模型,主要取決于具體的業(yè)務(wù)場景應(yīng)用需求,以銀行業(yè)務(wù)為例,大模型更適合處理需要深度分析和復(fù)雜決策的場景(如企業(yè)貸款審批、投資策略制定或全面的客戶關(guān)系管理等),而小模型則更適合處理快速、簡單的決策任務(wù)(如ATM交易欺詐檢測、基本客戶查詢響應(yīng)或個(gè)性化推薦等)。
當(dāng)然除此之外,銀行還需要綜合考慮自身的資源稟賦、性能要求以及隱私和安全等方面的因素,或者也可以采用混合方法,結(jié)合大模型和小模型的優(yōu)勢來處理不同復(fù)雜度的任務(wù)。
最后,盡管銀行業(yè)對大模型的關(guān)注日益升溫,并且在營銷推廣、渠道運(yùn)營、開發(fā)運(yùn)維等領(lǐng)域取得一定成效和收益,但對于天然厭惡風(fēng)險(xiǎn)的銀行而言,仍處于發(fā)展初期的大模型在其業(yè)務(wù)側(cè)的全面落地還面臨諸多挑戰(zhàn),不過“挑戰(zhàn)”即“機(jī)會”,也希望廣大同業(yè)能夠抓住這個(gè)難得的機(jī)會,共同推進(jìn)AI技術(shù)在銀行數(shù)智化轉(zhuǎn)型中的應(yīng)用落地及價(jià)值創(chuàng)造。
免責(zé)聲明:本文、圖片均轉(zhuǎn)載網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系刪除。
致力于分享最及時(shí)的金融行業(yè)資訊
企業(yè)信息共享互動平臺