目前,小微企業的信用數據來源主要包含幾個部分:除了人行征信系統和銀行內部自有數據以外,主要集中在政府部門或公共事業部門,其他同業金融機構,還有部分是分散在供應鏈核心企業,以及互聯網企業中的替代性數據。數據來源的分散化、碎片化使銀行獲取數據的成本高、難度大,加上整個社會信用信息體系尚未完全打通,信息獲取的渠道不通暢,彼此之間仍然存在著組織壁壘、數據孤島的問題。

另外,由于替代性數據的信息采集和處理機制不同、來源復雜,數據的準確性、真實性相對較低,銀行出于合規考慮,對數據廠商的選擇和合作也更加謹慎;供應鏈核心企業所掌握的上下游交易數據、產品數據等保密程度高,加上鏈條各環節數據口徑不統一,數據質量難以保證,并且存在大量半結構化、非結構化的數據,造成銀行實際可用的數據量和數據有效性不足,也加大了數據治理的難度。
相關的法律法規在要求保護數據安全的同時,也重視對數據的合規開發利用。政務數據和金融同業數據本身的質量高、有效性強,能夠幫助銀行全面了解小微企業信息,銀政、銀銀合作布局普惠金融,可以形成政府、銀行、擔保、保險等多方數據安全共享的體系,共同解決小微企業貸款的數據難題。隱私計算“可用不可見”的優勢是這個過程中實現數據脫敏、脫密的關鍵,可以從技術上保障數據流通的合規和安全,滿足政府、同業、供應鏈核心企業等對數據保密性的要求。可以利用多方安全計算技術加強在信貸業務場景的應用,例如在小微企業信貸業務申請、客戶評級、圖像隱私保護、黑名單共享、貸款資金流向監測等關鍵環節,通過在各方部署隱私計算節點,共同完成任務調度。但隱私計算目前還尚未發展到大規模落地的成熟階段,銀行在考慮部署隱私計算平臺前,需要結合自身業務特點和IT架構進行充分評估和驗證。在加強數據采集的基礎上,需要對數據質量、真實性和合規性做進一步判斷和治理。數據治理的關鍵是建立全行統一的數據標準,構建企業級的數據能力中臺,打造數據底座,在數據治理的基礎上,推進模塊的快速迭代和復用,基于大數據、人工智能技術形成全流程、全生命周期的數據治理方案,結合小微企業的信貸業務場景、合同文本、業務圖像等非結構化數據,對原始數據進行解析,融合計算機視覺、NLP、知識圖譜技術,通過內容管理進行非結構化數據處理,實現智能搜索、內容安全洞察、內容自動化管理,提升小微企業數據的可用性,盤活數據價值。3、提升模型性能,在數據有限的情況下充分挖掘數據價值在數據量有限的情況下,對數據的挖掘、模型的建設變得更加重要,一方面可以利用人工智能的深度學習與知識圖譜技術,通過業務規則設置、模型設計去識別、融合、分析自有數據,深度挖掘產業鏈條上下游企業的關聯關系,建立小微企業的關系視圖,挖掘風險傳導的路徑;另一方面可以通過機器學習進行歷史數據洞察,分析哪些數據可以更加有效、精準地識別客戶,哪些數據具有普遍性,哪些數據只針對特定客群有應用價值,從數據中推導模式來幫助信用模型或業務策略的改善。