基于区块链的电信运营商跨行业数据融合反诈识别系统
为了解决运营商与行业合作过程中的信息安全问题,天津移动构建了一种基于区块链的数据融通智能反诈系统,以区块链赋能联邦学习(Federated Learning)数据访问机制,结合联盟链防篡改、可追溯的关
为了解决运营商与行业合作过程中的信息安全问题,天津移动建设了基于区块链的智能反欺诈系统。通过区块链启用联邦学习数据访问机制,结合联盟链防篡改和可追溯的关键特性,将联邦建模的关键参数联系起来,实现了多方合作的可信网络。同时解决了中心依赖和单点欺诈问题,通过区块链提高了跨行业数据融合中多方安全计算的可信度。 跨行业数据融合进行反诈骗识别本文的背景是中国移动利用区块链技术,联合公安、银行等部门开展跨行业大数据反诈骗识别。 要解决跨行业数据融资合作中的安全管理问题,中国移动在对电信诈骗建模时,除了自身的网络、人像等数据外,还需要与金融、公安的数据进行整合,构建更加全面、准确的识别模型。 但是,外部单位或部门不会简单地将数据与中国移动的数据进行汇总,而是需要基于多方安全计算模式进行组合。如果没有适当的安全管理机制,中国移动反欺诈识别模型的准确性和运行效率将受到限制。 因此,迫切需要将区块链技术应用到电信反诈骗系统中,解决跨行业数据安全可信问题,打消数据合作伙伴的顾虑。 基于区块链技术的行业数据多方安全计算建模
电信反诈骗识别系统涉及运营商与银行、公安部门等的数据合作。目前联邦学习主要用于保证大数据交换时的信息安全,保护终端数据和个人数据的隐私。 区块链这种数据加密不可更改的分布式共享技术,可以为运营商、公安等联邦学习的数据交换提供数据保密性,保证所有参与者之间的数据安全和模型训练的数据一致性。 利用区块链技术实现电信诈骗识别
电信诈骗主要针对社会信息相对匮乏的中老年人,单一诈骗贯穿运营商、银行、第三方支付等行业和领域。 区块链技术解决了多方数据合作的信任问题,为跨行业数据合作中的审计提供了重要工具,有助于形成有效的利益分配和安全审计方案。 在欺诈识别方面,区块链科技解决了跨行业数据连接、确认和授权等问题。,并应用于电信、公安、金融场景的重点反欺诈工作,可以让信用产生价值,大幅降低数据泄露风险,完成行业大数据风控体系的有效建模。 区块链数据金融智能反欺诈系统的功能架构
该方案充分利用了区块链的技术优势。在运营商、公安部门等各方数据的支持下,发挥跨行业数据融合和模型共享的能力。结合联盟链防篡改和可追溯的关键特性,链接联邦建模模型的关键参数,实现智能反欺诈。 原理本文重点研究运营商反欺诈识别联邦模型培训过程的能力优化。该方案的主要思想是:联邦参与者提取数据特征并训练本地模型,模型参数通过区块链上行服务进行数据链接。经过CMBaaS的智能合同判断和区块链共识算法的计算,生成新的块。 其他参与者的块消费服务检测发现生成了新的块。在获得块数据后,他们迭代优化自己模型的参数,并更新参数,直到所有联邦参与者达到模型预设的收敛条件。 该方案的创新之处在于:多方共同参与模型训练后,引入区块链智能合约技术对多方数据进行统一管理,并将联邦模型的中心节点替换为区块链,解决了联邦学习中心节点的审计问题。 系统使用的区块链型号是EOS,主要载体是中国移动的CMBaaS区块链平台。 基于区块链的中国移动反欺诈识别模型机制方案的主要流程包括:区块链代替联邦学习中介,实现数据集成、协作和可信;模型训练过程中梯度的中间结果被加密上传,结果被区块链解密,然后总梯度被聚合分发到所有参与者,从而完成参与者数据的不出库联合建模。 与区块链的结合有助于确定联邦学习中各方的贡献,因为多参与者模型的特征变量IV的值在数据上传时会在区块链平台上产生一个永久不可逆的数据块。 因此,我们可以计算当前参与者对整体模型的贡献,在模型收敛后,我们可以定量判断所有参与者的贡献,这将为联邦参与者的合作提供谈判依据。 当多个参与者进行联邦推理时,使用区块链记录用户服务的接口调用日志指纹、每个参与者的贡献以及该服务产生的收益,并通过智能合约自动将收益分配给每个参与者。 与现有的计费方法不同,这种方法可以更准确地评估每个数据呼叫的质量,从而鼓励参与者确保数据呼叫的准确性。 nbsp系统架构及组网基于区块链的电信反诈骗系统具有较高的技术价值,可以解决运营商跨行业数据整合的实际问题。 中国移动跨行业数据融资反欺诈系统的技术架构如图3所示,包括企业数据层、联邦参与服务层、块服务层和共享数据块平台层。 企业层:中国移动及其合作伙伴的用户隐私数据仍然只存储在各自的内网系统中,训练和推理请求都由内网应用发起。 联邦参与者服务层:中国移动与合作伙伴分别构建一套本地AI模型,向block服务层提供模型参数和数据标识符进行数据上行,接收其他参与者的模型数据,同时推动数据共享模型的迭代升级。 块服务层:作为AI模型和区块链CMBaaS平台之间的中间服务节点,提供定制化的数据上传和数据消费服务。 数据共享平台层:即中国移动区块链业务的CMBaaS平台,通过智能合约和共识机制,为整个系统提供一个不可逆、相互信任的模型共享培训平台。 该系统主要包括三个数据流:数据对齐、模型训练和模型推理。 数据对齐:在模型的训练开始之前,所有参与者需要共享加密的用户ID数据,并与其他参与者同步数据对齐。 模型训练:联邦参与者提取数据特征并训练本地模型。模型参数由区块链上行服务上传,由CMBaaS的智能合约判断,并由区块链共识算法计算生成新块。 其他参与者的块消费服务检测新块的产生并获取块数据,然后迭代更新自身模型的参数,直到所有联邦参与者满足模型预设的收敛条件。 模型推理:中国移动及其合作伙伴发起模型推理请求,区块服务上传数据,通过智能合约和共识算法验证数据,生成区块。其他参与者监控新块的产生,判断推理请求是否与自己相关,然后联合推理解密。最后,请求者获得模型推理结果,并将其返回给业务系统。 中国移动跨行业数据理财反欺诈系统的逻辑流程如图4所示。 nbsp举例目前,电信反诈骗识别系统已在天津移动资源池和中国移动CMBaaS区块链平台部署;同时,天津移动与渤海银行、天津市公安局合作完成联合建模,并根据需求不断完善系统功能。 实现区块链启用电信诈骗识别新功能
本方案提出的联邦学习和区块链融合架构分别部署联邦学习和区块链服务,联邦学习的模型参数和梯度以文件形式传输到区块链服务,上传核心数据。 该方案能有效增强联邦学习的隐私保护强度,通过智能契约和共识算法在统一规则下判断所有参与者的训练和推理请求,并通过区块链的不可逆性代替中间方保护参与者。 如果发现非法上行请求,会拒绝在区块链生成块,从而规避风险,控制流量,保证优质合作伙伴的请求。 支持“运营商+银行”的数据合作新模式[h/]
该方案利用区块链技术,在中国移动和渤海银行之间构建联邦欺诈识别和信贷风险控制模型。双方在不共享数据的基础上实现了联合建模,从技术上打破了“数据孤岛”,实现了更加精准高效的信用评估。 同时,区块链还取代了联邦中心,以更好地协助数据审计。未来,多家运营商和银行可以构建联合智能反欺诈数据共享机制,结果可追溯、不可篡改,形成模型共享的培训生态。 创新技术的跨行业数据融合模型,解决单点欺诈问题
系统基于联邦学习模型实现中国移动、金融、公安部门间的数据共享和联邦建模,结合区块链技术和多方隐私计算,解决数据联合中可能存在的单点欺诈问题。 而区块链和模型梯度不可改变的特性存储在区块链中,使得用户和服务器的数据操作被如实记录,参与者的所有恶意行为都可以事后追溯。只有所有参与者如实上报自己的数据信息,才能获得最大的收益,从而保证数据的安全性,防止参与者恶意调整局部模型对全局模型造成不利影响。 多方可信网络,打造数据联合生态
通过构建基于区块链的安全计算网络,实现更有效的联邦建模信任机制,联盟链代替第三方,使联邦双方模型的局部参数在联盟链上加密。借助联盟链的可追溯性和防篡改的技术特性,帮助多方安全计算提高审计效率,节约成本。 实现更安全的联合模型推理,构建信任基础
该系统采用区块链技术解决共识和信任问题,记录的交易不可篡改。模型的训练、推理和角色定位都是相互联系的。通过智能契约和共识计算实现多方合作的可信网络,可以在多方联邦中用块代替中心节点的角色,从而为联邦实现更安全的模型推理机制。 当联邦方发起模型推理请求时,分块服务上传数据,智能契约和共识算法验证数据生成分块。其他联邦方监控新块的生成,判断推理请求是否与自己相关,并进行共同的推理和解密,从而在保证可信性和安全性的同时,使数据能够整合。 区块链数据融资智能反欺诈系统推广
区块链数据融资智能反欺诈系统于2021年1月正式上线,实现跨行业数据融合应用。 截至2021年9月,天津移动已与渤海银行、天津市公安局合作实现电信反诈骗身份识别(项目已落地);2021年12月,天津移动与渤海银行启动项目合作,开展营销潜在客户识别和风险防控,完成正式商用并签约。 后续,在中国移动集团技术中心的指导下,天津移动将利用全国用户数据,与渤海银行合作开展区块链科技赋能全国联合营销建模。 天津移动、渤海银行、天津公安联合反诈骗案基于该反诈骗系统,天津移动准确识别诈骗电话,减少误卡,减少用户价值损失378万元。 针对潜在电信诈骗号码的破卡行动,大大提高了准确率,大大减少了当年潜在的电信诈骗。 同时,通过停止诈骗号码,每年减少电话骚扰150万次,提高用户满意度。 在工信部通报的90余家运营商治理成果排名中,天津移动由之前的低水平提升至前十,治理成果显著。 天津移动和渤海银行的风控和营销合作就是基于这个体系。天津移动与渤海银行天津总行合作,作为“2021渤海银行信息化能力提升项目”总子项目实施,项目总金额1800万元。目前,前两个阶段已经完成。 “区块链+联邦学习”子程序项目金额300万元,实施周期与主体项目一致。 该项目融合了运营商和银行的客户分控和风险欺诈特征,在运营商客户行为和画像数据的基础上,整合银行中的客户行为数据,实现更加精准的联合营销识别和风险欺诈识别。 目前,天津移动的跨行业融资和赋能管理水平有了很大提升。 一方面,模型泄露风险得到有效控制 为了建立联合模型,联邦参与者仍然需要上传和共享模型参数或梯度信息。 研究证明,由于导数信息、梯度等模型信息的泄露,隐私计算具有推演原始数据的可能性。 当发生数据泄露或安全风险时,隐私计算可能不符合匿名的要求,相关参与者也可能因未完全履行数据安全保护义务而承担法律责任。 另一方面,天津移动的安全隐患已经消除。 联邦参与者可以承担生成和发布公钥和私钥、加密和解密结果等任务。,但一些参与者可能会违约以获取额外信息,这可能会暴露其他参与者的数据隐私,一些参与者可能会恶意合谋获取其他参与者的数据。 基于区块链技术,中国移动解决了跨行业数据融资欺诈识别的共识性和可信度问题。记录的交易是不可篡改的,模型的训练、推理、角色对齐都是衔接起来的。通过智能契约和共识计算实现多方合作的可信网络。 在天津移动的大数据对外变现、股票操作、风险控制、骚扰电话识别等场景都取得了优异的成绩。 作者:中国移动通信集团天津有限公司赵东明刘晶天津市公安局河北分局科技信息支队张淑英张建涛 nbsp