创略科技胡世杰：营销场景下，联邦学习如何挖掘数据的“跨域”价值-钛媒体官方网站

图片来源@Unsplash

随着企业数字化进程加快，企业内数据资产化趋势明显。这些企业内部的数据又叫做“私域数据”，管理企业私域数据的平台又叫做数据中台，后来数据中台也出现了一些分化，比如客户数据中台（CDP）当前也较为流行。

但企业大多数的私域数据所训练出的算法都有一定的局限性，这些私域数据就好比一个“信息茧房”，如果没有外域多维度数据做参考，得出的决策可能是不够精准甚至是错误的。

其实大部分企业都希望能通过一些外域数据来完善自身客户数据体系，不过囿于数据合规性以及数据质量好坏等综合因素，这些外域数据并不能被直接获得。那么，有没有一种有效的办法既能拿到高质量数据，又能满足数据合规，还能挖掘“跨域”数据的价值呢？

创略科技创始人胡世杰正带领他的团队尝试用联邦学习的方法探索解决这一问题在数字营销领域的新可能。

联邦学习与数据洞察

联邦学习又叫联邦机器学习（FL），是AI、大数据技术合力促成的一项技术，简单来讲，“联邦”有“众筹”和“协作”之意。由于AI建模需要大量的数据用于训练，一般情况下A机构或企业都只有各自领域的数据，为了AI精确计算的需要，其对B机构、C企业的数据也有需求，为了数据合规，不能粗暴地把几方数据简单加以合并。

于是联邦想要做到的是各个企业的自有数据不出本地的情况下，联邦系统可以聚合各个参与者的训练模型/数据洞察，通过多轮迭代得到全局准确的模型。这样这个全局准确的模型实际就是集合了企业的私域数据和外域数据，能够实现数据跨域联合的价值。

回溯联邦学习的发展历程，最早联邦学习在一些常见领域有所应用。比如医疗、金融、智能汽车、物联网等领域。特别是在金融领域，联邦学习对于金融风险控制、反洗钱等方面的作用已经被学界验证。“联邦学习可以让银行之间的数据不出库，建立一个横向联邦；然后借用互联网公司的行为建立纵向联邦。这样一个系统可以发现特别难以发现的洗钱行为。”微众银行首席人工智能官、香港科技大学讲座教授杨强在某次演讲中提到。

随着这一技术的发展，联邦学习在数字营销领域也开始展露头角。

以创略科技的自身实践为例，创略科技作为一家企业级智能客户数据解决方案服务商，希望利用联邦学习更多促成企业的交叉销售。据了解，交叉销售是以存量客户为基础，借助CRM发现客户的多种需求，并通过满足其需求而销售多种相关产品活服务，努力鼓励客户使用同一家公司的产品或服务的一种营销方式。这种方式不仅可以降低获客成本，而且可以提高客户留存率，培养客户忠诚度。

企业一般情况下实现交叉销售的方式是从建立线下关系开始，才能把各产品条线之间的协作型跑通，但是如果能够借助联邦学习关于异域数据的洞察，就会有一个比较完整的AI解决方案。

“拿春秋航空来说，春秋航空的私域数据中基本上都是航线购买的相关数据，但如果有酒店消费类的洞察，餐饮、咖啡店等行为轨迹数据的话，可能更有利于做营销。”胡世杰介绍。

联邦学习商业化还处于初级阶段

理想状态下，联邦学习应该由特定的联盟发起，各家开放自己的数据，并通过联邦学习技术形成具有全局意义的数据洞察。联盟内的成员都可以使用联盟数据洞察赋能自身业务。

胡世杰也说，创略科技在联邦学习上有往平台化、联盟化发展的意向。“长期来看的话，参与者越多，或者所谓的联盟越大的话，价值也越大，因为从某种意义上是有一定的网络效应在里面的。”

但胡世杰表示，创略科技目前没有在整个客户体系内去推联邦学习，中国营销科技领域也没有一个类似数据联邦的组织存在。

原因在于联邦学习的落地需要企业之间1对1协作。也就是双方都恰好需要对方的数据洞察，创略科技就可以这个过程中扮演撮合者的角色。

在他看来，联邦学习当前没有大规模在商业化上推广有几个方面的原因。一来，有一定数据化基础，且对异域数据有需求的企业一般都是中大型企业，从需求上看，这些企业都是带有目的地选择联邦学习的合作方，比如，他们可能需要针对性地补齐在车联网或者咖啡店客户的数据洞察，所以联邦学习在尝试层面就带有一定门槛。

二来，整体来看联邦学习的商业价值还处在探索阶段，联邦学习更多落地场景和价值有待验证。“联邦学习是需要长期投资的领域，快速提升体量不是现在的首要任务，价值验证与技术磨练在现阶段更重要。”

比如，产业界和学界都在探索区块链技术在联邦学习中的应用。此二者之间一个比较核心的关联是：在区块链技术介入后，“多个企业或参与者之间执行联邦学习时，是否一个主导方（管理方）”是可选的——也就是说，联邦学习可以是个完全去中心化的过程。不管有没有主导方，参与者之间的信任度，透明度，以及参与机制都是重要且能得以保证的要素。其目标都为去中心化网络中增强节点之间的互信，区块链在确保交易记录不被篡改，通过技术上的共识实现多方合作，助力联邦学习实现数据隐私保护技术。

胡世杰坦言，在创略的客户中，真正对联邦学习，或者对异域数据洞察有需求、感兴趣、愿意尝试的的企业比例仅为25%。

他观察，在某一种情况下，联邦学习非常有用。“一些客户只是进入了A企业的私域，但是没有转化成客户，从一些个性化、智能营销的角度很难判断怎么去把这些人转化成客户。但相反，这些客户反而在B企业已经变成了客户。这是非常好的联邦学习的应用场景，对于企业新客导入和拉新有明显帮助。”

除了应用场景有待更多探索，一些巨头型企业也开始探索联邦学习在数据安全性上的问题。钛媒体在《一文读懂机密计算SGX：区块链、AI技术的一把安全锁》中，曾介绍过清华大学李琦教授带领团队用机密计算（SGX）解决联邦学习中的“数据投毒”问题。

由于联邦学习难以控制参与者的本地训练过程，所以训练模型/数据洞察很容易受到模型污染攻击和后门攻击等等。例如，参与者可能会在不训练或者少训练的情况下骗取奖励，从而导致模型训练方的经济损失。

而SGX作为基于硬件的保护工具，可以有效且高效的保证联邦学习训练的正确执行。因此，通过应用SGX技术可以为联邦机器学习提供有效的安全防护。

联邦学习落地过程中的更多问题还有待被解决。不过，这些问题的存在并不能阻止产业界、学界对联邦学习未来的看好。“我对这个技术的未来走向是非常乐观的。但联邦学习商业化跟应用场景落地的问题可能是一个难点。结合这样一个技术，怎么样真正把它做成一个有意义、有价值、能规模化的一个模式？是一个问题。”胡世杰说。

（本文首发钛媒体App，作者 | 秦聪慧）

创略科技胡世杰：营销场景下，联邦学习如何挖掘数据的“跨域”价值

联邦学习与数据洞察

联邦学习商业化还处于初级阶段

敬原创，有钛度，得赞赏