2024T-EDGE文章顶部

分布式计算鼻祖BOINC:你的电脑也能和外星文明实现“第五类接触”

可曾想有一天,在你屋脚处沉默的那台个人电脑,可以解码艾滋病、破译癌症,甚至找到地外文明存在的证据?

图片来源@视觉中国

图片来源@视觉中国

可曾想象,有一天,在你屋脚处沉默的那台个人电脑,或许可以找到地外文明存在的证据?

这样地外讯息跨时空的“第五类接触”不是科幻,来源于可操作的现实。

时间回拨1995年,时任美国UC伯克利大学助理教授David Anderson未曾想,他发起的SETI@home项目竟会引发如此强烈的关注。

SETI是:Search for Extra-terrestrial Intelligence的缩写,整个SETI@home的中文直译是“在家搜寻地外文明”。

  SETI@home项目官网首页

这是一项利用分布式计算聚合全球联网计算机,用以共同搜寻地外文明的科学实验。在SETI平台上贡献个人计算机算力的志愿者,可以通过运行一个免费程序下载,并分析从射电望远镜传来的外太空信号数据加入这个项目。这个程序在用户的个人计算机上,通常以屏幕保护模式或后台模式运行。它利用的是多余的处理器资源,不影响志愿者正常使用计算机。

 建立在算力之上的科学世界

SETI@home中心平台设立在美国著名高等学府加州大学伯克利分校的空间科学实验室 ,也是David Anderson教授现在的供职之地。David Anderson领导SETI@home项目自1999年5月17日正式运行。至2004年5月,累积进行了近5×10E21次浮点运算,处理了超过13亿个数据单元,吸引了 543 万用户。这些用户的电脑累积工作 243 万年(这仅是在那个个人电脑和互联网没那么普及的年代),分析了大量积压数据。

这些闲置个人电脑的算力总值,在当时超过了世界上任何一台超级计算机的处理能力。曾有志愿者计算,当1000多台联入高速局域网的笔记本电脑在大学一角同时运行SETI@home,就有可能冲进全球超级计算机500强。

SETI@home作为迄今为止最成功的分布式计算试验项目。其成功不仅体现在寻找地外生命的可能性,更巨大的价值在于,它首次实践印证了大规模网格、分布式计算是现实的、可拓展的、有效的。

顺理成章,SETI开始接受包括引力波验证、艾滋病生理原理和药物研究(FightAIDS@home)、粒子加速器设计(DPAD项目)、蛋白质内部结构研究(Folding@home项目)、癌症攻破等需要巨量数据解析的尖端科研项目,为它们提供廉价且顶值的算力。

2016年,俄罗斯亿万富翁尤里·米尔纳全额出资1亿美元,由已故英国天体物理学家史蒂芬·霍金启动的大规模外星智慧生命的搜索行动-----突破聆听计划,也主要由SETI推进。

 这里的每一项研究都足以对人类社会的存续造成现实影响。而极富戏剧感的是,所有实现这一切算力的前提,竟是散落在世界各地,那些“不值一提”,甚至被主人“遗忘”的个人电脑。

BOINC的诞生

SETI所带来的分布式计算效能显现,越来越多的项目找到SETI需求算力服务。为了更多的满足这些需求,创造更好的算力体验。SETI开始迭代升级,2003年,BOINC平台诞生。

带领开发BOINC分布式计算平台的创始人,还是当年的助理教授David Anderson。只是他现在的身份变成了BOINC项目的创始人、UC伯克利大学空间科学实验室科学家。

 SETI@home、BOINC项目的发起人、UC伯克利大学空间科学实验室科学家David Anderson

BOINC(Berkeley Open Infrastructure for NetworkComputing,伯克利开放式网络计算平台)是SETI升级而成的分布式计算平台。BOINC开发很重要的一个原因是,为了吸引更多用户加入这个有实际意义的分布式计算项目中。

与SETI一脉相承,BOINC网络扮演者一个聚合、共享全球C端用户算力资源的平台,以众包分发匹配的方式为世界各地研究者提供汇集全球大量个人电脑的强大运算能力。从BOINC诞生至今的16年中,逐渐在数学、医学、天文学、气象学等领域获得落地实践。平台遍布于全世界118个国家,占全世界科学志愿计算项目算力的50%。是为全球最早的分布式计算网络,早于包括比特币在内的所有区块链分布式网络。

“当年创建BOINC主要目标是为科学家创造廉价计算能力的来源。”BOINC项目的创建人、UC伯克利大学空间科学实验室科学家David Anderson向链得得介绍。

使用自愿的家用计算机,科学实验项目每个都能够获得与当时最大超级计算机相当的计算能力。例如,使用BOINC的早期项目之一是来自牛津大学的Climateprediction.net。该项目使用BOINC的算力来预测未来100年全球气候变化。在此之前由于算力缺乏,该项目从未完成这件事。

误入云计算战场的“野蛮人”

软银创始人孙正义回顾过去30年,互联网科技行业有三件事至关重要:CPU计算能力、内存大小和通讯速度。这三件事改善了一百万倍,每一件都改善了一百万倍。对整个人类社会来说都是巨大影响。

2020年全球将有超过500亿台机器设备进行互联,超过2000亿个联网传感器产生海量数据。这个背景下,算力将使人工智能真的变为现实。

大数据应用、物联网、5G、区块链、芯片研发和智能化基础设施建设,全部依赖算力大规模的增长利用而提供的基础支撑。对未来但凡有数据处理需求的公司来说,云计算“新基建”涵盖的基础范围无可避免地将产生前者对后者算力服务的依赖。所以,云计算服务在过去五年内爆发了巨大的商业效率和价值。全球几乎所有科技巨头都没有忽视这个重大布局。

据IDC报告,全球信息数据90% 产生于最近几年。同样在2020年,40% 左右的信息会被云计算服务商收存,其中三分之一的数据具有价值。全球云计算服务占比51.8%的亚马逊AWS,作为全球最大云服务商,为亚马逊向伟大企业过度奠定了最坚实的前提。微软重获创新生机,在市值上强势回归超越苹果,最大的转变就发生在CEO纳德拉所倡导的云服务转型。从传统的Windows软件服务既有城池中,像拔指甲一样使得资源的天平陆续向微软Azure(云服务)业务转移。微软正在利用计算处理能力的B端服务向全球计算引擎这一目标持续追赶。

中国公司里,阿里云在亚太云计算市场拥有接近20%的份额,直接为阿里巴巴集团的想象空间打开了全新窗口。每当在机场巨幅海报上看到阿里云的广告语:“为了无法计算的价值”。一切尽在其中。

云计算比拼的核心之一就是计算能力,谁拥有最强、最稳定、最廉价、最易用的算力服务,谁就能在这场数据圈地运动中占尽先机。故所有云服务商都在自建部署服务器,寻找能源和土地廉价地区,以此尽可能的降低算力成本。

相比大型互联网科技巨头构建深厚城池的中心化云服务,分布式网络在细分领域拥有肉眼可见的空间。如同边缘计算对云计算的冲击,BOINC遵循着一套弯道超车的“分布式思维”。

从虚拟机到长期数据存储,中心化云依靠的是在高大IDC机房里的服务器,特别“娇贵”,对温度、湿度、静电等有专门要求。除了服务器设备、场地、能源、建筑等的巨额开支之外,大量常驻的维护人员更是一笔一般企业无法负担的成本。因此造成云计算服务或者具体说算力服务,需要收取高昂的费用,让大多数公司和技术研究项目望而却步,导致项目进程拖延,甚至落马。

物美价廉,当志愿者贡献汇集时所比拟超级计算机的算力准确投放,正是BOINC与生俱来的服务优势。不久之后,电子消费设备将拥有处理器,传感器和互联网连接,它们也是低功耗和廉价的,可被BOINC平台共享利用的。云计算非常昂贵,可当地分布式可获取的计算资源就在附近,是免费的。

在这个意义上,BOINC可被视作一类全球跨行业数据交换与协同计算的基础设施,提供新的边缘计算解决方案。

如人类史一样,计算的历史一直是集权与分权之间的冲突。之前有大型计算机,现在有中心云。它们是集中的,由一个组织控制。从长远来看,分布式方法往往会获胜。

正如曾站在美国众议院听证会上的扎克伯格,依然让众多机构及个人隐私数据的提供者、所有者惴惴不安一样。核心与机密数据安全受制于人已经成了许多企业不接受阿里云和腾讯云服务的首要理由。

思考这些因素的过程中,BOINC发起人Anderson教授团队开始关注一个想法:如何使用BOINC网络以较低的成本提供AWS(亚马逊云服务)的子集。这并不容易,Anderson教授对链得得坦言。因为BOINC主机可以随时消失,但是有一些算法可以解决这个问题。

“分布式思维”再起

BOINC系统的核心思维就是分布式。

分布式思维并非伴随区块链、边缘计算等热词而生,它发端于互联网技术最基础的原教旨思想,是互联网世界核心原则之一。

1988年的秋天,康奈尔大学一年级的研究生罗伯特·莫里斯仅用99行程序,便成功释放了当年引起大面积恐慌和伤害的蠕虫病毒,“莫里斯蠕虫”。但在达到感染高峰时,这条“蠕虫”还做了另一件事。它感染了成千上万台机器,而意想不到的是这些机器 同时在协调一致地运转。根据后来计算,莫里斯的“蠕虫”在令人难忘的短短48小时存活期间,成为史上最强大的并行计算机。这样的并行到达顶峰时,成功实现了每秒运算4000亿次的处理速度,是目前最昂贵超级计算机算力速度的两倍。

某种程度上蠕虫病毒是分布式计算的开山之祖,在那个互联网草莽年代,以一种非道德手段,利用“分布式思维”创造了一次算力巅峰。

另据链得得了解,原生深交所副总经理邹胜在离开深交所前,完成的最后一项工作,就是将深交所的数据架构和后台处理方式彻底地转为分布式结构。

新一代交易系统采用基于高速消息总线的分布式大规模并行处理架构,这种架构具有高可用性和扩展性强的特点,与纳斯达克、德国交易所等先机系统主流架构一致。该架构采用开放平台、开源技术,其基础硬件设备不再需要价格每台上亿元的大型主机,采用廉价国产普通服务器即可运行,技术成本仅为传统主机封闭平台的三分之一。

由于这样的分布式架构,深交所新一代交易系统处理速度明显快于上一代,率先解决了大规模散户市场的低时延交易。连距离深交所系统偏远的西北地区用户都得到了网络处理速度的巨大提升。

BOINC与区块链的思维渊源

中本聪在创世比特币网络时是否曾经将BOINC作为POW共识机制的思想源泉,我们不得而知。仅从时间顺序上推想,2003年就已风靡网络技术圈的BOINC平台,在分布式计算思想和算力贡献激励体系上,与2008年11月1日发布的比特币白皮书有太多吻合。

BOINC和区块链都由分布式计算机网络组成,两者都具有大量的计算能力。区别在于区块链是完全分散的并且使用P2P通信。在BOINC中,虽然计算是分布式的,但控制不是。志愿者获得 的“作业”从中央服务器发送(由项目操作),结果返回给那些服务器。所有通信都是从客户端到服务器。

“但这种联系(BOINC和区块链)将会扩大。 ”

BOINC项目的创建人Anderson教授正在促动BOINC进一步发展。在他看来BOINC是聚合计算资源的一般框架。目前工作是集中调度的,他计划将BOINC转换为具有分散通信、计算和存储的P2P网络。在这种情况下,分配计算任务(使用智能合约完成)并在BOINC网络中记录所有交易信息的区块链非常适合该场景。

另外,由于区块链和BOINC都有大量的计算能力。那么人们可以拥有一个区块链分类账,其工作量证明基于BOINC计算。在这种情况下,网络可以给贡献者们以奖励。

反观区块链行业对网络奖励的追逐,比特币POW共识机制诞生以来,关于算力“挖矿”行为导致的资源浪费、算力空转、能源空耗,质疑不绝于耳。2017年8月BCH以扩容为由对BTC的分叉,以算力控制权为依仗的权势方另立利益格局;2018年BCH自身分叉而爆发的算力大战,调用其余币种的大批算力来维系利益城池,成为当时币市继续探底的诱因之一;2019年国家发改委发布《产业结构调整指导目录(意见稿)》 将虚拟货币的挖矿活动归类为淘汰落后产能系列。在此之前,包括四川、云南、新疆、内蒙等矿业重镇在内的政府政策,都逐步将虚拟货币矿场清退。算力,作为维系行业系统运行和价值交换的基础设施,面临着权势化、商业低效化、功能单一化、收益收窄和监管政策的五类威胁。

当下基于或部分基于POW共识机制而运营的主流公链里,算力大权时刻影响着整个网络的存续和交易价格的天平。这样的算力威权一方面推动着行业的扩容和发展,另一方面也因利益格局之变随时可能爆发“算力战争”,从而裹挟行业和用户成为炮灰牺牲品。目前在区块链主流算力体系中的权力大概分为三级:(1)大型矿池联盟和大型矿机厂商集团;(2)互联网巨头和拥有大型IDC中心科技大公司,(3)主流区块链公司和零散的矿业社区。

2018年初,舆论曾短期聚焦一个问题,比特大陆一系的矿业联盟是否已经逼近或具备了对BTC网络发动51%“双花”攻击的能力?且不论发动该攻击的成本是否让攻击行为本身变得现实,即便不这么做,在一个经典去中心化网络中,因为算力霸权的形成而发展为这样一种攻击担忧,本身便打破了分布式网络存在的基础共识。以BTC扩容为借口经过基于算力霸权的利益分叉诞生了BCH,包括随后的BCH分叉都印证一个利益导向鲜明群体,在算力战争中都极易滑向道德集权的深渊。

区块链产业由于“挖矿”的兴起,进一步科普了算力的概念和作用。区块链分布式网络的声音许多来自于矿业,但不仅于此。一个合理博弈的网络首先需要几大基准利益方的参与。

设想一种可能:如果存在一个即可通过贡献算力获取挖矿收益,又可将这些算力导入实体经济和科研的社区。不让用于“挖矿”的算力空转消耗,又能高效激励社区贡献者。那么效果会怎样?

似乎也指引出了一个区块链现实结合实体产业的商业化方向:共享算力商用与超算应用。

“边缘”闲置的算力也能实体变现

目前,全球大约40个科学项目正在使用BOINC。整个网络包含超过150,000名志愿者和650,000台计算机。这些计算机每秒产生30“PetaFLOPS”的计算能力,或30亿次浮点算术运算,与世界上排名第五的超级计算机相当。如果将SETI之前运行的Folding@home项目算力计入,社区里所有志愿者的计算量比任何超级计算机都要大。

据7月30日路透社报道,CSCNT Inc.(California Super Computing Network Technology Inc),一家位于加州的初创公司,正与加州大学伯克利分校签订协议,决定合作研发以闲置算力资源为基础的云计算服务软件系统。计划将BOINC系统进行升级,引入区块链技术和通证经济模型。该项目称为“BOINC算力地球计划”。

BOINC平台创始人、UC伯克利网格计算著名科学家David Anderson教授,将主导“BOINC算力地球计划”的部分研发。

BOINC作为计算平台,对志愿者来说,它提供了一个统一的客户端程序,这个客户端本身并不进行实际的计算工作,只是提供了管理功能,在志愿者加入了 BOINC 平台上的计算项目后,客户端程序将自动下载新的任务单元,并调用相应项目的计算程序进行计算,如果参加了多个项目,它将自动在各个项目间按用户的设定来调配计算资源,在计算完成时,它还将自动地将计算结果上传,并同时取得新的计算单元。

“一切都由BOINC自动完成。” BOINC项目的创建人Anderson教授对链得得说。

BOINC定期与项目服务器通信以获取作业,下载程序和输入文件,以及上载已完成作业的输出文件。它以低优先级在后台运行作业,因此志愿者用户不会注意到任何事情。它在志愿者用户不使用时调动其GPU。志愿者可以根据需要来配置BOINC功能,例如,限制它使用的磁盘空间或内存量。

总体来说,可将BOINC视为一个系统,用于(1)尽可能多地使用计算机的容量(计算,存储,网络带宽),而无需用户注意;(2)在多个竞争项目之间公平划分资源;(3)准确计算每个项目使用的资源量。

将广泛闲置的算力“变现”BOINC生来靠近商业化需求的特征。利用低成本高计算能力的分布式共享方式,让冗余、无效、分散的算力集中发挥实体支撑价值。从创立至今,十五年过去了,全社会对于算力的需求已远不仅在科研领域如饥似渴。尽管BOINC的初衷旨在支持科学计算,其亟待扩展的商用和产业价值空间,显然超出了初心范围。任何形式的大规模分布式计算都可以借此获得显著推进,例如AI、IOT的训练和计算承载。

纵观AI众多分支领域中,最有希望的形式被认为是“深度学习”。其涉及使用数据来训练神经网络,将随着数据量和网络规模的增长而占用大量计算资源。

“当你添加自动化网络拓扑设计的目标时,我认为这是一项非常适合BOINC的重大任务。”Anderson说,人工智能中的许多方法都涉及“生物学启发”算法,这些算法可以模拟动物的进化和植物行为。整个地区都处于起步阶段,BOINC可以帮助它成长。

共享体系的三大激励原动力:兴趣、情怀和收益

如上文提到,BOINC可以在志愿者授权下管理使用其GPU的程序。所以,在之前的数年里,不断有人用BOINC来进行比特币挖掘。Anderson教授对此并不排斥,反而加深了他对Tokenlization(通证化改造)这一区块链诞生以来最具创新力的发明,产生了解和兴趣。

“在加密货币的概念中,工作证明机制(POW共识)是一种有用的计算。如科学研究,而不是无意义的散列函数。目前已经有一个Gridcoin的积分激励机制产生。我认为这是奖励志愿者(谁支付电费)和吸引新志愿者的好方法。这可以将志愿者基数提高100或1000倍,从而创造一种新的计算能力,可以彻底改变许多科学领域。”Anderson显然看到扩容社区的实操方向。

同时拥有积分实际价值出口、商业落地和变现通道、大量C端用户基础、全球社区的共享流通、易操作低门槛的算力贡献渠道、去中心化社区的自治运营、易于激励潜质的社群扩展性、高交易频率的换手需求和预期,BOINC天然具备了所有通证体系改造的基础条件。

曾在国内风靡一时的,迅雷旗下网心科技面向个人用户推出的共享计算智能硬件玩客云,以类似的思维方式做过实践。当时借助玩客云,迅雷期待无数个人用户将家中闲置带宽、计算、存储等资源分享出来,并最终被转化共享计算服务。玩客云一度被抢购一空,其众筹份额在十天内便以超额100倍的认购成功收官。链克作为玩客云体系内的流通令牌,场外交易的价格在当时难以抑制的飞涨,进而最终惊动监管层的问询关注而息声。但这次事件并未扑灭国内区块链创业者对共享计算、共享CDN业务的巨大热情,反而打开了一扇应用思路的窗口。

虽同为分布式计算、闲置资源盘活的共享逻辑,BOINC与玩客云自然有许多不同,首先,玩客云本质上是一个个人云盘,不具备GPU的计算能力。共享带宽存储的目标与BOINC的算力集成应用不同。同时,BOINC作为软件终端服务并非硬件售卖,在参与度门槛、互动性、操作性、灵活性与基础成本上具备更高的可扩展性和体验度。其次,当时链克的价值和使用出口较窄,共享带宽,在提供共享存储,帮助运行计算任务后,用户获得链克奖励,可用链克兑换有限的爱奇艺会员和星域云平台的云服务。而BOINC在既有案例中已经支撑过超百个落地科研项目案例,并可直接对接商用项目的高性价比算力服务。其通证使用场景和共识广度上具备优势空间。

最后,BOINC拥有十余年的国际社群运营,数以百万计的关联用户遍及世界各地,没有一个中心化的商业运作主体和管理者,作为一个线上终端产品也没有用户地理上的唯一归属性,且在中国市场的用户空间尚未开发。

根据BOINC STATS 2009年的统计,BOINC在中国大陆的使用率处于较低的位置。而在台湾及香港,人均贡献率均较高。积分最高的国家为美国。

为鼓励和回馈做出贡献的志愿者,BOINC的积分系统由来已久。

因为在 BOINC 平台上可以运行的项目千差万别,比如项目 A 的任务单元在某台机器里需要 3 个小时完成,而项目 B 的计算包在这台机器里需要 30 个小时才能完成,或者项目 A 本身任务包的完成时间就有一定的浮动范围,显然,用任务单元的数目来衡量用户贡献的计算量不再可行;类似的,机器性能也有差别,用完成任务单元所需的 CPU 时间来衡量工作量也是不行的。

作为一个通用的计算平台,BOINC 平台的积分系统必须通过一定的算法才能较为准确地记录用户实际完成的计算量。

对此,Anderson教授向链得得表示,“我们在信用系统上付出了很多努力,它基本上跟踪了你已经完成了多少次浮点运算。我们必须使它适用于GPU和CPU,我们必须使其防止欺骗。”

为了确保积分功能正常,Anderson教授团队在创建奖励积分的使用案例,以便价格稳定。在这方面,在BOINC上开发AWS(亚马逊云服务)样式服务并让客户使用积分购买Web服务是一种非常好的方法。此项研究试水已在进行。

此外,BOINC社群中有重多用户在激励原则上关注的并非是积分交易价值。他们更为科学的情怀激励而吸引。早期参与到BOINC网络的志愿者大多来自北美欧洲的顶级高校学生。

“这样的基础用户结构决定了大多数用户并非都重视价格。而更多地受到科学目标的激励,比如通过提供自己的算力为BOINC平台上的抗癌药物或引力波研究提供直接支持。这种成就感难以言表。”Anderson教授自豪之情溢于言表。

从寻找外形智慧生命到改变人类自身迫切面对的种种难题。BOINC的故事起源于科幻电影般的畅想,这个愿景因为汇集每一个人手里所掌控有限闲余算力而变幻出无限可能。

从商业上看,区块链、AI、云计算一侧,一场原生态的“边缘”革命恐怕已经走在了揭竿而起的路上。

从使命上看,渴望借助算力来攻克艾滋病、癌症、疟疾、气候变化等重大议题的科研实践,继续在生根发芽。(本文独家首发钛媒体  作者/李非凡)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 大陆网络用户其实也可以给科研做支持啊,如果有人引导的话

    回复 2019.09.19 · via android
  • 想象力额丰富

    回复 2019.09.20 · via android
  • 技术在进步

    回复 2019.09.19 · via pc
3

扫描下载App