DAG的基本概念和技术 - P2P对等网络(dag技术是什么意思)
下面由小编针对DAG的基本概念和技术 | P2P对等网络为您答疑解惑,希望能给您带来有一些有效参考。
因特网是最大的计算机网络,它自诞生以来也一直存在着集中式与分布式两种不同的工作方式。
客户/服务器模式(client/server mode,简称C/S)是因特网最传统、最成熟的集中式工作模式,许多重要的因特网应用协议(如HTTP、FTP、SMTP等)采用了这一模式。
在这种集中式的模式下,服务器将一直运行,被动地等待客户的主动接人,客户将请求发给服务器,服务器返回给客户所要的信息。
客户/服务器模式在因特网的最初阶段工作得非常好,然而,随着因特网在规模上不断膨胀、在功能上不断扩展,服务器的负担越来越重,客户/服务器模式的低效率与难以扩展的缺陷暴露出来,它不再能适应需要极高效率与巨大规模的现代因特网。
1 P2P网络基本概念当传统的客户/服务器模式不再能适应现代因特网需求的时候,人们将目光重新放回到长久被忽视的分布式系统上,对等模式(Peer-to-Peer mode,简称P2P)正是在这种情况下受到重视并很快成为研究热点。
“Peer”一词在英文中的意思是“同等、对等的人”,故而“Peer-to-Peer”译为“对等(计算)”:国内很多人将P2P称作“点对点”,这是不恰当的,因为“点对点”是“point-to-Point”,和P2P不是一回事。
对等模式的本质思想在于打破传统的客户/服务器模式,让一切网络成员享有自由、平等、互联的功能,不再有客户、服务器之分,任何两个网络节点之间都能共享文件、传递消息。
图 2–9反映出从C/S到P2P的转变,Peers之间的逻辑连接构建在物理连接的基础上。
图 2–9从C/S到P2P(实线表示物理连接,虚线表示逻辑连接) 对等网络是分布式系统与计算机网络相结合的产物,是采用对等模式工作的计算机网络。
图 2–10描绘了随着分布式系统规模的扩展,分布式计算的模式相应发生的改变。
在对等网络中,每个网络节点在行为上是自由的,在功能上是平等的,在连接上是互联的,所有节点分布式地自组织成一个整体网络,因此,它能够极大程度地提高网络效率,充分利用网络带宽,开发每个网络节点的潜力。
图 2–10分布式计算模式与系统规模的关系2 P2P网络的特性P2P网络区别于其他系统的本质特点如下。
(1)网络拓扑结构严格P2P网络在网络应用层构建了一个有(严格)拓扑结构的覆盖网,覆盖网拓扑结构对于一个P2P网络具有基础性的意义,系统的其他许多机制如分布式散列表、路由、负载均衡、容错与自适应、自组织都以它为基础。
(2)节点和数据对象位置确定分布式散列表(DHT)是P2P网络的核心设施。
如图 2–11所示,它通常基于一致性散列函数,提供对于任何一个节点、数据对象在覆盖网中的位置映射。
这一点在结构化P2P网络中尤其重要,因为它保证了能够准确地定位到某个节点或者数据对象。
具体地说,如果分布式散列表采用一致性散列函数H(),对于某个网络节点(IP,Port,…),该节点在覆盖网上将有唯一对应的“节点标识”nodeID = H(IF,Fort,…),IP为节点IP地址,Port为端口号,…表示其他属性:对于某个数据对象(Key,…),它在覆盖网上也有唯一的“对象标识”objectID=H(Key,…),Key为对象关键码,…表示其他属性。
对于节点而言,nodelD确定了它的覆盖网位置,对于数据对象而言,objectID确定了它的索引信息在覆盖网上的存放位置。
图 2–11DHT在P2P系统中的位置(3)高效路由基于P2P覆盖网与分布式敢列表,P2P网络通常有适合自己的路由算法,以保证高效路由。
任意两个节点间定位所需的覆盖网路由跳数典型地为TTL(无结构网络)或log N(结构化网络),TTL(time to live)为跳数限制,N为网络节点总数。
因为覆盖网与物理网的不一致性,实际IP路由跳数会高于覆盖网路由跳数,但仍可以控制在log N的常数倍范围之内。
(4)负载均衡P2P网络使用分布式散列表将节点、数据对象分布到覆盖网上,由于它通常使用一致性散列函数,所以这种分布是均衡的:所有节点大致均匀地分布在整个覆盖网中,所有数据对象的索引大致均匀地分布在所有节点中,即使有新节点加入、旧节点离开、新对象发布、旧对象删除,一致性散列函数都能保证高效的动态调整和调整后网络仍然保持很好的负载均衡。
负载均衡是分布式系统努力追求的系统属性,它对于P2P系统的高效率、可扩展性、动态自适应具有重要意义。
(5)容错与动态自适应P2P网络是动态变化的,不断地有新节点加人、旧节点离开、新对象发布、旧对象删除,当这些发生以后,P2P网络必须有很好的自适应性,做高效的调整,以保持网络的拓扑结构、位置映射、负载均衡和路由信息的更新。
如上节所述,自适应最 重要的是更新节点状态,自适应的方法有周期性探测、按需检测、捎带确认等。
(6)行为的自由性与匿名性P2P网络是一个自由、平等的网络,两个对等节点之间做什么事情、采取什么样的行为、交换哪些信息,完全由双方自由决定。
另一方面,P2P网络中的用户是匿名的,因为分布式散列表采用安全散列函数将用户信息、数据对象信息映射到了一个表面上看起来没有任何意义的数值标识ID,这个ID唯一地代表用户和数据对象。
由于安全散列函数的单向性与抗冲突性,不可能从此ID破解出它所代表的信息。
3 P2P网络拓扑构建与维护技术P2P网络的最大特点和难点,在于它极大的动态性:不断有新节点加入、旧节点离开、节点失效等情况发生。
面对这样一个动态环境,P2P网络需要一套健全、可行的方法来处理这些情况:在新节点加人时通知其他节点新成员的到来,在旧节点离开时通知其他节点老成员的离去,而最难的是需要高效、合理地检测到节点失效并及时修复P2P网络。
下面介绍基于Gossip的P2P网络拓扑构建和维护技术。
Gossip算法又被称为反熵(Anti-Entropy),熵是物理学上的一个概念,代表杂乱无章,而反熵就是在杂乱无章中寻求一致,这充分说明了Gossip的特点:在一个有界网络中,每个节点都随机地与其他节点通信,经过一番杂乱无章的通信,最终所有节点的状态都会达成一致。
每个节点可能知道所有其他节点,也可能仅知道几个邻居节点,只要这些节可以通过网络连通,最终他们的状态都是一致的,当然这也是疫情传播的特点。
要注意到的一点是,即使有的节点因宕机而重启,有新节点加入,但经过一段时间后,这些节点的状态也会与其他节点达成一致,也就是说,Gossip天然具有分布式容错的优点。
Gossip是一个带冗余的容错算法,更进一步,Gossip是一个最终一致性算法。
虽然无法保证在某个时刻所有节点状态一致,但可以保证在”最终“所有节点一致,“最终”是一个现实中存在,但理论上无法证明的时间点。
因为Gossip不要求节点知道所有其他节点,因此又具有去中心化的特点,节点之间完全对等,不需要任何的中心节点。
实际上Gossip可以用于众多能接受“最终一致性”的领域:失败检测、路由同步、Pub/Sub、动态负载均衡。
Gossip假定同步会按照一个固定进度表执行,每个节点定期随机或是按照某种规则选择另外一个节点交换数据,消除差异。
有三种类型的反熵协议:推(push),拉(pull)和推/拉(push/pull)混合(如图 2–12所示)。
lpush: A节点将数据(key,value,version)及对应的版本号推送给B节点,B节点更新A中比自己新的数据lpull:A仅将数据key,version推送给B,B将本地比A新的数据(Key,value,version)推送给A,A更新本地lpush/pull:与pull类似,只是多了一步,A再将本地比B新的数据推送给B,B更新本地图 2–12三种类型的反熵协议如果把两个节点数据同步一次定义为一个周期,则在一个周期内,push需通信1次,pull需2次,push/pull则需3次,从效果上来讲,push/pull最好,理论上一个周期内可以使两个节点完全一致,push/pull的收敛速度是最快的。
假设每个节点通信周期都能选择(感染)一个新节点,则Gossip算法退化为一个二分查找过程,每个周期构成一个平衡二叉树,收敛速度为O(N2),对应的时间开销则为O(log N)。
这也是Gossip理论上最优的收敛速度。
但在实际情况中最优收敛速度是很难达到的,假设某个节点在第i个周期被感染的概率为pi,第i+1个周期被感染的概率为pi+1,则pull的方式:而push为:显然pull的收敛速度大于push,而每个节点在每个周期被感染的概率都是固定的p(0<p<1),因此Gossip算法是基于p的平方收敛,也成为概率收敛,这在众多的一致性算法中是非常独特的。
本文到此结束,希望对大家有所帮助。相关文章
- 美国银行业巨头摩根大通公布抗量子攻击的量子密钥分发(QKD)区块链网络的研究
- 区块链开发干货分享:共识机制(区块链笔记)
- 参加《区块链技术能力测试(初级)》培训课程并颁发专业技术能力证书
- 能源区块链研究|西门子助力区块链能源平台亮相德国
- 构建中国特色、世界一流的法学学科体系 加快设置数字法学、网络法学、人工智能法学、区块链与法律、算法规制与法律、数字经济与法律治理等交叉学科_1
- 区块链如何改变经济运行的方式?发展前景如何?
- 苹果联合创始人深耕区块链+能源近8年,旗下节能项目WOZX火爆海内外
- 不可替代型通证有望成为数字经济核心支柱
- 面向全球,智能建造区块链节点融入长安链协作网络
- 碳中和,藏着未来40年的大机遇(碳中和发展机遇)