网工干货知识

超全学习笔记
当前位置:首页 > 干货知识

分布式系统中的各种故障

更新时间:2026年03月27日   作者:spoto   标签(Tag):

DSM正在实施分布式系统在一种高度分布式的系统中,不存在物理上的共享内存。这种共享模型提供了一种虚拟地址空间,该地址空间可以被多个节点共同使用。DSM系统隐藏了远程通信机制,从而保护了应用程序的编程便利性以及共享内存系统的特性。

 

具体说明如下:

方法失败:无法完成任务/目标。 
在这种类型的故障中,分布式系统通常会被暂停,无法继续执行任务。有时,这会导致整个执行过程终止,从而带来错误的结果。方法级的故障会导致系统状态偏离预期,同时,该方法也可能无法继续运行。

  • 行为/举止 
    可以认为,如果发生了诸如保护机制违反、死锁、超时、用户输入错误等情况,那么该方法就会停止执行。
  • 恢复—— 
    可以通过终止该方法或将其恢复到之前的状态来防止方法失败。

2. 系统故障: 
在系统出现故障时,与分布式系统相关的处理器无法执行相应的操作。这种情况可能是由于计算机代码错误或硬件问题导致的。硬件问题可能包括CPU、内存或总线故障。可以假设,当系统因某种故障而停止运行时,其内部状态就会丢失。

  • 行为/举止 
    它涉及到处理器的物理和逻辑单元。系统可能会出现冻结、重启的情况,同时,处理器也无法正常运作,导致系统进入空闲状态。
  • 恢复—— 
    可以通过尽快重启系统来解决问题,同时还需要确定导致故障的环节以及出现错误的原因。

3. 二级存储设备出现故障: 
据称,当无法访问存储设备中的信息时,就会发生存储设备故障。这种故障有时是由奇偶校验错误、磁头碰撞,或者介质上积聚的灰尘所导致的。

  • 行为/举止 
    存储的信息无法被访问。
  • 导致失败的错误—— 
    奇偶校验错误、头部碰撞等
  • 恢复/设计策略—— 
    从档案以及活动记录中重建相关内容。系统出现故障时,将会按照以下方式进行分类处理。
    • 认知状态失败的相关问题
    • 部分认知功能失效
    • 中断故障/故障现象
    • 一种间歇性的失败/中断

4. 通信媒介故障: 
通信介质故障通常发生在网站无法与网络中的其他正常运行的站点进行通信时。这种情况通常是由于节点故障以及人工操作系统的连接问题所导致的。

  • 行为/举止 
    一个网站无法与另一个正在运行的网站进行通信。
  • 错误/故障 – 
    节点或通信链路出现故障。
  • 恢复/设计策略—— 
    重新路由,具备抗错误的通信协议。

故障模型:

时间控制失败: 
时间延迟故障发生在系统中某个节点正确发送了响应,但该响应的到达时间比预期的时间要早或晚。这种时间延迟故障也被称为性能故障。当某个节点发送的响应时间比预期的时间要早或晚时,就会发生这种故障。

2. 响应失败
当服务器的响应存在缺陷时,就会发生响应失败的情况。响应的数值可能不正确,或者传输过程中使用了不合适的控制流程。

3. 遗漏导致的失败: 
这种被称为“无限延迟”或“遗漏失败”的定时问题,指的是节点的回复似乎从未被发送出去。

4. 碰撞故障: 
如果某个节点只遇到一次遗漏问题,之后就完全停止了响应,那么这种情况就被称作“崩溃故障”。

5. 任意的故障/故障发生的情况: 
服务器可以在任意时间产生任意的响应。

              马上抢免费试听资格
意向课程:*必选
姓名:*必填
联系方式:*必填
QQ:
思博SPOTO在线咨询

相关资讯

即刻预约

免费试听-咨询课程-获取免费资料