网络运营 可以从阿波罗 13 号——NASA 最成功的失败中学到什么

在脸书上分享
分享到Twitter
分享到linkedin
通过电子邮件分享
在脸书上分享
分享到Twitter
分享到linkedin
通过电子邮件分享

今年是三位美国英雄从一艘在南太平洋汹涌澎湃中漂浮的残缺航天器中爬出五十周年。这些英雄是宇航员吉姆·洛弗尔、杰克·斯威格特和弗雷德·海斯。他们的任务——阿波罗 13 号——最终被称为美国宇航局“最成功的失败”。 

这次任务失败了,因为机组人员无法完成他们的主要目标:登陆月球。但它是成功的,因为在他们的飞船遭遇氧气罐爆炸 87 小时后,三个人都活着离开了。 

将这个命运多舛的任务与典型的网络运营中心的情况相提并论的想法很容易被人嘲笑。 (我妻子做到了。)毕竟,故障排除和修理一艘以每小时数千英里的速度穿越太空的船只所涉及的戏剧性是无与伦比的。尽管如此,如果您的网络现在正在支持我们的关键医疗保健基础设施,那么可以毫不夸张地说,您在停电期间的刻意行动可以挽救生命。 

考虑到这一点,我想谈谈在阿波罗 13 号任务期间采取的关键行动,以及我们作为网络运营商可以从他们身上学到什么。

将 Apollo 13 课程应用于 NetOps

1. 总是过度沟通

“休斯顿,我们这里有问题。”杰克·斯威格特 (Jack Swigert) 说出的这些话是任务控制中心第一个表明他们的宇航员遇到麻烦的迹象。例行维护——我们在 NOC 中称之为“非服务影响”——引发了一系列事件,这些事件将推动船员、他们的船只和负责将他们带回家的地面专家的极限。 

这说明了任何重大停电响应中最重要的部分之一:通信。当他们的飞船突然被一连串的爆炸声、震动声和警告灯所困扰时,斯威格特和他的船员们知道他们的生存取决于地面上的聪明人。在检测到问题的那一刻让这些人“参与其中”,并在最初的关键时刻继续向他们提供更新,很可能挽救了他们的生命。

一次重大的网络中断可能会让人感到压力重重、迷失方向。在您自己的一连串刘海、摇晃和警告灯中,您的首要任务是识别、隔离和修复损坏的任何东西。让它独自消耗你所有的能量是很容易的。就像阿波罗 13 号的宇航员一样,您很可能拥有一支“实地”专家团队,可以帮助您恢复网络。现在不是“看看你能做什么”的时候。 

当分秒必争时,您希望确保组织中可以提供帮助或可能有洞察力的每个人都尽快了解并参与其中。洞察力可能来自您意想不到的地方,这就是为什么过度分享总是比分享不足要好。 

简而言之:如果您遇到重大问题,与您的团队的沟通应该是响亮、清晰和即时的。

2. 做一个清单 

2 号氧气罐爆炸后需要立即解决的首要问题之一是指令舱(载有宇航员的飞船的锥形部分)正在迅速失去动力。在阿波罗 13 号任务中,就像之前的阿波罗任务一样,电力是通过燃料电池产生的。这些电池使用氧气和氢气为一系列电池充电,进而为从机舱灯到关键通信和导航设备的所有设备供电。 

随着氧气罐的丢失,这些燃料电池停止工作,使电池处于快速放电状态。在船员们陷入黑暗之前还有几分钟的空闲时间,他们发现自己被一些实际上相当平凡的东西拯救了:清单。

由于电力是如此重要的网上十大正规赌网址大全,NASA 已经制定了一项计划,以在燃料电池出现故障时对其进行保护。在发现断电情况后,立即向机组人员提供了要关闭的非关键系统的清单以及关闭的顺序。通过关闭这些不重要的系统,电源只保留给最重要的仪器。

3. 提前准备(但要准备好即兴发挥) 

任何灾难响应的成败在很大程度上取决于准备工作。通过消除我们的恐惧并想象我们的最坏情况,我们可以制定政策和程序,以便在发生此类灾难时可以启动。制定这些政策并定期针对它们进行“防火演习”是确保您准备好在最坏情况发生时采取行动的最佳方法之一。

不幸的是,不可能预见到您可能遇到的每一个障碍。阿波罗 13 号就是这种情况。 由于指令舱处于生命支持状态,机组人员被迫改造月球舱,这是一种设计用于在短短 20 小时内运送两名男子往返月球表面的工艺,作为他们的救生艇80 多个小时的飞行返回地球。 

必要的程序包括启动月球模块下降引擎以进行航向修正,该引擎设计用于完全不同的目的,尽管机载导航设备已关闭且无用。宇航员还被迫使用管道胶带和飞行计划小册子的硬纸板封面等用品改装指挥舱空气过滤器以用于登月舱。 

4. 培养卓越文化 

引用 阿波罗 13 号审查委员会报告, “事故被认为几乎是灾难性的。只有机组人员、任务控制中心和支持行动的团队其他成员表现出色,才能成功地将机组人员送回地球。” 

这些话掩盖了美国宇航局男男女女克服的深刻挑战,其中许多人当时在航空航天工程领域没有先例。最终,是庞大的工程师团队解决问题、批判性思维和协作,他们都是技术专家,拯救了船员。

没有哪个组织比 NASA 在 1960 年代更能体现卓越文化。以他们为榜样,今天的国家石油公司应该采取“顽固的自我批评”的姿态,确保我们从错误中吸取教训。 

更好的是,通过在追求知识的过程中不断挑战自己,并致力于自我提升,我们可以完全避免不幸。历史证明,对于拥有单一统一愿景的专业专家团队来说,几乎没有什么是不可能的。

5. 记录一切

随着阿波罗 13 号传奇的尘埃落定,机组人员安全返回地球,美国宇航局终于有幸问了一个最重要的问题:“到底发生了什么?”这个问题不是纯粹的学术问题。如果一个氧气罐在这次任务中爆炸了,是什么阻止了下一个爆炸? 

美国宇航局不懈地寻求答案,并最终发现了这场灾难本可以避免而无法避免的几个关键点。完整的技术细节超出了我们今天所讨论的范围,但部分原因是发现有故障的氧气罐在首次进入太空前两年就被扔到了装配线上。它只下降了两英寸,随后经过测试并获准飞行。经过这么长时间才能发现这个细节,这证明了 NASA 非常擅长的事情:记录。

在操作网络的过程中,有很多情况可能会在文档上偷工减料。这是我们最平凡的任务之一,当您所有的灯都是绿色时,很容易自满。别!最看似无害的细节可以在能够说“这就是为什么它失败了,这就是它永远不会再发生的原因”之间产生差异。或者“哎呀,我不知道。”记录一切!

阿波罗 13 号的事件永远塑造了 NASA 的运作方式,从测试和合规性,到空对地通信,再到灾难响应和恢复。停电可能而且将会发生。在此之前、之中和之后,我们的深思熟虑的行为将塑造您的声誉、您公司的声誉以及最终用户的结果。我们每个人都有责任将自己的宇航员带回家,无论他们身在何处。

Garrett Williamson

Garrett Williamson 是 TelNet Worldwide 的网络运营技术员。 Garrett 在密歇根东南部安家,对 IP 网络、新兴技术和澳大利亚牧羊犬充满热情。

发现更多...

订阅我们的新闻
网上十大网赌娱乐大全
我们该怎样帮助你?

单击以与团队成员聊天。

获取报价。
No Strings Attached.

想知道我们的功能、计划和定价如何适合您的业务?没有比与我们的网上十大网赌娱乐大全专家交谈并获得免费报价更好的学习方式了!