新闻资讯

新闻资讯 行业动态

DevOps三步工作法(三)——持续学习与实验原则

编辑:008     时间:2020-02-22

第一步建立了从左到右的工作流,第二步建立了从右到左的快速且持续的反馈机制,第三步则是要建立持续学习与实验的组织文化。

通过应用三步工作法,能持续提升组织中个人的技能,并把这些技能转化为团队和组织的财富。

在制造业的生产流程中,由于存在系统性的质量和安全问题,往往需要严格定义并完成工作内容。

比如前面提到的通用汽车的工厂,工人没有对日常工作进行改进,也没有从问题中学习,工人提出的建议,领导也没有采纳。

在这种的工作环境中,往往弥漫着恐惧与不信任感。

恐惧是由于工人犯错时会收到惩罚,提出建议的工人则被看作是告密者或多管闲事。

出现问题后,领导层往往会向上级隐瞒实情,甚至惩罚导致问题的工人,这些现象导致产品的质量和安全问题进一步恶化。

而在高绩效的组织中,人们积极学习,工作不是严格定义的,工作系统是动态的。

生产线的工人在日常工作中,可以通过实验做出新的改进,当改进有效时,就会被纳入标准化文档中。

技术价值流的核心是建立高度信任的文化,强调每个人都是持续学习者,要在日常工作中承担风险。

通过科学的方式改进生产流程和产品,从成功和失败中积累经验。

此外,局部的经验将快速转化为全局的改进,帮助整个组织尝试和实践新技术。

要做到这一点,就要为改进工作预留时间,不能把所有的时间都放在生产工作上,比如 Google 就有 20% 的个人时间的文化。

在风险可控的情况下,我们可以通过在生产环境中模拟故障,增长系统的弹性(Resilience)。

建立持续学习的文化,能帮助团队快速适应不断变化的环境,让企业能在市场竞争中脱颖而出。

1.1 建立学习型组织和安全文化

避免事故复发的关键,就是消除恐惧、消除指责,让组织自我诊断和自我优化,更好地定位和解决问题。

在复杂系统中工作时,精确地预测结果是不现实的,即使我们做到了未雨绸缪、小心谨慎地做事,还是有可能会遇到意外,甚至是灾难性的事故。

当我们努力查明意外发生的根本原因时,很多管理层的做事就是会把问题归结在人身上,对这个人进行点名批评。

而在 Sidney Dekker 博士定义的安全文化的关键要素中,提到了“正义文化”这个概念。

Sidney 博士的看法是:

不公正的事故和意外处理方式,会阻碍安全调查,让安全工作者感到恐惧,让整个组织变得官僚主义,导致信息封闭、逃避责任和滋生保全自我的意识。

而在技术价值流中,这个问题更突出,技术类工作是在复杂系统中进行的。

管理层对导致事故的人员进行惩罚,会让组织成员变得恐惧,结果就是后续出现问题时,大家都知情不报,最终导致下一个灾难性事故。

Ron Westrum 博士,是研究企业文化中安全与绩效重要性的鼻祖之一。

Ron 博士曾指出,在医疗机构中,患者的生命安全依赖于医疗机构的“生机文化”,生机文化是他定义的三种文化类型之一。

  • 病态型

    病态型组织的特点,是组织中存在大量恐惧与威胁,由于政治原因,个体为了保护自身利益,通常会隐瞒真相或扭曲事实。

    在病态型组织中,故障和事故往往往会被隐瞒。

  • 官僚型

    官僚型组织的特点,是规则和流程僵化,所有部分都是自扫门前雪。

    在官僚型组织中,往往用的是恩威并施的方式,通过评判系统处理事故。

  • 生机型

    生机型组织的特点,是积极探索和分享信息,让组织更好地履行使命。

    在生机型组织中,整个价值流中的所有员工,共同承担责任,对事故进行积极反思,群策群力找出问题的根本原因。

病态型 官僚型 生机型
隐瞒信息 忽略信息 探索信息
消灭信使 忽略信使 培养信使
逃避责任 各自承担责任 共同承担责任
阻碍团队互动 容忍团队互动 鼓励团队互动
隐瞒事故 对事故宽容 调查事故根本原因
压制创新 忽略创新 鼓励创新

在技术价值流中,高度信任的生机型文化对于组织的绩效也来带来正面影响。

通过努力打造安全的工作系统,就能建立起生机文化的基础。

在发生事故时,我们要重点关注如何重新设计系统,以防止事故复发,而不是追究人的问题。

比如在每次事故发生后,进行不指责的回顾,对事故发生的原因和过程,做出客观的解释,并一起讨论优化系统的最佳措施。

当我们不再因为事故而指责某人,员工就不会对工作中的失误感到恐惧,消除了恐惧,组织中就能充满坦诚,而坦诚是预防事故的重要因素。

1.2 标准化日常工作的改进

比工作更重要的,是对日常工作的持续改进。

如果团队没有能力或意愿改进现有的工作流程,就会持续遭受眼前问题的折磨,而且问题带来的麻烦往往会与日俱增。

Mike Rother 在《丰田套路》一书中指出,就算我们不去优化工作的现状,流程也不会一成不变,混乱和无序的流程,会随着时间的推移持续恶化。

在技术价值流中,为了防止灾难性事故的发生,团队陷于实施各种临时解决方案的工作中,没有时间完成有价值的工作。

用临时方案解决问题的模式,往往会导致问题和技术债务的积累。

在每个开发周期的间歇中预留一段时间,或让工程师通过自组团队的方式,解决他们感兴趣的问题。

明确预留实践改善日常工作,包括偿还技术债、修复缺陷、重构、优化代码和环境。

通过采取改善措施,所有人都能在可控的范围内,发现和修复问题,及时发现存在的问题,不仅能降低解决问题的成本,而且系统承担的风险也会更小。

一旦改善在局部范围内取得成果,就应该把它分享给组织里的其他人,让更多人从中受益。

当某个团队或个人,获得了独有的专业知识或经验时,我们要把他们获得的隐形知识,也就是很难通过文档传递的知识,转化为显性知识,从而帮助组织内的其他人吸取这些专业知识,并在实践中应用。

在技术价值流中,我们可以把事故的解决方案,转化为可搜索的知识库,让有需要的团队,能更方便地使用它解决类似的问题。

1.3 注入弹性

低绩效组织的特点,是整天想着怎么缓解问题,比如为了降低人员空闲,浪费人力的风险,管理者就在每个工作重心存放大量的在制品。

又比如为了降低由于机械故障导致的生产中断的风险,管理者可能会通过购买更多设备、雇用更多员工,或扩大厂房等方式增加产能,这些做法导致企业的成本增加了。

而高绩效组织则会通过改善日常运营,持续引入张力提高生产效率,同时在系统中注入更大的弹性,实现更好的结果。

那什么是注入更大的弹性呢?假如现在有一家工厂,工厂现在有两条生产线。

每条生产线每天能产出 100 个单位的产品,在订单不紧急时,把所有的生产任务,发送到其中一条生产线上,尝试用不同发的方式增加产量、识别生产流程中的瓶颈。

如果这条生产线由于过载而发生故障,他们就会把任务发往另一条生产线。

通过在日常工作中,持续不断地进行改善试验,他们能持续提高产能,而且不需要增加任何新设备或人员。

这种改善实验,不仅提高了生产效率,而且还提高了弹性,因为组织总是处于紧张和变化的状态,这种通过加压的方式增强生产弹性的做法,被称为抗脆弱性(Antifragility)。

在技术价值流中,通过缩短部署的前置时间、提高测试覆盖率、缩短测试执行时间、对技术架构进行解耦等。

这些方式,都属于在系统中引入张力,都能提高开发人员的生产效率和可靠性。

还可以通过演习的方式,预先演习大规模故障,比如关闭某个数据中心,或者在生产环境中注入大规模故障,验证系统的可靠性是否达到预期。

比如 Netflix 著名的“捣乱猴”,捣乱猴会随机杀死生产环境中的进程和服务器,以验证系统的可靠性是否达到预期。

1.4 强化学习文化

在传统的管理模式中,领导者负责制定目标、分配资源、建立正确的激励机制,还要为组织建立情感基调,也就是领导者负责做出所有正确决定。

而在 DevOps 的组织中,领导者和员工的共同努力都是不可获取的,领导者不会亲自制定一线工作中遇到问题的解决方案,而是由一线的员工自己决定。

领导者要强调的是解决问题的能力,以及学习的价值,Mike Rother 在“教练套路(Coaching Kata)”中规范化了强调的方法。

在企业战略目标的指导下,组织内建立相互嵌套的迭代短期目标,然后在价值流或工作中心设立目标条件,比如接下来的两周内,缩短 10% 的前置时间。

这些目标条件,构成了科学实验的框架:清晰的描述要解决的问题,对解决方案所做的假设,验证假设的方法,对结果的解释,以及如何利用经验进行下一个迭代。

领导者可以用下面几个问题,帮助和辅导改善实验者:

  • 上一步做了什么?发生了什么?
  • 你从中学到了什么?
  • 现状如何?
  • 下一个目标条件是什么?
  • 当前工作有什么阻碍?
  • 下一步做什么?
  • 期望的结果是什么?
  • 什么时候进行复查?

领导者帮助一线工作者,在日常工作中识别和解决问题,这种指导方法是丰田生产系统的核心。

丰田之所以是优秀的组织,根本原因在于他们不断向员工传授这种独特的行为准则。

在技术价值流中,这种实验和迭代改进的方法,能指导我们改进内部流程,保证构建的产品能为内部和外部客户带来价值。

1.5 小结

三步工作法的持续学习与实验原则能帮助我们实现学习型组织,实现职能部门之间的高度信任和跨部门合作。

让我们接受了“复杂系统总会发生故障”的事实,鼓励讨论任何问题,以建立一个安全的工作系统。

该原则还要要求把日常工作的改善标准化,把局部成果转化为可供全局使用和学习的知识,以及不断向日常工作中注入弹性。

第三步原则与第一步和第二步的工作法密不可分,要实现工作的快速流动和快速且持续的反馈,需要使用迭代和实验的方法进行。

包括设立目标条件,说明设想的解决方案,设计和进行实验,以及评估结果。

第三步工作法的成果不仅能让我们获得高绩效,而且还提升了生产弹性、员工工作满意度以及组织的适应能力。



原文链接:https://juejin.im/post/5e4e472ce51d45270c277a63
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

回复列表

相关推荐