【点睛ITOM】IT管理的美和未来
2019-06-26 by uino 12.3K 技术分享

I know that I know nothing.  ——苏格拉底

管理者时刻面对着不可预料的未来,安排地井井有条的计划常常会被出乎意料的变化彻底打乱。在日常的IT管理工作中,常常面对各种故障和异常事件,高水准可靠稳定的目标很难达到。其实这和真实世界里的车祸很相像:频繁发生、有时影响重大、甚至可能造成更大规模的瘫痪和恶劣的社会影响。

组织管理学大师James March在一次演讲中提到对车祸这样的观察:

假设美国的某地发生了一起交通事故,造成数人受伤:

  • 如果事故发生在佛蒙特州,那么你会看到,附近的居民继续在自己的花园里浇花,似乎不想介入别人的生活。所以,事故受伤者将一直躺在地上,但是隐私不受侵犯。

  • 如果事故发生在佛罗里达州,那么你会看到,人们会围观,安慰事故受伤者,告诉他,发生这样的事情他们是多么难过。

  • 如果事故发生在纽约州,那么你会看到,人们会和事故受伤者吵架,争论谁应该对事故负责。

  • 如果事故发生在加利福尼亚州,那么你会看到,警察会赶到事故现场,带着护理人员、先进的设备,还带着一个公共心理医生——是用来安抚目击者的。

  • 如果事故发生在爱荷华州,那么你会看到,警察会赶到事故现场,但是在这之前,附近的居民已经处理了事故,有的用自己的汽车把伤者送往了医院,有的正在清理街道。

以上各种方式都是有效的。伤者会被送到医院、道路会被清理。然而,这当中,James March认为,一种爱荷华模式不仅仅是有效的,而且是很美的。

这就好像在处理IT系统故障时,有的依赖于专业团队、有的仰仗不断优化的流程和工具、有的可以通过团队的自主协作、有的会通过开会问责互相辩解来推定故障的负责人……,故障总会以某种方式排除、系统会恢复正常。

同样的, 自主协作、化问题于无形的方式是很美的。

曾经有一个银行数据中心的处长说,有一次出现了一个严重故障,他们按照流程花了两个小时,走到了第五步,才发现了问题。一旦问题定位准确,排除还是比较容易的。他们后来被问责,为什么第五步才发现了这个问题,为什么不是第一步就做这个检查(如果那样, 就可以在十五分钟内恢复服务了)。 说起来也有点悖论,无论如何安排先后顺序,总会有先后问题。如果总能够精确感知故障发生的位置,那么故障也就不叫做故障,异常也无所谓异常,那就该叫做日程安排了。

沿着精确感知问题这样的思想,组织里往往会依赖于许多专家。专家的作用是靠广泛积累的人类经验去适应新的问题和故障出现时的机智应对,专家承担了英雄的角色。不过,IT系统和婴儿抚养有很多相近的地方,即便你已经基于过去的经验进行了尽可能完美的总结和演练,婴儿总能在意想不到的时间和场合进行一次新的哭泣,让本来已经觉得胸有成竹的父母又开始犹豫不决起来。

现代管理学科里广泛意义上对“分工”、“专业”非常依赖,似乎只要有一种保姆的分工就一定可以照看好婴儿,似乎只有分工明确、各司其职、专家汗牛充栋的组织才能处理各种异常现象,实现自信、有序的管理。

于是,许多组织在IT运维管理中,希望每个人都工作在严格确定的职责之中,更多地加班和开会,不断地演练和学习……休假甚至是外出距离范围都受到严格地限制。现代管理学里常常暗示了一种可能:通过牺牲个人的自由和创造,每个人做好自己的螺丝钉,就能让可靠和稳定成为明确可达的结果。针对这种现象,一百多年前就有位智者面对工业革命时大规模生产束缚了劳动者的创造力、降低了工人的福祉而给出了自己的看法。

在自己的劳动中不是肯定自己,而是否定自己,不是感到幸福,而是感到不幸,不是自由地发挥自己的体力和智力,而是使自己的肉体受折磨、精神遭摧残。

**——**卡尔.马克思

有的国家主张人们追求幸福是一种不证自明的基本权利。这里的不证自明更多地不是说这是真理,而更像是一种信仰。人们从事工作本身亦是追求幸福的行动之一,尤其是当我们的工作圈、亲友圈、同学圈逐渐融合在一起,我们再也无法轻易区分出痛苦的工作和幸福的生活这两种东西,工作和生活在未来是一体的。正因如此,我们找到解决问题的方法不仅仅要有效,还是美的、令人愉悦的。

回到车祸的各种处理方法,相比所有的方式,那种自主驱动的、自愈的处置方式是很美的。没有权威驱使、没有层级的限制、没有责任的争辩、没有僵化的流程,没有刻意依赖的神话,组织在自主运作的模式下运行,偶发的问题被自发地解决,重要的风险通过整体计划协作进行避免,更多的管理注意力放在了创造设计新事物上。显然,这不仅仅是有效的,同时还是美的。

在IT组织里,自主性、创造力也成为越来越重要的话题。IT领域有意思的趋势就是IT人员特别擅长革自己的命。 花了许多时间建设分布式计算系统,然后投巨资进行了大集中,做成了大集中又开始推崇区块链的分布式……; 从研发角度的汇编、C、C++、Java到 “php是很好的语言”,然后各种erlang、python、closure、Scala、golang、dart等一个个互相依靠其他编程语言的不足相互颠覆;从 C/S到 W/S 到Multi-Tier到EAI、SOA、ESB等各种精心设计的应用架构,到后来开始反对各种精心设计的重型架构推行微服务、容器化、API以至于Serverless计算……

在这样喜欢自我革命的IT领域(令人想起了法兰西第一第二第三第四第五共和国的政体浪漫主义变革)会产生许多天然的矛盾和问题:

  • 如何规划中长期的IT投资?

  • 如何选择长期的IT组织管理方法?

  • 如何看待各种技术给整个企业带来的价值和风险?

  • 如何权衡新技术带来的机遇和团队能力的学习?

  • 如何在技术复杂度不断提高的情况下维护整体的高可靠性?

  • 信息技术创新活动究竟如何对业务带来实质的价值?

  • 如何在维护稳定的考核环境里塑造创造力?

许多此类矛盾和问题都困扰着IT管理者、组织领导者、规划设计者和资深的团队负责人……很难说这些问题有一个标准答案,但管理者们很难找到深入探讨交流这些问题的机会。如今,我们试图创造一个机会给大家分享真知和洞见。

9月21日,在上海举办的2017 IT运营新动能大会,将对这些行业困难、疑惑的问题给出答案。 来自工商银行、农业银行、中国银行、招商银行、恒丰银行、光大银行、腾讯、搜狐、中国电信、中科院等数百家大型企业IT管理者/领导者,来自于优锘、灵犀、博睿、擎创、瑞迪、天旦等卓越的厂商会到场交流探讨。许多行业的资深管理者、IT领袖将发表演讲,给出自己在理论和实践上的真知灼见。大会召开在即,让我们共同期待此次大会为企业IT运维向IT运营转型提供的新动能!