返回首页
当前位置: 主页 > 网络编程 > .Net实例教程 >

项目经理所需要的重大现场作业能力

时间:2016-10-28 22:00来源:知行网www.zhixing123.cn 编辑:麦田守望者

何为项目经理的重大现场作业能力?
在这里,笔者先简单地将其概括为项目经理在项目现场面对重大事件的处理能力。在文章结尾处,笔者会对其有较为详细的解释。
为什么需要现场作业能力?
暂时先不作解释,在以下的案例中让我们一起来分析并得到这个答案。

【案例背景】
2014年12月份某日下午,G银行信用卡发卡系统发生了重大事故,影响到前端业务人员的正常个人信息网上录入;直接的影响就是消费者将会延迟拿到或激活信用卡。
G银行IT人员将事件第一时间报告给微软厂家及我司,微软专家团队及我司及时响应并立即开始了事件支持。

【处理过程】
先将本系统相关干系人梳理一下以供读者参考。
我司项目经理 – 小B;
我司项目工程师 – 小Q;
笔者 – 我司项目服务负责人;
客户方业务用户 – 小L;
客户方IT OS管理员 – 小M;
客户方IT  DB管理员 – 小N;
客户方IT负责人 – X总;
微软项目经理(负责现场协调) – 小K;
微软二线支持(负责技术支持) - 小J;

事件发生后,微软项目经理小K及嘉为工程师小Q第一时间到达现场,经过初步排查,定位到为SQL数据库的群集故障问题;由于本套系统是刚刚迁移到新群集上面不久,客户方没有对数据库作备份,上次最新的备份是到半个月之前。并且业务数据库不可访问。

客户方小M要求迅速恢复数据库群集,小N和小L要求恢复数据库保证没有数据丢失;
客户方IT对业务的恢复分为几个等级,超出每一个等级的时候将按照流程采取身上汇报的机制。
由于微软项目经理及我方工程师在下午的时间已经定位到问题所在,因而双方与客户约定了在下班后即18:00后进行故障处理。

18:00过后,微软项目经理及我方工程师开始与客户进行处理,由于微软项目经理小K一般负责资源调度与协调,在技术上无法直接支持,小K联系了微软二线由二线进行远程支持;同时小K联系了其它微软资深工程师,拿到了一些方法并给到了客户方小M不断的在尝试;我方工程师小Q在现场配合小N进行数据库方面的修复尝试。

18:30分过后,我方项目经理小B及笔者赶到现场,发现现场人员非常多;初步了解了一下,一组人在做群集方面的修复工作;一组人在做数据库方面的修复工作;还有一组业务的人不断地穿插在现场在督促;各方工作交集不多,现场气氛有些杂乱的感觉。笔者当即安排小B配合小Q先看一下数据库方面的进展。经过了解及1个多小时的努力,小B把其中最重要的一个数据库可以在另外机器上进行挂载但仍然不能确定是否数据正常。在这个过程中,笔者跟客户方X总进行了沟通交流,将现场的一些状况进行了反馈,X总希望我们尽快恢复业务,数据的话不要影响到生产运行,一些老的数据尽量恢复,如果恢复不了的话也没有关系,还有其它的方法可以处理,最重要的是业务先要跑起来。同时,笔者了解到微软二线支持这边提供的几个处理方式也没有太大的进展,群集仍然无法修复,微软二线提供的数据库修复方法也没有太大的借鉴意义,反而按我方小B的方法已经可以将一个数据库挂载取得了一定的效果;现场气氛愈发紧张,各方人员都想尽快解决问题,客户方X总虽然没有给到我们太大的压力,但能看得出内心焦灼的表情。截止到19:40,客户方帮忙给大家叫了份快餐先垫一下肚子再干;

在这个时间点,笔者跟小B作了一次全面沟通,针对现场进行了分析,发现有几个问题需要注意,

  • 现场太过混乱,信息无法进行全面对称交流;
  • 处理方法过于随意,想到哪儿做到哪儿,没有主导线路;
  • 客户方与支持方的沟通不能有效进行;

基于以上这些问题,笔者当即建议小B按如下思路进行,

  • 重新确认当前状况以及客户要求

将当前各方处理的进展进行梳理,确定客户关注的点各方理解无误;

  • 整个事件处理由我方项目经理即小B主导;

我方提供解决思路,进行人员角色分工;

  • 周期性沟通,规定每一小时进行一次客户方与支持方交流沟通;

汇报问题处理进展状况,确保方向无误,各方理解一致;

 
20:00,快餐已经送到,各方人员暂时停下来就餐。趁此机会,小B与各方进行了状况的全面了解,并抛出了笔者同小B的沟通的思路,各方人员表示没有异议并按此计划进行。微软项目经理没过多久也离开了现场,只是表示有需要可以让他们的二线继续支持。
接下来,事情得进展较为顺利,群集在新的机器上进行了重新搭建;数据库逐一能够挂载,各方人员在信息传递上保持一致。截止至11:00左右,业务已经确定可以运转,只是数据还是有部分丢失。客户方业务方、管理员及X总都松了一口气,神态也都放松下来,没有了之前的紧张表情,大家在处理的过程中有说有笑,不再像是解决问题,看起来更像是在作技术交流。

小B与小Q通过技术手段将旧数据库中的缺失数据逐一进行筛选和还原,一直持续到12:30分,还剩下几条数据是没有办法还原的,因为原有数据库里面已经损坏,再去作修复尝试其它方法还需要至少可能两个钟的时间不止。业务人员已经表示可以放弃,重新录入;客户方X总也表示了同样的观点;但,DB管理员似乎没有停下来的意思,想继续处理,看起来完全是由兴趣在驱动着行为了,有一种不达目的死不休的感觉。笔者跟业务人员侧面了解了一下,如果在继续处理下去,事件将会提升至另外一个层级,并且现在是已经可以接受了。笔者拿到这个信息后顿时大悟,怪不得之前业务人员及X总有此表示。问题是,我方的技术人员小B好像也陷到了这里面跟对方的技术一直在操作,没有关注到这些。

接下来,笔者跟小B沟通了一下表示我们在这个点上需要结束了,不能再往下进行了,小B表示理解。笔者跟对方的管理员小N进行了沟通,表示各方人员已经确认可以接受,鉴于明天一早我们的支持人员还需要来现场进行支持,今晚的支持就到此为止了,如有技术问题明天过后再进行交流。小N有些‘恋恋不舍’,但想想也没有合适的理由再纠缠下去,无奈只好到此为止了。

【总结】
写到这里,大家都明白了笔者为什么把现场作业能力作为一个课题来分析。从这个课题中我们可以总结出以下几点项目经理所需的现场作业能力。

  • 了解干系人

了解事件发生后,与哪些干系人有关,他们是否有代表在场,各方的关注点在哪里;了解了干系人之后才能有效地在现场进行角色分工和信息传递;事件主导人
在重大事件现场,像笔者描述地这个事件,由于干系人众多,大家跟进及关注点不同,解决问题的效率低下。因而,在重大项目现场,一定要树立一个事件主导人,可能是我方,也可能是其它供应商,也可能是客户方领导。事件主导人负责整个事件的跟踪与主导,进行角色分工,方案决策,沟通机制等;

  • 沟通机制

重大现场事件,需要作好有效沟通以确保各方人员的信息保持一致。建议每个项目经理在之后的现场中先定好沟通的周期,如一小时;这样确保大家理解无误,方向无误或可以及时讨论制定出更佳解决方案;

  • 需求理解

在现场处理中,一定要梳理好各方诉求,在本事件中,我们可以看到管理员与业务人员的要求其实不完全一致;因而,本着关闭事件的目的,我们应该采纳有效诉求,而非所有要求。

顶一下
(0)
0%
踩一下
(0)
0%
标签(Tag):项目经理
------分隔线----------------------------
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片