搜索 | 会员  
去哪儿网自动化运维及协同办公项目案例分享
来源: CIO发展中心   作者:孙斌  日期:2016/10/31  类别:IT治理  主题:IT规划  编辑:泽雯
随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对日趋复杂的业务和多样化的用户需求,不断扩展的IT应用需要更加合理的模式来保障IT服务的灵活便捷、安全稳定

在“互联网+”、“中国制造2025”的大背景下,勇于实践,让IT技术创新,真正成为引领企业变革的有力引擎,借助IT技术创新的力量推动企业的发展,是企业CIO们的艰巨任务和使命。

为此,CIO发展中心特别邀请去哪儿网资深运维/IT总监孙斌先生和我们一起来聊一聊“互联网IT技术创新助力企业业务发展与变革——去哪儿网自动化运维及协同办公项目案例分享”。

以下内容为CIO发展中心记者根据孙斌先生的在CIO发展中心 CIO QQ群(群号:129918886)访谈整理报道。

 所谓“互联网IT技术创新助力企业业务发展与变革”

就是要“跳出思维的墙”

我认为传统行业和互联网行业应该是亲兄弟的关系,而不是竞争对手的关系。传统行业分为两部分(抛去政策垄断性企业):一是能够借互联网之力(技术+方法论等),寻求更多的发展或渠道;一是没能借力互联网,发展相对缓慢。

很多互联网的技术经过转换,可能会给传统行业带来比较大的变化,比如去哪儿,Uber,美团,Zara等等。预计,一些互联网人才会出来专门做传统行业的解决方案实施商的公司,这也算是个创业的idea.

而变革只有舍得出去,才能收获最大。人的习惯和思维模式不改变,可能很快就会被这个迅速发展的时代淘汰掉。同时,要时刻保持数据思维,数据说话,能够真实的暴露问题。这个分析方法在哪个行业都是通用的。

IT本身做出彩不容易,有时候不被理解也很正常,心一定要放开。不要惧怕互联网所带来的冲击,有挑战才有更多机会。

 去哪儿网“IT运维自动化”简言之

就是“提高单人的工作效率”、“鼓励试错”、“提倡创新”

自动化相关的系统建设是和去哪儿网公司发展阶段以及规模相关的:一是服务器数量的持续增长,一是人员的快速增长。相比这两个增长,我们规划尽量控制IT人员数量的增加,提高单人的工作效率,避免人肉战术。

去哪儿网的生产网服务器系统运维7个,网络运维3个,对应的服务器数量是3万+(包括虚拟机)和几百台的网络设备,单人运维能力是4,000台左右的服务器,Facebook是20,000台,所以还有很大的提高空间。

目前有自动化运维数据采集系统、OpsDB(运维数据源,对应行业术语是资产系统加CMDB)、自动化硬件巡检系统、监控报警系统、实时日志数据分析系统以及工作流系统等功能来辅佐运维人员和开发工程师。通过这些系统的相辅相成,能够让运维人员第一时间知道涉及问题的所有信息,系统与系统间的互通,可以大大降低人为沟通的时间成本和误差。

在IT方面,打通人(HR)—设备和系统(IT)—资金(Finance)这个链条。我们采用ldap统一认证,所有相关的内网系统的账号都会开通。比如入职去哪儿网,在HR系统Offer审批完成后,会自动创建IT系统账号。同时,在IT资产系统里会自动增加人员信息和设备资产信息,算薪系统通过Offer信息增加一条算薪记录,保证保险和工资能够及时缴纳和发放。这样这个信息链条就比较闭环,而且没有人员参与,数据入口只有一个Offer审批。

对于自动化,我们希望能够持续关注数据和创新精神。数据分析能帮我们找到目前环境里面的问题,创新方式可以think out of box,从固有的思维模式里面跳出来,我们鼓励试错,让大家的创造力能够有效发挥出来。

 去哪儿网内部协同办公工具APP

实质是各类系统的整合

随着公司的发展和人员规模的增长,2013年去哪儿网上市后,受到了资本的追捧,到了2014年,公司决定做酒店直销模式,对应招聘一线销售人员的策略开始实施。那时每个月入职几百人,最多可达到一个月入职了2,000人。这就考验着各个部门的承压能力和效率,但当时我们准备不够充分,所以很多环节都有些脱节。

在这个时候,一个良好的数据分析体系至关重要。于是,我们和HR一起合作,通过每天观察数据,分析查找问题:例如Offer平均审批时间、人员平均入职时间、IT设备平均发放时间、员工反馈类别趋势等等。

通过分析,发现最大的问题就是信息不对称:人的沟通成本和各个系统过于独立,导致数据源无法集中。对此,我们第一步做了部分信息的聚合,快速开发出较简单的HR信息系统,然后和IT信息系统打通,这样两大团队就可以共享信息。同时,因为邮件的不可跟踪性和统计的繁琐,我们取消了原有邮件沟通确认和审批的流程。

111

这样以后,人员信息和个人进度&设备查询的准确率提高了80%以上(很多必填信息,若不准确无法进入下一个环节)。大规模入职得到圆满解决,从此也拉开了去哪儿网内部系统优化的序幕,大的方向和原则就是:

1.凡在用的和未来建设的IT系统,须有接口化,留出足够的API信息来服务其他外部系统进行调用。

2.系统间的数据源要集中,保证数据源统一。

3.提高单人效率,最大化降低业务团队等待时间,保证业务团队能够得到迅速响应。

4.所有事件要完整可跟踪。

然而,虽然在实施了一段时间后,员工在工作效率和工作方式上均有了提高,但是一线人员要花费大量时间等待团队领导的审批。究其原因,在于财务预算系统只能用IE进行审批,而使用苹果Mac的领导则需要打开一个windows虚拟机再进行审批,耗时耗力。

恰逢此时,4G的普及和智能手机性能的提高带来了契机。开发一个统一的APP,既可以解决兼容性的问题,又可以移动审批减少各方面的等待时间,同时以后还能嵌入更多的功能,形成去哪儿内部系统平台的集中APP普及到全公司成为了我们在2013年到2014年的主要开发工作。

开发初版时也走了些弯路,比如原有的移动端框架总是ios崩溃和反应迟钝。后来,Facebook开源了移动端框架ReactNative,大大提高了系统的稳定性和开发效率,以及有热更新等特点。这个框架我们一直延续到现在。

 去哪儿网内部协同办公工具APP系统构架

去哪儿网内部协同办公工具APP系统构架简要图

去哪儿网内部协同办公工具APP系统构架简要图

原来使用的Rtx有三大问题:

1.服务器用的是windows server ,开放性不如Linux 。

2 .兼容性的问题,mac和linux用户无法直接使用。

3.每年的License和维护费比较高。

所以在2015年,我们开发了自己的IM系统---Qtalk。把这个功能结合到去哪儿网内部协同办公工具APP里,做到移动沟通+信息查询+审批+相关操作的集成。

222

Qtalk移动版的界面

Qtalk移动版的界面

去哪儿网的Qtalk功能和微信一样,支持语音,目前全公司8,000多人已经使用了一年多,经过了持续的功能更新,运行非常良好。

去哪儿网协同办公工具APP发现频道界面

去哪儿网协同办公工具APP发现频道界面

发现频道里面有各类的功能信息:个人信息、报销、休假、补打卡、考勤查询、审批中心、报警、watcher、临时Token、访客WiFi申请、应用树、设备管理、设备统计、应用商店等等。如果需要审批,就进入审批中心,点击之后就是如下图的界面:

 

333

 如需要查看机房流量等信息,就直接进入Watcher(自主开发的监控系统)频道进行查询,如下图:

444

此后,希望能够将此APP做成类似appstore的应用商店,每个功能都是独立的模块,这样功能才能更加丰富实用。

关于去哪儿网

去哪儿网是中国领先的无线和在线旅游平台,公司总部位于北京。我们致力于建立一个为整个旅游业价值链服务的生态系统,并通过科技来改变人们的旅行方式。去哪儿网通过其自有技术平台有效匹配旅游业的供需,满足旅游服务供应商和中国旅行者的需求。

目前去哪儿网可实时搜索约9,000家旅游代理商网站,搜索范围覆盖全球范围内超过28万条国内及国际航线、约103万家酒店、85万余条度假线路、近万个旅游景点,并且每日提供超过20万种旅游团购产品。去哪儿网移动客户端“去哪儿旅行”是中国旅行类较受欢迎的移动应用。

关于孙斌先生孙斌,32岁,现任去哪儿网资深运维/IT总监,主要负责去哪儿网所有的运维事宜以及IT信息系统的工作,目前已有6年的时间。曾就职于雅虎中国4年,任高级网络运维和数据中心运维架构师。近10年的工作经历了个人从一线运维慢慢转向技术管理,从世界级的互联网公司到土生土长的创业公司再到上市的过程。

主要带领团队:

1.OPS Team

OperationTeam主要负责去哪儿网生产网的运维工作,面向外部用户的部分,包括数据中心建设、全部的网络建设、服务器系统运维等,服务器虚拟机+实体机的量级在3万台左右,所以这个团队责任重大。

2.NOC Team

NetworkOperation Center主要负责去哪儿网365*7*24小时值班,同时负责报警通知和故障处理流程的跟进工作,Qunar对监控的要求非常严格,所以要秉承第一时间收到报警和处理问题的原则,让用户体检受到的影响最小,所以这个团队也非常重要。

3.IT Team ,

主要负责IT类的系统,比如邮件系统,资产管理系统,ITDB人员信息类系统等等,还有一部分helpdesk的工作。

4.Callcenter OPS Team

主要负责去哪儿网的语音系统的规划建设和运维的工作,比如客服电话系统10101234,以及部分的400电话和代理商电话转接等服务。

5.OPSDEV Team ,

这个团队是去哪儿网的秘密武器,主要针对以上四个团队出现的各类问题进行对应的系统开发工作。比如效率类、自动化类、流程控制类、信息传递类、成本控制类等系统。通过程序和系统化工作,能够大大降低的重复性工作以及整合各个系统的信息和数据。


德仔网尊重行业规范,每篇文章都注明有明确的作者和来源;德仔网的原创文章,请转载时务必注明文章作者和来源:德仔网;
头条那些事
大家在关注
广告那些事
我们的推荐
也许感兴趣的
干货