祝贺!国信证券乾坤集中运营平台技术运营团队荣获“证券行业运维领域风云团队”奖项

2小时前 (00:02:14)阅读1回复0
wsygfsj
wsygfsj
  • 管理员
  • 注册排名5
  • 经验值66045
  • 级别管理员
  • 主题13209
  • 回复0
楼主

2022年10月28日, “GOITI 2022 IT手艺指导力年度颁奖盛典”在上海慎重举行。本次年度盛典已经是第6届了,仍然由高效运维社区(GreatOPS)和 DevOps 时代社区结合主办,相关奖项在千人手艺峰会——GOPS 全球运维大会 · 上海站的主会场慎重颁布,近百家单元出席了本次 IT 行业的浩大活动。

本次活动旨在通过对IT行业从业者、产物、企业、办事商的横向评选及表扬,鼓舞IT行业企业及IT人才继续停止手艺立异和摸索,引领IT行业手艺开展。

颁奖盛典上,GOITI 2022 IT手艺指导力年度颁奖盛典评选活动成果慎重公布。此中,国信证券股份有限公司“ 国信证券乾坤集中运营平台手艺运营团队”荣获证券行业运维范畴风云团队奖。

1

团队简介及其项目标建立布景及意义

在金融科技海潮下,微办事、云计算、大数据与人工智能等新手艺不竭涌现,国信证券乾坤集中运营平台手艺运营团队拥抱立异,引进新手艺,以客户为中心,逃求极致的办事体验,供给全方位的运行办事保障。

颠末团队成员对乾坤集中运营平台不竭地完美及优化,沿着“标准化-原则化-主动化-平台化-数字化”的开展道路,逐渐提拔手艺运营才能和办事量量,平台数智化才能已到达业界领先程度,助力公司的营业开展和手艺变化,为营业开展更好地保驾护航,并为行业同类办事供给可借鉴的优良理论。

国信证券乾坤运营平台手艺运营团队由营业办事、产物司理、架构师、软件研发、量量测试及运维SRE不变性工程师等成员构成,负责乾坤运营平台的产物设想、研发交付以及运行庇护与运营。

团队以打造不变、高效、平安、具备一流用户体验的证券营业打点和审核办事为任务;以成为行业领先的手艺运营团队为愿景;以进修、分享、协做、立异、继续改进为团队文化和价值看,持久努力于打造进修生长型和继续改进型团队。团队成员通力协做,不竭摸索及积存证券行业数字化转型过程中手艺运营的理论体味,在各自范畴内深耕专业才能的根底上,继续提拔产物办事量量,为客户供给7*24全天候、无连续优良的办事,平台可用性持久连结在99.95%以上。

乾坤集中运营平台是国信证券自主研发的集受理平台、审核平台及治理平台三大平台于一体的数字化运营平台,为投资者供给无连续的营业受理办事,包罗非现场开户、智能末端(VTM)开户等多渠道多末端开户办事、各类营业权限开通及营业材料变动办事等。立异型微办事框架下的非现场开户效率同比单体架构提拔23%以上,非现场开户数量占比不竭创出新高,为公司经纪营业展业奠基基石。

2

团队项目标建立计划

国信证券的乾坤集中运营平台是以提拔系统运行效率、降低系统运维难度、强健系统可用性以及高效迭代营业需求、提拔用户体验度为总体建立目标。将乾坤集中运营平台根据营业模块停止微办事拆分后撑持“两地三中心”摆设,多地同时供给营业办事,实现营业办事拜候主动、无冲动态切换。系统整体建立计划图如下:

图1 乾坤集中运营平台系统建立整体计划图

在系统架构层面,针对乾坤集中运营系统根底KJDP框架停止晋级,撑持微办事系统接进,具备办事治理才能,同时引进设置装备摆设中心Zebra对系统后台设置装备摆设停止同一治理。以非现场开户营业为核心微办事营业,连系行业监管要求、ISO20000原则和DevOps手艺运营标准等,从“监、管、控、析、营”五个方面,打造齐全的运维手艺治理系统,从而保障非现场开户营业办事可用性持久连结在99.95%以上。

在系统运行保障层面,乾坤集中运营平台全面实现容器化摆设,可将办事内所有Pod信息按时上报磐石CMDB治理平台,保障数据源独一、实在。并以CMDB设置装备摆设治理中心为数据一致性的根底,围绕系统监控治理、事务与变动治理、持续性治理、高可用治理、容量与成本治理、用户体验治理等手艺运营系统继续建立与完美运维东西与平台系统等系统办事保障工做。乾坤集中运营平台手艺运营系统图如下:

图2 国信证券乾坤集中运营平台手艺运营系统图

在监控治理层面,乾坤集中运营平台对接了公司级同一监控平台(包罗Prometheus,SkyWalking、扁鹊同一监控系统等),停止营业微办事性能目标监控、营业链路逃踪和营业目标监控,同时对接大数据平台停止日记摘集、解析、阐发和场景监控。所有监控产生的告警同一上报至看微事务平台,该平台可撑持根据系统、组件及告警内容停止告警收敛,根据告警级别可停止告警转事务、转问题等闭环治理,同时可将系统常见问题转为常识点,实现常识的创建、收躲、分享等功用,便于同类告警的快速定位、处理,进一步提拔团队运维才能。

在持续性治理层面,通过自主研发体例建立了倚天数据库治理平台,为数据办事供给平安保障,撑持数据库集群切换、Redis集群动态扩容等弹性操做平台化治理。乾坤集中运营平台已经实现了数据库拜候隔离、读写别离以及多事务回滚等柔性才能,同时摘用两地三中心摆设形式,多中心同时供给营业办事,营业部、审核中心以及客户接进末端可乖巧根据地区接进差别办事中心,办事反常后可主动、无冲动态切换至一般办事数据中心,为用户体验供给更高级别保障。

在容量治理层面,依托昆仑运维大数据平台停止系统根底容量、营业容量以及收集容量全方位纳管,通过引进深海性能测试平台,将消费情况营业流量在预发布情况停止回放,从而实现对营业办事全链路压测,并将各容量目标阈值动态更新至大数据容量治理平台。以自主研发体例建立并打形成本治理平台,对系统成本实现多维度、平台化治理,通过AIOps先知智能运维平台对根底性能目标和营业目标停止容量目标揣测,实现成本治理与容量治理的动态联系关系。

在办事保障层面,乾坤集中运营平台已经实现全营业办事容器化摆设,全数办事由蜂鸟容器平台停止平台化治理,撑持自定义设置弹性伸缩战略,便于根据营业办事级别定造个性化弹性战略。营业办事根据证券行业经纪营业特征,同时撑持了营业级别和接口级此外熔断、限流战略,实现定造化专属办事治理。打通凤凰预案平台与蜂鸟容器平台之间的链路,实现告警联系关系预案,提拔告警治愈或自愈才能,通过混沌尝试不竭丰富、完美各营业场景预案,进一步提拔系统抗风险才能和自愈才能。

在用户体验层面,乾坤集中运营平台抉择用户拜候低谷时间段做为变动窗口,将所有可能影响营业开展的发布变动左移,变动内容以及发布风险在变动施行前会同专家组停止线下评审,进一步确保系统可用性。关于系统呈现的任何问题均能够在企业微信群内停止反应,有一线人员实时跟踪、有专家组(开发人员、测试人员、SRE等)实时回答,团队配合保障营业顺利开展,不竭优化用户体验。

3

团队项目建立过程中碰着的难点及问题

该项目在建立过程中,碰着了两大难题,其一是证券行业内集中运营平台均摘用单体架构,尚未有容器化微办事架构的集中运营平台,可借鉴的案例几乎为零,团队面对着浩荡风险与压力。我们团队上下一心,征服重重困难,在蜂鸟云容器平台手艺支持下,连系国信证券现实营业需求情状,打通容器表里收集限造,按时上报营业办事数据至磐石CMDB治理平台,打造了合适营业开展、面向用户群体的乾坤集中运营平台,成为行业内首批经纪营业办事摘用容器化微办事架构的证券公司。

另一个难题是在单体架构到微办事架构的过渡期内,若何平衡系统的不变性与切换周期。在最后的系统建立计划中,原方案是在完成微办事建立后再停止单体架构整体迁徙,其长处是切换时间短,便于快速上线,但其切换风险不成控,无法保障系统切换后的平稳运行。在运维SRE团队屡次线下手艺交换后,确定了双架构同时运行,三数据中心分批次切换的整体计划,同时也确保了双架构并行期间营业的不变开展。

4

团队项目标系统亮点

在智能范畴不竭深耕,积极摸索智能运维场景,继续为运维人员赋能。我们团队通过 AIOps 先知智能运维平台,足够发掘其纵览汗青、揣测将来的潜力,揣测系统风险点,智能输出有“远见”的应计谋略,助力SRE团队高效保障系统不变性。

乾坤集中运营平台是从单体架构转型至微办事架构的全面庞器化的全新平台,借助 AIOps 先知智能运维平台对根底性能目标和营业目标停止了揣测,将系统容量风险左移,预判系统当前弹性战略的合理性,并提早做出应对办法。基于 AIOps 手艺,再连系汗青开户数据、节假日以及各类开户活动等影响因子,我们团队实现了对将来乾坤集中运营平台非现场开户新增量的揣测,可根据此揣测数据动态、智能造定弹性伸缩战略,以沉着应对炽热行情。如下图展现了AIOps 先知智能运维平台揣测的非现场开户新增量:

图3 乾坤集中运营平台非现场开户新增量揣测 摘集日期为20221026

引进不变性工程平台对系统停止混沌工程尝试,以发现系统单薄点进步系统强健性。自主研发了深海性能测试平台,实现了系统的全链路压测。通过引进不变性工程平台对系统停止混沌工程尝试,提早发现系统单薄点从而进步系统强健性。

乾坤集中运营平台借助深海性能测试平台,停止常态化消费流量回放式全链路压测,实现了动态更新容量目标阈值。并在消费情况营业办事中引进了混沌工程,通过预案处置将预案平台、蜂鸟云容器平台、同一主动化平台及微步继续交付平台之间打通,全面实现告警联系关系预案,预案主动触发对应主动化平台上的告警恢复战略,进一步提拔毛病处置及恢复效率。

通过 AIOps 对营业和根底设备容量揣测及阐发,建立了较为齐全的系统容量与成本治理系统。自主研发了领先行业程度的成本治理平台,实现对乾坤集中运营平台的多维度成天职析,到达与系统容量动态联系关系的才能,为业内动态治理容量与成本供给成熟理论。

通过自主研发成本治理平台,以此突破传统容量与成本的治理壁垒,从而实现系统容量成本的平台化治理。成本治理平台从数据中心维度、系统组件维度、计算、收集资本维度等多个维度,综合考量现实情状后造定了齐全的成本模子,对乾坤集中运营平台停止全方位的成天职析,根据阐发成果平台主动产出合适当前系统组件的弹性伸缩操做定见,同时平台撑持间接挪用蜂鸟云容器平台,以快速实现成本与容量动态治理。如下图为乾坤集中运营平台成本治理系统内成天职析界面,按日统计阐发,撑持揣测将来系统容量利用情状,详细如下:

图4 乾坤集中运营平台成本治理系统展现图

打造了业界领先的7*24全天候的非现场开户办事形式,为客户供给极致的开户体验。乾坤手艺运营团队为客户供给了7*24全天候、无连续的非现场开户办事,在灵敏迭代的同时,平台可用性持久连结在99.95%以上,率先实现了周末交易所测试、全网灾备练习训练期、消费情况压测期间的不连续开户,处理了行业共性问题,称心了客户便当打点开户营业的需求,为客户供给优良的利用体验,极大提拔了客户称心度。

5

团队的理论效果、功效效益及荣誉证明

近年来,国信证券继续加大信息手艺投进,手艺与治理并重,建立了完美的治理保障系统和手艺保障系统,通过继续改进的数字化运营手段,实现了运行治理的“全流程、全过程、全笼盖”管控,确保信息系统的可控、能控和在控。

通过搭建利用系统、数据库与缓存的高可用架构,继续建立与完美运维东西与平台系统,保障乾坤集中运营平台7*24小时的可用性与持续性,为用户供给了优良的办事体验。

为应对证券业市场行业颠簸性的特征,国信证券打造出混合云资本池并从营业角度动身对系统停止容量规划。在包管公司营业的根底上,团队通过深海性能测试平台、容量系统、成本平台对系统容量停止全方位治理,可沉着应对营业洪峰流量,并有效掌握乾坤集中运营平台在IT资本上的成本。

基于手艺与治理继续提拔与完美,国信证券的客户办事平台功用不竭完美,手艺运营才能继续提拔并在行业内到达领先程度,是公司数字化转型开展的强劲动力。

国信证券参与中国信通院原则评估详情如下:

重磅!国信证券通过 DevOps 手艺运营原则评估,相关项目才能到达先辈程度 燃!国信证券通过 DevOps 继续交付原则 3 级评估,相关项目才能到达国内领先程度! 燃!国信证券通过 DevOps 原则平安及风险治理评估,相关项目才能到达先辈程度!

【盛典现场】

更多关于 2022 IT手艺指导力颁奖盛典,请拜见:

荣耀时刻!2022年IT手艺指导力颁奖盛典圆满举行

0
回帖

祝贺!国信证券乾坤集中运营平台技术运营团队荣获“证券行业运维领域风云团队”奖项 期待您的回复!

取消