|
本期作者姜健哔哩哔哩资深开发工程师1.背景会员购是B站2017年推出的IP消费体验服务平台,在售商品以手办、漫画、JK制服等贴合平台生态的商品为主。随着业务发展,会员购从最开始的预售,现货拓展到全款预售,盲盒,众筹等多种售卖方式,销售渠道也遍布 猫耳(现已下线),QQ小程序,漫画等多个业务渠道,再加上不断增加的营销活动玩法,每年几次大促活动的爆发式流量,对于会员购交易系统来说,无疑是一个巨大的挑战。2.性能每年的拜年纪,626(公司周年庆),919(会员购周年庆),会员购都会搞大促活动,运营会挑选一些比较热门的手办进行首发,加上提前发放红包优惠券,各种优惠活动的刺激,每次大促0点开售流量就是几百倍的爆发,早期也因为压力太多出过几次事故,所以如何优化性能,提高交易的吞吐量是首要的。2.1调用链路优化面临问题:在最初版的系统中,下单接口有明显的等待时间,用户体验不是很好,能支持的最大qps也有限如图 2-1 所示 通看分析下单调用链路发现,存在多个接口重复调用,接口全是串行调用的情况,下单接口耗时太长,达到400+ms,已经严重影响系统性能及用户体验图 2-1 初版下单链路图从链路上可以看出下单是IO密集型应用,CPU 利用率低,代码串行执行的话同步等待时间较长,为此我们重新梳理下单业务逻辑,对下单流程进行责任链模式改造,如2-2图所示2-2 下单链路简单示意图同时我们对系统做了以下优化对没有依赖的服务进行并发调用(商品/店铺/活动/用户信息等一起并发调用),如图2-3所示优化调用链减少冗余调用,推动下游服务接口改造及合并,保证一次请求下来,每个基础接口只会被调用一次,如图2-3所示设置合理的超时时间和及连接重试(200ms, 部分接口99分位上浮100%,connect连接重试)排除事务内的外部调用(服务依赖,mq,缓存)对弱依赖接口进行mq或异步调用(设置关注/缓存手机号/回滚库存优惠券等)?2-3 优化后的调用链路经过优化后的接口耗时如2-4图所示,从原来300ms降低100ms左右,效果比较显著,用户的下单体验得到较大提升2-4 下单耗时对比图2.2异步下单优化面临问题:电商活动离不开秒杀场景,通常情况下小库存秒杀做好限流的话问题不大,但拜年祭手办通常有5000个左右的库存,如2-5如图所示,属于大库存秒杀 , 限流值设得太小会严重影响用户体验 ,大库存抢购时下单qps遇到瓶颈 600+qps的时候库存服务行锁比较严重,耗时开始大幅上升,大量数据库操作占用连接数较高。2-5 拜年纪商品思考:服务器的处理能力是恒定的,就像早高峰一样,需要错峰限行,这就是我们说的削峰,对流量进行削峰不仅让服务器处理得更加平稳,也节省服务器资源。一般削峰的手段有验证码,排队等方式,这里我们主要是采用异步下单这种排队的做法。说到排队,最容易想到的就是消息队列,可以通过消息队列把两个系统模块进行解耦,对于抢购场景来说也是非常合适的,可以有效把流量通过队列来承接,然后平滑得进行处理,如图2-6所示2-6 消息队列解耦按照消息队列的排队方案,我们把整个下单流程调整为异步批量下单链路(图2-7所示) ,在合法校验过后生成订单号提交到databus消息队列 (图2-8所示),再监听databus批量拉取订单进行合并下单(图2-9所示),目前设置的是最多20个一消费,下单结果会在数据库及redis中保存。2-7异步下单链路2-8 提交下单请求至mq? 2-9 从mq消费订单消息如图2-10所示,在进入队列后,前端会提示活动火爆,正在努力下单中 ,同时在0~2秒内随机调用下单结果查询接口,轮询30秒(必须设置最大时间兜底,防止无限查询)对于合并的订单进行批量冻结库存,并行冻结优惠券,批量合并sql插入数据库,最大限度上减少性能消耗?2-10 异步下单示例图其他优化细节下单限频/限流其中对于一些弱依赖的操作直接进行降级,比如设置商铺关注,缓存手机号,记录操作日志等批量操作异常时(接口超时则fail fast),会分解为单个订单重新进行调用(库存操作会试探单库存扣减 单库存扣减成功 并发请求剩余订单,单库存扣减失败 剩余订单全部置为失败)下单结果查询走redis,异常情况降级为数据库databus异常时,直接降级为同步下单(库存服务也会做限流)databus消费者会做幂等及超时判断(订单投递时间跟当前时间差值),超过一定时间会自动抛弃,下单失败?经过改造,压测下单支持4000+tps,最终也顺利利用异步下单支撑了早期的拜年祭手办抢购,如图2-11所示2-11? ?活动抢购qps图2.3分库分表首先并不是所有表都需要进行切分,主要还是看数据的增长速度。切分后会在某种程度上提升业务的复杂度,避免"过度设计"和"过早优化"。分库分表之前,不要为分而分,先尽力去做力所能及的事情,例如:升级硬件、升级网络、垂直拆分、读写分离、索引优化等等。当数据量达到单表的瓶颈时候,再考虑分库分表。?数据量过大的风险如下:1)高负载下主从延迟严重,影响用户体验,并且对数据库备份,如果单表太大,备份时需要大量的磁盘IO和网络IO。例如1T的数据,网络传输占50MB时候,需要20000秒才能传输完毕,整个过程的风险都是比较高的2)对一个很大的表进行DDL修改时,MySQL会锁住全表,这个时间会很长,这段时间业务不能访问此表,影响很大。如果使用pt-online-schema-change,使用过程中会创建触发器和影子表,也需要很长的时间。在此操作过程中,都算为风险时间。将数据表拆分,总量减少,有助于降低这个风险。3)大表会经常访问与更新,就更有可能出现锁等待,一旦出现慢查询,风险很大,容错性很低。将数据切分,用空间换时间,变相降低访问压力,而且利用水平切分,当一个数据库出现问题时,不会影响到100%的用户,每个库只承担业务的一部分数据,这样整体的可用性就能提高?这里我们明确下分库 分表到底能解决什么问题分表:解决单表过大导致的查询效率下降(海量存储,即使索引正确也会很慢) MySQL 为了提高性能,会将表的索引装载到内存中。InnoDB buffer size 足够的情况下,其能完成全加载进内存,查询不会有问题。但是,当单表数据库到达某个量级的上限时,导致内存无法存储其索引,使得之后的 SQL 查询会产生磁盘 IO,从而导致性能下降。当然,这个还有具体的表结构的设计有关,最终导致的问题都是内存限制。这里,增加硬件配置,可能会带来立竿见影的性能提升。分库:解决Master服务器无法承受读写操作压力(高并发访问,吞吐量)?在2020年的时候,会员购随着业务发展,订单数据快速增长,基本每半年数据量就会翻倍,所有核心表均达到千万级别 大表的DDL,查询效率,健壮性都有问题 ,并且高负载下,会有较为明显的主从延迟,影响到用户体验。首先是技术选型:站在巨人的肩膀上能省力很多,目前分库分表已经有一些较为成熟的开源解决方案:阿里的TDDL,DRDS和cobar开源社区的sharding-jdbc(3.x开始已经更名为sharding-sphere)民间组织的MyCAT360的Atlas美团的zebra?这么多的分库分表中间件全部可以归结为两大类型:CLIENT模式 PROXY模式无论是CLIENT模式,还是PROXY模式。几个核心的步骤是一样的:SQL解析,重写,路由,执行,结果归并。经过讨论大家更倾向于CLIENT模式,架构简单,性能损耗较小,运维成本低,而且目前部分项目中都已经被引入shardingjdbc,并且部分模块已经在使用其分库分表功能,网上文档丰富,框架比较成熟 。选择sharding key:sharding column的选取是很重要的,sharding column选择的好坏将直接决定整个分库分表方案最终是否成功。sharding column的选取跟业务强相关,选择sharding column的方法最主要分析你的API流量,优先考虑流量大的API,将流量比较大的API对应的SQL提取出来,将这些SQL共同的条件作为sharding column 例如一般的OLTP系统都是对用户提供服务,这些API对应的SQL都有条件用户ID,那么,用户ID就是非常好的sharding column。非sharding column查询该怎么办??1. 建立非sharding column属性到sharding column的映射关系 ?2. 双写冗余全量数据(不需要二次查询)3. 数据异构(TIDB,ES,HIVE等,应对复杂条件查询,近实时或离线查询) ?4. 基因融合(比如订单号里融合mid基因,最新的订单号规则:orderId+mid%512 比如4004164057659338)?切分策略:1.范围切分比如按照时间区间或ID区间来切分,如图3-1所示,优点:单表大小可控,天然水平扩展。缺点:无法解决集中写入瓶颈的问题。3-1 范围切分2.Hash切分如图3-2所示,如果希望一劳永逸或者是易于水平扩展的,还是推荐采用mod 2^n这种一致性Hash??3-2 Hash切分3.会员购交易切分策略如图3-3所示,切分键选择:mid 和 order_id相关根据 mid 分表,使用新的orderid 生成规则,orderid 融入(mid%512)库表数量:4个集群(主从),每个集群4个库,每个库16张表,总计256张表库路由策略:mid %16表路由策略:(mid%512)/32公式:中间变量 = MID % (库数量*表数量)库路由 = 中间变量 % 库数量表路由 = 取整(中间变量 /库数量)?3-3 库表策略示意图我们采用的是不清洗老数据的方式,好处是老的订单数据依然走老库,这样能节省一部分清洗数据的工作量梳理sql:项目中的sql有些是不满足分片条件的,所以我们是要提前梳理项目中的sql的1.通过 druid 界面 可以统计到所有运行的 sql2.配合静态扫描sql工具3.DBA 拉取 SQL4.人工查看代码 当梳理出对应所有 SQL针对没有分片键的SQL进行改造,不确定的SQL进行验证,不支持的SQL给出处理方式当然如何进行迁移也是很重要的步骤,我们是采用下面的步骤,如图3-4所示历史数据归档,不做迁移,老数据修改依旧路由到老库切读写请求,即将读写流量请求引入到新系统中回写数据,binlog 监听新数据库回写到老系统中,并进行校验??3-4 不停机迁移示意图最后总结下整个分库分表的步骤1.根据容量(当前容量和增长量)评估分库分表个数?2.选key(均匀)3.分表规则(hash或range等)4.梳理sql并验证5.执行(一般双写) ?在整个交易系统完成分库分表后,彻底解决了数据库的瓶颈问题,历经多次大促压测突发流量等场景都没有出问题,保障了整个平台系统的稳定性。3.总结在经过调研链路优化,异步下单改造,数据库分库分表后,整个交易系统的性能得到了较大的提升,也较为顺利得支撑了历次大促活动,后续我们也会继续对一些历史系统(比如票务系统)进行改造升级来提升用户体验。开发者问答你知道在秒杀场景下还有哪些优化方案吗?欢迎在留言区告诉我们。转发并留言,小编将选取1则最有价值的评论,送出小电视校园系列金属徽章两只(见下图)。2月6日中午12点开奖。如果喜欢本期内容的话,欢迎点个“在看”吧!往期精彩指路浅谈B站效果广告在线推理服务的性能优化常用性能优化手段及在风控系统中的应用直播房间服务基于CQRS的架构演进实践
|
|