糟糕,老板让我设计一个亿级用户秒杀系统

个人从事电商行业十几年,经历过大大小小的促销活动和秒杀上百次,每次做秒杀瞬时访问量会翻数十倍,甚至数百倍。对系统架构是巨大的考验,期间也曾经历过系统宕机,甚至整体雪崩。

糟糕,老板让我设计一个亿级用户秒杀系统

图片来自 Pexels

那么我们怎么设计秒杀系统,才能保证秒杀系统的高性能和稳定性,同时还要保证日- ^ z Q 5 + d F常业务不受影响呢?

先看看秒杀场景特点:秒杀开始前几分钟,大量用户开始进入秒杀商品详情页面,很多人开始频繁刷新秒杀商品详情页,这时秒3 V [ i杀商品详情页访问量会猛增。

秒杀开始,( g - ]大量用户开始抢购,这时创建订e i w %单,扣库存压力会显著增大。实际上u U | ,,秒杀场景基本都是秒杀参与人多,秒杀成功的人却寥寥无几,经常是几十万人或者更多人抢几百个商品库存。

那么我们曾经是怎么设计秒杀系统的呢?主要涉及以下几个方面:

秒杀业务流程上的考虑

由于参加秒杀的商品售o C X卖价格非常低,基本都是“抢到即赚到”,成功下单后却不付款的情况非常少。

所以我们采用下单减库存的方案,下单时扣减库存,然后再进行支付。假如真有个别订单不付款怎么办?

没关系,秒杀好活动最主要的目的是吸引流量,个别订单不支付对秒杀活动本身影响不大。

况且,没支付剩下的库存还可以做为普通商品继续售卖^ r k _ O。不- J /过要注意对机器人和自动脚本的防御,后4 V y x o面会详细介绍。

页面静态化

“秒杀开始前几分钟,大量用户开始进入秒杀商品详情页面,很多人开始频繁刷新秒杀商品详情页,这时秒杀商品详情页访问量会猛增”。

如果请求全部打到后端服务,那后端服务的压力会非常大(后端服o j v P W y 5 E T务要处理业务逻辑4 f ] z 6,而且还要访问数据库,吞吐量比较低)。

考虑e 9 _ y Q到秒杀是运营同学提前安排的活动,要秒杀哪些商品、商品价格等信息在秒杀活动开始前已经确定下来。

所以我们可以把秒杀商品详情页做成静c ~ ^ ( g态页w e 8 X + z ] R 9面,把商品详情、商品价格等参数、评论评价等信息全部放在这个静态页面里,然后把x ( 4这个静态页面上传到 CDN 上预热。

CDN 是内容分发网络,可以简单理解成互联网上的巨大的缓存,用于存放静态页面、图片、视频等,可以显著提高访问速度,用 CDN 扛流量,这样大量的商品详情页的访问请求就不用访问自己的网站(源站)。A g N v z

这样既可以提高访问速度,也没有给网站增加压力,同^ p f }时也减少了网站带宽压力。

糟糕,老板让我设计一个亿级用户秒杀系统

请求拦截

前端页面,相关按钮点击后置灰,防止重复提交。L 7 L p } I / -

网关(Zuul,Nginx)层,为了, / $ ( & E避免前端恶意请求,比如一些攻击脚本,在网关层要对下单等接口按 userID 限流,几秒钟只能访问一次。

考虑到秒杀场景参与人多,秒杀成功的人极少,我们可以把绝大部分抢购下单请求在网关层直接拒掉,按秒杀失败处理。这样就极大减少了后端服务的Y 9 X ! U u C S压力。

假设秒杀库存是 200 个,我们可以只放行 200 个请求到后端服务。要注意,为了尽量避免0 7 a !库存被机器人和自动脚本抢走,200 个请0 6 ) c Z ^ D 1求不能在秒杀开始瞬间同时放行,可以分段放行。

比如秒杀开始后随机选取 100ms 内的 5 个请求放G V p行(这 100ms 内的其他请求直接拒掉,按秒杀失败处理),之后每隔 100ms 放行 5 个请求,4 秒钟可以放行完 200 个请求。

分段放行,除了限制了机器人和自动脚本,把请求分散在各个时间段,还进一步缓解了后x 1 V c r ] ) j端服务的压力。

分段放行总时间不能太长,假如每 100ms 放行 1 个b ^ b t s o b请求,放` - ; * e 0行完所有 200 个请求需要 20 秒时间,这样用户就会明显感知到下单早的人没秒杀成功,O t F n F H J下单晚的人反而秒杀成功了,用户体验会变差。

另外u 0 @ m ^ O N 9 /,秒杀过程网关压力会比较大,网关可以做成集群,多节点分摊访问压力。

糟糕,老板让我设计一个亿级用户秒杀系统

后端服务设计

如果秒杀库存只有 200,经过网关拦截,再加上采用分段放行的方式,对于后端服务基本没什么压力了,日常的后端服务就完全可以支撑秒杀活动了。不用再做更复杂的设计。

J + V Y过,假如秒杀库存有几万个[ W D 6 J E : f C,放行的下单请求就有几万个,为了用户体验放行总时间也不能! { K q U }太长,这时后端服务该怎么设计呢?

这时主要压力就在数据库了,扣减库存压力,创建订单压力。

库存可7 y z以放到 Reids 缓存中,来提高扣减库存吞吐能力。对于热点商品的库存可以利用 Redis 分片存储。

创建订单可以走异步消息队列。后端服务接到下单请求,直接放进消息队列,监听服务取出消息后,先将订单信息写入- ) G X q B Redis,每隔 100ms 或者积攒 100 条订单,批量E ~ h R *写入r ( { 2 r | T x数据库一次。

前端页面下单后定时向后端拉取订单信息,获取到订单信息后跳Y . q + { * g转到支付页面。

用这_ h x I ? A ? X O种批量异步写入数据库的方式大幅减少了数据库写入频次,从而明显降低了订单数据库写入压力。

糟糕,老板让我设计一个亿级用户秒杀系统

隔离

业务隔离

从业务上把秒杀和日常的售卖区分开来,把秒杀做为营销活动,要参与秒杀的商品需要提前报名参加活动。h n S } . j H * f

这样我们就能提前知道哪些商家哪些商品要参与秒杀,可以根据提报的商品提前生成静态页面并上传到 CDN 预热,提报的商品库存也需要提前预热,可以将商品库存在活动开始前预热到 Redis,避免秒杀开始后大量的缓存穿透。

糟糕,老板让我设计一个亿级用户秒杀系统

部署隔离

秒杀相关服务和日常服务要分组部署,不能因为秒杀出问题影响日常售卖业O O : G务。

可以申请单独的秒杀域名,从网络入口层就开始分流。网关也单独部署[ { F { 0 [,秒杀走自己单独的网关,从而避免日常网关受到影响。

秒杀可以复用订r y e = S ? ] z单,库存,支付等日常服务,只是需要一些小的改造(比如下单流程走消息队列,批量写入订单库+ r `,以及在 Redis 中扣减库存)。

糟糕,老板让我设计一个亿级用户秒杀系统

数据隔离

为了避免秒杀活动影响到日常售卖业务,Redis 缓存需要单独部署,甚至数据库也需要单独部署!数据隔离后,秒杀剩余的库存怎/ s 4 q X , A b么办?

秒杀活动结束后,剩余库存可以归还到日常库存继续做# a ~ ? 5 j为普, ? c O S 1 ` 7通商品售卖。数据隔离后,秒杀$ F w h I 3订单和日常订单不在相同的数据库,之后的订) 4 /单查询怎么展示?

可以在创建秒杀订单后发消息到消息队列,日常订单服务采取拉的方式消费消息。

这时日常订单服务是主动方,可以采用线程池的方式,根据机器的性能来增加或缩小线程池的大小,控制拉取消息的速度,来控制订单数据 K O D h库的写入压力。

网络

秒杀前要和网络运营商、CDN 服务商提前申请带宽。

还有哪c h 8 M ? &些细节要考虑:

①如何避免超卖?如果在 Redis 中扣减库存,可以利用 decr 命令扣减库) e Y _ : v存,decr 是原子操作,在分布式环境下 D _ C x u n % D也不会有并发问题,decr 扣减库存后,判断返回值,如果返回值小于 0,扣减库存失败,秒杀也就失败了。

如果9 Y h ~ 5在数据库中扣减库存可以在 where 后面加上库存大于 0 的条件,来避免库存被减成负值。这样就可以避免超卖情况发生了。

②接口防刷,前面已经提到过,在网关层对下单等接口按 userIv # $ K ~ F V cD 限流。

③网关层除了对 userID 做限流外,还要做整体限流。在实际访问量超过预估访问量时,整体限流可以起到保护作用,避免系统被压垮。

④防2 c # I止重复下单,按 userID 限流已经起到了防止重复0 1 } r X 3下单的F ! ~作用。假如限制同一个用户 10 分钟能下一次单,一般情况下 10 分钟内,商品早已经被抢光了,用户也就没有再次下单的机会了。

⑤可以结合风控系统,在网关层a f T X E把羊毛党等有问题的用户请求直接拒掉。

⑥可以在网关层上面再加一层防火墙或者高防服务,来防御 DDos 等分布式网络攻击。

上一篇

先毁小龙女,再毁赵灵儿,这是下一个刘亦菲?

下一篇

你认为《叶问2》里的洪震南能打得过《叶问4》里的万宗华吗?

你也可能喜欢

  • 暂无相关文章!

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
返回顶部