《洛克王国》宕机维护:AI时代学这些旧知识还有用吗?
注:感谢朋友何小凡友情赞助的素材。
事故时间线
1. 起因:S2赛季更新导致大规模登录问题
S2赛季本计划从5月20日晚10点维护至21日上午10点,但由于出现技术问题,官方在21日当天发布了延迟开服公告,导致大量玩家无法按时登录。
2. 发展:引发“暗改”和“团队换血”猜测
玩家在能进入游戏后发现多处改动未在公告中公示(即“暗改”),加上游戏内存在大量Bug,社区开始流传游戏“团队换血”、“空降关系户”等猜测。
3. 5月24日当天:官方补救与回应
- 紧急修复:官方进行了一次“不停机更新”,只要重新启动游戏客户端就能完成修复。
- 策划致歉:当晚,主策划“开水”发布长文致歉,承认是自身失误导致了这些连锁反应。
- 补偿玩家:官方赠送玩家补偿资源,持续优化。
上线 debuff 盘点
我通读了主策划发布的《开水的一封信》,去掉情怀的部分,只分析事故产生原因,我们会发现这个研发团队在疯狂叠debuff,很难不出生产事故。
debuff 1. 版本管理
- 未调整的数据遗留在发布版本中
- 已修改的问题和数据没合并至新版本
- 修复线上问题引入新的缺陷
debuff 2. 需求准入
- 排期紧张导致高速开发,测试不充分
- 修改用户已有业务和数据
- 脑补用户需求
debuff 3. 上线评估
- 缺乏上线前的功能影响评估
- 缺乏上线前的发布测试
- 缺乏上线评审机制
- 服务器的承载能力未知
其他想说的
1. 盲目扩张的风险
对于很多业务来说,扩张不是问题,扩张后接不住是大问题。就跟有些餐饮不加盟不开分店是一个思路。
他们要是先稳定在S1,把S2的上线评估流程好好走一下,内测公测稳一点儿再发,不至于这样。
可能还是太火了,想加码,加崩了。
2. 脑补用户需求的尴尬
朋友何小凡说,这事在不同平台用户反应不同,有人庆祝,有人觉得核心问题仍未解决,甚至有的平台在打拳。
我奇怪玩个游戏怎么打拳,结果是团队脑补了需求,女号战败动作是鸭子坐,男号是站着低头沮丧。部分人要求修改,他们就直接改了。改后也有人有意见。
这让我想到功能需求如何把握深度,用户没提的需求不要脑补,有需求提了再实现。因为对用户来说,增加功能比修改已有功能更容易接受。
3. 达到及格分就是好团队
之前做质量的时候,我经常陷入一种虚无感。我们对新理论、新技术孜孜以求,总想解决点技术攻坚的难题。但深入实践就会发现,及格分都很难实现。像需求管理、版本管理、发布管理、流程优化这种老生常谈的问题,能做到及格分就是优秀的团队。
就像我之前的一个困扰:当业务复杂度过高时,团队没人能提供完整的业务全量。在AI时代这个问题似乎解决了,我们可以建 domain agent,然后 agent to agent。但是问题在于,domain 知识在哪里?在每个人的脑子里。我们拿什么 to agent 呢?期待共脑吗?
所以我觉得不管有没有AI,业务能力都是王道。
4. 规律永不过时
今天跟同事讨论到,这些看起来“比较老”的知识,在AI时代还有用吗?
我觉得那些朴素的原理、规律性的知识是一直有用的;有时效性的、一过性的知识或许就可以次抛了。
比如以前我们学不同的编程语言,以后可能不用学了,实现和验证都可以直接外包给AI。但是不管提供给用户什么服务,我们都得让服务可用性满足用户需求,这种真理是不以实现形式为转移的。
很多朴素的真理,追溯起来已经很久远了,但现实的反馈是很慢的。直到现在,传统行业也有人在用古早的技术,有些官网没有SSL证书,有些网站就是简单发布信息,用户不多,既用不上分布式,也不用响应高并发。
所以我觉得,新技术、新知识就像给世界染色一样,得一点一点地染,有时候还会被反染回去。但那些描述规律、原理、底层逻辑的知识,永不过时。