听说这里有各大云厂商的客服,那就吐槽一下.
事情的起因是 23 日凌晨有同事反应, 从阿里云国际马尼拉机房访问 GCLB 的 https api 经常出现请求失败.
后来查了一下,网路延迟,traceroute 都正常.
然后搞了并发测试脚本, 120 并发, 3000 次请求, 在开始的 3 秒钟一切正常,之后就开始连续的 tls handshake timeout .
这是 gclb 出问题了,不能吧.
然后在 AWS 新加坡机房 新建机器, 跑同一个测试脚本,连续 10 轮,未复现.
然后在 LightNode 马尼拉机房 新建机器, 跑同一个测试脚本,连续 10 轮,未复现.
开始是怀疑 GCLB 做了策略调整, 后来在 腾讯云新加坡机房新建节点,部署测试 https api, 结果挺有意思:
阿里云国际马尼拉机房=> 腾讯云新加坡 == tls handshake timeout
AWS 新加坡机房 => 腾讯云新加坡 == 一切正常
LightNode 马尼拉机房=> 腾讯云新加坡 == 一切正常
对比样本太少? 好的,测一下苹果的 hotspot 测试页: https://captive.apple.com/hotspot-detect.html 结果一样:
阿里云国际马尼拉机房=> 苹果的 hotspot == tls handshake timeout
AWS 新加坡机房 => 苹果的 hotspot == 一切正常
LightNode 马尼拉机房=> 苹果的 hotspot == 一切正常
有阿里的客服或工程师,麻烦帮忙排查一下, 或者同学们要注意避坑了.