记一次生产环境OOM的排查
公司有个项目,正常发版的过程中,有个自动化测试的流程,如果测试不通过,就会导致发版失败。为了测试方便,项目中留有内部访问的 REST API,仅供相关的测试代码调用。近期发版非常不稳定,经常报这些测试相关的 API 502 Bad Gateway,并且同时可能出现 Canary 实例的 OOM 报警。
公司有个项目,正常发版的过程中,有个自动化测试的流程,如果测试不通过,就会导致发版失败。为了测试方便,项目中留有内部访问的 REST API,仅供相关的测试代码调用。近期发版非常不稳定,经常报这些测试相关的 API 502 Bad Gateway,并且同时可能出现 Canary 实例的 OOM 报警。
公司开发用的虚拟机所在的机房好像屏蔽了ntp的服务端口,所有请求都会出现 no server suitable for synchronization found 错误。而我们的开发有些逻辑是要求时间误差不能太大的, 所以一定要找个方式同步时间。
当网络环境特别复杂的时候,打洞会失败,这时候流量会经过Tailscale的节点(DERP)进行中转,确保客户端之间的连接通畅
上面说的有点抽象了,下面来看具体可以解决什么问题,比如现在有[1...n]共n个点,给你一些类似(1,2)这样的数据,表示点1和点2是相互连接的,属于同一个子集。要查询总共有多少个子集,或者随便给个点m,要查m属于哪一个子集。
想象我们有一个缓存系统,里面以key-value的形式存储了很多缓存数据,但存储空间总是有限的,如果我们不断的接受请求,那么总有存满的一天。当存储空间存满了之后,我们就要通过某种方式去释放空间