gateway 服务器cpu突然升高,原因不明

beibly

gateway进程数4,bussworkerman进程为8,2台分开部署在不同服务器上,只有gateway进程升高,workerman日志显示没有错误,只是报了个
pid:31135 Bad request for Register service. Request info(IP:.98.80., Request Buffer:
错误
查看进程追踪如下:
18:09:07.634058 recvfrom(366, "\16=\327v\r=\335q\v;\331v\17*\222\201\376\0\336\303.\36Z\270\fz;\267O<`\341"..., 65535, 0, NULL, NULL) = 65535
18:09:07.634285 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.634455 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.634595 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.634731 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.634869 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635009 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635154 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635303 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635465 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635605 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635743 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.635879 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.636025 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.636166 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.636314 sendto(11, "\0\0\1\20\3\254\32^\310'\330/4x\352\2011\0\0\1\244\1#)\0\0\0\26a:1:"..., 272, 0, NULL, 0) = 272
18:09:07.636463 sendto(11, "\0\0\1\20\3\254\32

cpu由10%突然升高30%

3004 1 0
1个回答

walkor

看起来是一直在给fd=11的资源发送数据,
使用命令 lsof -p 进程id | grep 11 能看到fd为11的数据是什么。

首先记录正常情况下各个进程占用cpu的情况,等cpu升高时确认是哪个/些进程cpu升高,然后利用strace+lsof大概能定位到。

另外看下连接数,有可能是连接数突然升高导致的,也有可能运行到了某个业务导致cpu升高。

  • beibly 2020-01-30

    谢谢,我想在问下会不会是我只改了busswokerman进程数由4改为8,但是gateway还是4的没改的影响,导致内部发送数过大时候进程异常,没改之前一直都是正常的。

年代过于久远,无法发表回答
🔝