久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

瀏覽:2日期:2022-08-24 14:08:25

前言:

事情是醬紫的,系統(tǒng)上線兩個月后,風(fēng)平浪靜。在一個秋天寧靜的下午,老衲正喝著茶聽著歌敲著代碼,順便欣賞下妹紙,獨享這難得的愜意。突然手機響了,一看來電,心中一沉,項目經(jīng)理來電,必有蹊蹺。匆忙接起電話,沒有問候,直奔主題,“趕緊看下系統(tǒng),個別客戶反饋系統(tǒng)不能用了,先恢復(fù)系統(tǒng),再排查問題”。

老衲撂下電話,一哆嗦,趕緊連上VPN,直奔服務(wù)器主機。

PS:三臺服務(wù)器(centos、128G內(nèi)存、32核CPU),tomcat1.7,jdk1.8,通過F5負載

解決步驟:

1、top命令查看CPU占用情況

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

可以看到11042進程占用了非常多的CPU資源

2、查看F5并發(fā)曲線:為什么應(yīng)用耗費了這么多的線程,難道是用戶量突然上來了,調(diào)取了F5的訪問曲線圖,可以看到在15:57左右并發(fā)量突然猛漲,當(dāng)時根據(jù)曲線懷疑是請求量徒增導(dǎo)致

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

3、查看系統(tǒng)請求量:根據(jù)應(yīng)用系統(tǒng)日志、以及l(fā)ocalhost_access_log日志 查看此節(jié)點用戶訪問日志,發(fā)現(xiàn)使用人數(shù)并未徒增,根據(jù)請求量繪制的曲線如下:

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

可以看到曲線并未出現(xiàn)請求量徒增。

4、查看進程內(nèi)線程運行情況:沒有大量請求,為什么CPU會被使用這么多,難道是有線程的死鎖,

執(zhí)行top -p 11042 -H 查看進程內(nèi)所有線程的運行情況:

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

可以看到有很多線程正在執(zhí)行

5、接著打內(nèi)存快照執(zhí)行命令打內(nèi)存快照 在 jdk1.8.0_131/bin下面執(zhí)行 ./jstack -l 11042>log01.txt,然后又隔了一分鐘再次執(zhí)行./jstack -l 11042>log02.txt,生產(chǎn)兩個文件好對比里面的線程交集

打開日志,并未發(fā)現(xiàn)死鎖的線程,但是在兩個文件里面卻發(fā)現(xiàn)大量的GC線程在執(zhí)行如圖:

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

6、分析GC回收情況,在jdk bin目錄下執(zhí)行 ./jstat -gcutil 11042 1000 100

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

看到了沒有,虛擬機正在瘋狂的進行full GC 回收,垃圾回收線程占用了非常多的CPU資源,問題已經(jīng)有了明確的方向了,接下來需要分析到底是什么導(dǎo)致了full GC的頻繁觸發(fā)。

7、分析堆內(nèi)存:

打印堆內(nèi)存 在jdk bin目錄下執(zhí)行 ./jmap -dump:live,format=b,file=problem.bin 11042 ,將日志文件下載到本地使用jprofiler分析,

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

發(fā)現(xiàn)有大量char[],String ,map 占用,那么是什么業(yè)務(wù)代碼造成了以上大量的數(shù)據(jù)呢,打開 char[],String 沒有找到與之關(guān)聯(lián)的業(yè)務(wù)代碼, 在map中發(fā)現(xiàn)大量的相同的業(yè)務(wù)對象,但是卻無法直接發(fā)現(xiàn)出是什么操作造成了大量業(yè)務(wù)對象的存在,因為此業(yè)務(wù)對象代碼中大量使用一一排除的話工作量極大。

一時陷入困境,靈機一動,是不是還有別的內(nèi)存快照分析工具,一查有個mat,在eclipse裝好插件,打開內(nèi)存快照:

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

點擊leak suspects,如圖

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

在個給出問題中一一查看,這時問題出現(xiàn)了如圖:

解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況

BaseDatagridRest 的export導(dǎo)出數(shù)據(jù)方法,突然想到系統(tǒng)中有某個表數(shù)據(jù)的導(dǎo)出,立即登錄系統(tǒng)查看此項導(dǎo)出功能,發(fā)現(xiàn)這個導(dǎo)出未對數(shù)據(jù)量做限制,而且BaseDatagridRest 的export方法實現(xiàn)是將數(shù)據(jù)庫中的表數(shù)據(jù)抽取到內(nèi)存中然后回寫到excle中,讓用戶下載。

我登錄測試環(huán)境,用大數(shù)據(jù)量測試了下導(dǎo)出果然出現(xiàn)了同樣的問題,至此問題水落石出,解決方案很簡單,導(dǎo)出數(shù)據(jù)量加上限制,為了防止因為導(dǎo)出過慢時用戶多次點擊加上和遮罩。

總結(jié):GC不只是用來面試的,更是來解決問題的。

以上這篇解決java web應(yīng)用線上系統(tǒng)偶發(fā)宕機的情況就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: Java
相關(guān)文章:
主站蜘蛛池模板: 沂源县| 贺州市| 镇雄县| 定结县| 明水县| 什邡市| 石阡县| 加查县| 沅陵县| 宿迁市| 视频| 聂拉木县| 醴陵市| 格尔木市| 嘉峪关市| 怀化市| 南木林县| 德惠市| 龙口市| 泸定县| 峨边| 五台县| 台安县| 南召县| 平泉县| 苏尼特右旗| 许昌县| 余干县| 瓦房店市| 岳西县| 赣榆县| 江阴市| 云和县| 沈丘县| 肥西县| 麻栗坡县| 吉隆县| 安达市| 长治县| 玉溪市| 赤壁市|