【MySQL數(shù)據(jù)庫】第3章解讀:服務(wù)器性能剖析 (下)
發(fā)表時間:2023-07-16 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]容我感慨一下:DBA真的不是蓋的3.3.3使用性能剖析:有限3.4診斷簡歇性問題如系統(tǒng)偶爾停頓、慢查詢、喚影問題,盡量不要使用試錯的方式解決問題:風險大3.4.1單條查詢問題還是服務(wù)問題使用SHOW...
容我感慨一下:DBA真的不是蓋的3.3.3使用性能剖析:有限
3.4診斷簡歇性問題
如系統(tǒng)偶爾停頓、慢查詢、喚影問題,盡量不要使用試錯的方式解決問題:風險大
3.4.1單條查詢問題還是服務(wù)問題
使用SHOW GLOBAL STATUS
較高頻率:1s/次執(zhí)行該命令鋪獲數(shù)據(jù),問題出現(xiàn)通過計數(shù)器的
使用SHOW PROCESSLIST 【參考】顯示哪些線程正在運行
使用查詢?nèi)罩?/h3>
開啟慢查詢,設(shè)置全局的long_query_time=0,確認all連接采用了新設(shè)置(可能需要重置all連接使生效)
注意吞吐量突然下降時間段的日志,查詢是在完成階段才寫入到慢查詢?nèi)罩镜?/p>
好的工具事半功倍:tcpdump、pt-query-digest、Percona Server
理解發(fā)現(xiàn)的問題
可視化數(shù)據(jù):gnuplot /R(繪圖工具)
gnuplot:
安裝 一些命令: 常用技巧 入門教程 2 Gnuplot 數(shù)據(jù)可視化
建議:先使用前兩種方法,開銷低且通簡單shell腳本或反復執(zhí)行的查詢交互式收集數(shù)據(jù)
3.4.2鋪獲診斷數(shù)據(jù)
現(xiàn)間歇性問題,盡量多收集數(shù)據(jù)(不只是問題出現(xiàn)時的)
弄清楚:1、有區(qū)分 何時出現(xiàn)了問題 的方法:觸發(fā)器;2、收集診斷數(shù)據(jù)的工具
診斷觸發(fā)器
誤差:在沒有發(fā)生問題期間收集了很多診斷數(shù)據(jù),浪費時間(這個和前的、仔細讀一下 不矛盾)
漏檢:在問題出現(xiàn)時沒有鋪獲到數(shù)據(jù),錯失了機會,開始收集前確認觸發(fā)器能夠真正地識別問題
好的觸發(fā)器:
找到些能和正常時的閾值進行比較的指標
選擇一個合適的閾值:足夠高(正常時不會觸發(fā))、不能太高(問題發(fā)生時不錯過)
推薦工具pt-stalk【參考】【2】觸發(fā)器,設(shè)定到某個條件記錄 配置需監(jiān)控的變量 閾值 檢查的頻率
收集什么樣的數(shù)據(jù)
執(zhí)行時間:工作的時間和等待的時間
在需要的時間段內(nèi)收集all能收集的數(shù)據(jù)
未知問題發(fā)生的原因:1、服務(wù)器需做大量工作、導致大量消耗CPU;2、在等待資源釋放
不同的方法收集診斷數(shù)據(jù),確認原因:
1、剖析報告:確認是否有太多工作,工具:tcpdump 監(jiān)聽TCP流量 模式開閉慢查詢?nèi)罩?/p>
2、等待分析:確認是否存在大量等待,GDB堆棧跟蹤信息、show processlist ,show innodb status觀察線程、事務(wù)狀態(tài)
解釋結(jié)果數(shù)據(jù)
目的:1、問題是否真的發(fā)生了;2、是否有明顯的跳躍性變化
工具:
oprofile利用cpu硬件層面提供的性能計數(shù)器(performance counter),通過計數(shù)采樣,幫助我們從進程、函數(shù)、代碼層面找出占用cpu的"罪魁禍首"。實例【參考】
opreport命令,分別從進程和函數(shù)層面查看cpu使用情況的方法
samples %
-----------------------------------------------------
鏡像內(nèi)發(fā)生的采樣次數(shù) 采樣次數(shù)所占總采樣次數(shù)的百分比 鏡像名稱
opannotate命令可顯示代碼層面占用cpu的統(tǒng)計信息
GDB:Linux應用程序開發(fā)中,最常用的調(diào)試器是gdb(調(diào)試的對象是可執(zhí)行文件),它可以在程序中設(shè)置斷點、查看變量值、一步一步跟蹤程序的執(zhí)行過程(數(shù)據(jù)、源碼)、查看內(nèi)存、堆棧信息。利用調(diào)試器的這些功能可以方便地找出程序中存在的非語法錯誤!緟⒖肌俊緟⒖肌 語法和實例
3.4.3一個診斷案例
間歇性性能問題,具備MySQL、innodb、GNU/Linux相關(guān)知識
明確:1、問題是什么,清晰描述;2、為解決問題已做過什么操作?
開始:1、了解服務(wù)器的行為;2、梳理服務(wù)器的狀態(tài) 參數(shù)配置 軟硬件環(huán)境(pt-summary pt-mysql-summary)
不要被離題太多的各種情況分散了注意力,問題寫在紙條上,檢查一個劃掉一個
是原因還是結(jié)果???
資源變得效率低下可能的原因:
1、資源過度使用,余額不足;2、資源未被正確匹配;3、資源損壞或失靈
3.5其他剖析工具
USER_STATISTICS:一些表對數(shù)據(jù)庫活動進行測量、審計
strace:調(diào)查系統(tǒng)調(diào)用情況,使用實際時間、不可預期性、開銷的,oprofile使用花費CPU周期
小結(jié):
定義性能最有效的方法是響應時間
無法測量便無法有效優(yōu)化,性能優(yōu)化工作需要基于高質(zhì)量、全方位及完整的響應時間測量
測量的最佳開始點是應用程序,即使問題出在底層的數(shù)據(jù)庫,借助良好的測量較容易發(fā)現(xiàn)問題
大多數(shù)系統(tǒng)無法完整地測量,測量有時候也會有錯誤的結(jié)果,想辦法繞過些限制,要能意識到方法的缺陷和不確定性在哪
完整的測量會產(chǎn)生大量需要分析的數(shù)據(jù),so需要用到剖析器(最佳工具)
剖析報告:匯總信息,掩蓋和丟棄了很多細節(jié),不會告訴你缺了什么,不能完全依賴
兩種消耗時間的操作:工作或等待,almost剖析器只能測量因工作而消耗的時間,so等待分享有時候是很有用的補充,特別是cpu利用率低但工作一直無法完成的情況
優(yōu)化和提升兩回事,當繼續(xù)提升的成本超過收益時,應停止優(yōu)化
注意你的直接,思路,決策盡量基于數(shù)據(jù)
in a words:首先澄清問題、選擇合適技術(shù)、善用工具、足夠細心、邏輯清晰且堅持下去,不要把原因和結(jié)果搞混,在確定問題前不要隨便針對系統(tǒng)做變動
相關(guān)文章:
【MySQL數(shù)據(jù)庫】第二章解讀:MySQL基準測試
【MySQL數(shù)據(jù)庫】第三章解讀:服務(wù)器性能剖析(上)
以上就是【MySQL數(shù)據(jù)庫】第三章解讀:服務(wù)器性能剖析 (下)的詳細內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章!
學習教程快速掌握從入門到精通的SQL知識。