官术网_书友最值得收藏!

  • 可觀測(cè)性工程
  • (美)夏麗蒂·梅杰斯等
  • 1687字
  • 2023-11-10 17:32:27

推薦序二

為什么我們要了解可觀測(cè)性工程

第一次工業(yè)革命的基礎(chǔ)是蒸汽動(dòng)力的發(fā)明,第二次工業(yè)革命的基礎(chǔ)是電力驅(qū)動(dòng)的發(fā)明,那么當(dāng)前信息革命最大的基礎(chǔ)就是互聯(lián)網(wǎng)驅(qū)動(dòng)的數(shù)字革命,而互聯(lián)網(wǎng)還在各行各業(yè)不斷滲透,已經(jīng)成為整個(gè)社會(huì)和人類(lèi)進(jìn)步的基本因素。

如今各行各業(yè)都在快速互聯(lián)網(wǎng)化,未來(lái)不僅僅是傳統(tǒng)意義上的互聯(lián)網(wǎng)公司提供互聯(lián)網(wǎng)應(yīng)用,每一個(gè)行業(yè)都會(huì)變成互聯(lián)網(wǎng)應(yīng)用。在零售行業(yè),不僅僅只是線下門(mén)店、APP、小程序、數(shù)字門(mén)店、電商,整個(gè)零售行業(yè)都變成了一個(gè)互聯(lián)網(wǎng)應(yīng)用。在汽車(chē)行業(yè),我們看到新能源汽車(chē)的蓬勃發(fā)展,但更要看到所有的汽車(chē)都變成了互聯(lián)網(wǎng)汽車(chē),每一輛車(chē)都是聯(lián)網(wǎng)的,汽車(chē)本身從傳統(tǒng)的硬件變成了某種情況下的軟件,成為互聯(lián)網(wǎng)應(yīng)用。政府和醫(yī)院也開(kāi)始互聯(lián)網(wǎng)化,我們現(xiàn)在可以通過(guò)線上平臺(tái)、便民APP或小程序使用各種公共服務(wù),這些服務(wù)也變成了一個(gè)個(gè)互聯(lián)網(wǎng)應(yīng)用。可見(jiàn),越來(lái)越多的產(chǎn)業(yè)都在發(fā)生這樣的變化。

在互聯(lián)網(wǎng)化的巨大業(yè)務(wù)需求下,整個(gè)IT基礎(chǔ)設(shè)施正發(fā)生重大變化——從傳統(tǒng)的單體應(yīng)用逐步向微服務(wù)演化。這不僅體現(xiàn)在不同軟件之間能通過(guò)API連接,隨著容器和云原生技術(shù)的發(fā)展,軟件內(nèi)部也變成一個(gè)個(gè)微服務(wù)。在云計(jì)算的加持下,面向互聯(lián)網(wǎng)的軟件從傳統(tǒng)的信息化支撐軟件演進(jìn)成業(yè)務(wù)的關(guān)鍵核心系統(tǒng),此時(shí)對(duì)軟件系統(tǒng)本身的生命周期管理也在改變,比如,以前交付后能以初始版本不升級(jí)就連續(xù)運(yùn)行幾年,變成現(xiàn)在每幾天就會(huì)在線熱更新一次。此刻,我們不僅要解決軟件系統(tǒng)運(yùn)行時(shí)產(chǎn)生的穩(wěn)定性問(wèn)題,更需要發(fā)現(xiàn)潛在的線索,包括找到如何持續(xù)優(yōu)化軟件本身的思路,以及如何進(jìn)一步提升最終用戶體驗(yàn),等等。

傳統(tǒng)的監(jiān)控軟件整體設(shè)計(jì)思路是被動(dòng)的,是基于閾值或者事件驅(qū)動(dòng)的邏輯,或者說(shuō)是一種基于故障觸發(fā)的邏輯。這對(duì)傳統(tǒng)系統(tǒng)是有效的,因?yàn)楸O(jiān)控軟件的主要使用者是運(yùn)維工程師,他們只需要保證IT系統(tǒng)本身的穩(wěn)定性,并不過(guò)多關(guān)注上層業(yè)務(wù),更不用說(shuō)最終用戶體驗(yàn)了。而構(gòu)建可觀測(cè)性的目標(biāo)可不只是做一個(gè)更龐大的傳統(tǒng)監(jiān)控,而是要讓所有與該系統(tǒng)相關(guān)的工程師能從全局角度去理解整個(gè)系統(tǒng)的運(yùn)行狀態(tài),包括理解軟件的運(yùn)行情況、理解代碼的執(zhí)行邏輯等,最終目標(biāo)是服務(wù)所有研發(fā)、測(cè)試和運(yùn)維團(tuán)隊(duì),使大家能夠在同一個(gè)上下文中閱讀系統(tǒng),對(duì)問(wèn)題有一致的理解并給出真正能觸及根因的解決方案。可觀測(cè)性面向的不僅是已顯現(xiàn)的故障,更重要的是能夠通過(guò)主動(dòng)探索系統(tǒng)去發(fā)現(xiàn)問(wèn)題,這些問(wèn)題包括傳統(tǒng)意義上的已定義的故障,也包括代碼內(nèi)隱蔽的Bug、架構(gòu)上的瓶頸點(diǎn)、執(zhí)行邏輯里的漏洞、用戶體驗(yàn)的缺陷、某一個(gè)最終用戶操作中遇到的各種麻煩,等等。

說(shuō)到這里,你可能會(huì)認(rèn)識(shí)到,若要實(shí)現(xiàn)整個(gè)可觀測(cè)性工程,就需要有一個(gè)記錄軟件運(yùn)行狀態(tài)的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù),這個(gè)數(shù)倉(cāng)的數(shù)據(jù)規(guī)模要比傳統(tǒng)監(jiān)控大得多,不僅包含指標(biāo)、鏈路和日志,還包括用戶行為事件、網(wǎng)絡(luò)數(shù)據(jù)、安全數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等,并要有能力去綜合采集、存儲(chǔ)、分析、管理各類(lèi)海量的數(shù)據(jù),同時(shí)又要保證整體成本可控。它要能以統(tǒng)一標(biāo)準(zhǔn)的方式全量接入相關(guān)的數(shù)據(jù),而不是只收集那些你自認(rèn)為需要監(jiān)控的數(shù)據(jù),因?yàn)槿艉芏鄶?shù)據(jù)沒(méi)有被記錄,那將無(wú)法完整還原真實(shí)歷史狀態(tài);它能提供更多的測(cè)量手段去觀測(cè)數(shù)據(jù)以探明動(dòng)態(tài)的因果關(guān)聯(lián),而不像傳統(tǒng)監(jiān)控軟件那樣只能用固定格式的儀表盤(pán)來(lái)展示數(shù)據(jù);它需要大幅度降低使用者的學(xué)習(xí)門(mén)檻,不僅面向運(yùn)維工程師,還有研發(fā)測(cè)試團(tuán)隊(duì),甚至涉及產(chǎn)品運(yùn)營(yíng)團(tuán)隊(duì),大家共同來(lái)解決共識(shí)問(wèn)題,快速理解這些軟件問(wèn)題與業(yè)務(wù)問(wèn)題間的上下文關(guān)聯(lián)。

因此,可觀測(cè)性工程不只是一個(gè)更好的監(jiān)控工具,更是一種現(xiàn)代化的互聯(lián)網(wǎng)軟件基礎(chǔ)設(shè)施,是團(tuán)隊(duì)執(zhí)行力的體現(xiàn)。我們會(huì)清晰地發(fā)現(xiàn),能否有效地構(gòu)建可觀測(cè)性工程直接反映了整個(gè)公司產(chǎn)品的質(zhì)量,間接反映了整個(gè)公司的發(fā)展?jié)摿凸こ處熚幕?gòu)建可觀測(cè)性工程本質(zhì)上就是整個(gè)互聯(lián)網(wǎng)軟件本身的數(shù)字化,使用可觀測(cè)性平臺(tái)的組織才會(huì)成為基于數(shù)據(jù)驅(qū)動(dòng)的現(xiàn)代化組織。

本書(shū)非常詳細(xì)地描述了為什么要構(gòu)建可觀測(cè)性、可觀測(cè)性的價(jià)值、可觀測(cè)性構(gòu)建過(guò)程中的原則和可能存在的陷阱,也指出了現(xiàn)代化軟件工程的發(fā)展方向和趨勢(shì),值得每位工程師(包括所有技術(shù)管理者)好好閱讀和思考。我相信,當(dāng)你看完本書(shū)后,一定會(huì)迫不及待地在公司內(nèi)開(kāi)始構(gòu)建可觀測(cè)性工程。

蔣爍淼

觀測(cè)云創(chuàng)始人&CEO

主站蜘蛛池模板: 枣庄市| 晋中市| 大兴区| 沅陵县| 旬阳县| 新化县| 灵璧县| 辽阳县| 安吉县| 上蔡县| 利津县| 海宁市| 竹山县| 虹口区| 扎鲁特旗| 苏尼特右旗| 禹城市| 池州市| 延庆县| 龙山县| 蓬莱市| 石嘴山市| 兴仁县| 象山县| 新龙县| 泰安市| 巧家县| 饶平县| 江华| 祁阳县| 大同市| 长春市| 株洲市| 葵青区| 福建省| 乐亭县| 海门市| 唐河县| 拉萨市| 隆德县| 平乡县|