官术网_书友最值得收藏!

本書贊譽

本書不是“先假設再測試”,而是以一種更有原則的方法回答了諸如“為什么系統速度慢?”這樣的運維問題,最終,本書將成為工程師查詢系統狀態的分水嶺。

——Lorin Hochstein,高級軟件工程師兼OReilly作者

本書并不回避在團隊中引入可觀測性文化時所面臨的挑戰,并就如何以可持續的方式實踐可觀測性提供了有價值的指導,使可觀測性從業者能夠獲得長期成功。

——Cindy Sridharan,基礎設施工程師

隨著系統變得更加復雜和分散,監控并不能真正幫助你找到哪里出了問題。你需要能夠解決以前沒見過的問題,這就是可觀測性的作用。在過去的5年里,我從幾位作者身上學到了很多關于可觀測性的知識,我很高興他們現在寫了這本書,涵蓋了引入生產系統的可觀測性并從中受益的技術和文化的各個方面。

——Sarah Wells,《金融時報》前技術總監,OReilly作者

對于任何希望從可觀測工作中獲得最大收益的工程師或者管理者來說,這本優秀的書是你的實踐指南。本書在簡潔和全面之間取得了完美的平衡:它通過定義可觀測性奠定了堅實的基礎,解釋了如何使用它來調試服務并保持服務的可靠性,指導你為其構建強大的業務案例,并最終提供了評估你的工作以幫助未來改進的方法。

——Mads Hartmann, Gitpod SRE

在程序的開發過程中,debug和watch是開發人員的兩大法寶,無論是向Linux內核輸入洋洋灑灑的日志,還是通過gdb進行在線debug,都離不開對程序執行細節的觀測和理解。

云原生應用開發在簡化了開發的同時,也對線上運營維護、故障定位、性能調優等領域提出了更多挑戰。為了應對這些挑戰,從運行參數監控到日志搜集,再到全鏈路跟蹤,開發人員開發了各種各樣的工具。本書從針對復雜系統的事件因素出發,通過一系列指導思路,完成了對可觀測性的理論定義,并給出了系統可觀測性的成熟度模型。

——陳龍,互聯科技研發中心負責人

隨著數字化轉型浪潮的迅速推進,企業數字化IT架構日趨復雜,傳統監控系統正朝著可觀測性系統演進。本書提供了從概念到原理、從實踐到文化的全面闡述,可謂可觀測性修煉手冊,本書的引入恰逢其時,相信對深處數字化變革和敏捷轉型浪潮中的實踐者都大有裨益。作為OGA成員,觀測云團隊代表聯盟為中國數字化轉型做出了巨大的貢獻。

——陳冉,極狐(GitLab)

大規模、分布式系統的復雜性為工程人員引入了一個隱藏空間,隨著系統復雜性的提高,隱藏空間也與日俱增,迫切需要一個方法論來帶領我們解決所面臨的復雜性問題。如何探索這個基于系統行為的隱藏空間,本書作者借用控制論思想中的度量能力來描繪,就是通過高維度、高基數的數據來推斷出系統內部狀態的好壞,從而使一個復雜性問題具備可觀測性。如果你想深入學習可觀測性,那么本書不容錯過。

——杜玉杰,開放城市共同體發起人

過去20多年,IT團隊主要依靠APM來監控和排除應用程序故障,這對單體應用來說足夠有效。但現在時代變了,如今的IT團隊越來越多地依靠敏捷開發、CI/CD、DevOps、微服務、容器等技術來進行現代應用開發,我們也需要新的觀測方法來更快地交付更高質量的軟件,以滿足數字時代的要求。本書通過全面系統的介紹、真實的案例、不同選型路線比對等內容,向我們展示了可觀測系統的重要性以及對組織可能帶來的變化,值得每一位相關領域的人閱讀。

——霍泰穩,極客邦科技創始人兼CEO

隨著軟件系統復雜度越來越高,系統的穩定性和業務的連續性也愈發遇到更大的挑戰。

傳統的運維工作方式,通常由運維工程師根據專業技術能力和豐富的經驗來構建一套從監控到故障發現和響應處理的機制。新鈦云服的運維服務團隊是從盛大游戲技術保障中心成長發展起來的,幾乎參與了互聯網運維的整個發展路徑,從直接使用硬件服務器到虛擬化,再到私有云、公有云,IT基礎設施的技術變遷對運維的工作方式產生了巨大的影響。

要說對運維的工作方式影響最大的還是云原生技術帶來的變革,現代應用基礎系統的復雜性和規模讓通過傳統的監控工具來檢測系統條件變得越來越不合時宜,而基于可觀測性的診斷提供了一種不同的方法,可觀測性工具的工作原理是通過迭代探索性調查來系統地確定性能問題可能發生的位置和原因。可觀測性使我們能夠主動識別任何故障模式,無論是已知的還是未知的。運維工程師通過系統的可觀測性可以找到深層隱藏問題的來源,比較快速地診斷生產環境中的問題,而與之前是否了解過這個系統并無決定性的因果關系。

觀測云提供了一種革命性的技術,讓復雜應用系統的穩定性變得更好,也讓業務連續性得到了保障。本書非常適合運維從業者閱讀,由知到行,一起學習與探索。

——金霄,新鈦云服聯合創始人

本書給人的第一印象就是系統且全面,它不僅闡明了可觀測性與監控等類似概念之間的區別與融合,還基于事件和鏈路提供了可觀測性實現的具體內容。在工具和技術的基礎上,對團隊應遵循的設計理念和哲學,以及從軟件供應鏈這個更大的范疇理解可觀測性,乃至商業層面的思考,是本書“工程”二字的充分體現。對于在云計算、微服務、容器所構建的當代復雜軟件系統里,從根源上保障軟件的可靠性,本書是兼顧理論和實踐的寶貴資源。

——李寧,德邦證券CTO

最近幾年非常火的可觀測性已經遠遠超出了傳統意義上的監控,作為可觀測性領域圣經級著作,本書幫助軟件工程師全面而深入地了解可觀測性理論及實踐,是一本難得的佳作。

——盧盛祺博士,上海市高等教育學會數字經濟發展與研究專業委員會委員

可觀測性工程是一種軟件工程實踐,旨在使系統更容易監測和調試。這通常是通過在系統中收集和暴露更多的指標、日志和其他信息來實現的。這對系統穩定性具有重要意義,因為它可以幫助你更快地發現和修復問題。如果你的系統缺乏可觀測性,則很難快速定位和解決問題,這可能會導致系統不穩定并出現故障。

此外,可觀測性還有助于提高系統的可靠性和可用性,因為它使你能夠更好地了解系統的狀態和行為,從而能夠更快地發現并修復問題。

總的來說,通過收集和暴露更多的信息,可觀測性工程有助于使系統更容易監測和調試,并有助于提高系統的穩定性、可靠性和可用性。

——李先磊,北京合思信息技術有限公司運維總監

現代可觀測性雖是從傳統監控基礎上不斷進化脫胎而成的,但其技術理念與應用成效已經發生了質的改變。可觀測性技術可以與混沌工程、全鏈路壓測等多種穩定性保障工具結合,達到如虎添翼的應用系統優化效果。同時,其內涵也遠遠超出了故障發現與解決等傳統穩定性保障領域,能夠通過觀測業務數據輔助業務決策,實現更高效的商業價值挖掘。當前,由于業界普遍對可觀測性的理解還未更新至最新版本,致使這一技術明珠蒙塵。本書可以幫助工程人員以及團隊和業務的管理者更好地認識與建設可觀測性這一利器,實現業務運維、系統優化、商業決策方面的降本增效。

——李修瑩,前中國信息通信研究院可觀測性業務主管

在SRE的技術實踐中,“監控系統”始終處于關鍵地位。2020年起,“可觀測性”作為“新一代監控”創新技術實踐,與SRE、DevOps、云原生等一起得到了業內專家的廣泛關注和認可。

同時,我和SRE社區志愿者在推廣和宣傳谷歌SRE理念的過程中,發現社區廣大學員對于“可觀測性”普遍擁有很大的興趣,但對于它的核心概念以及技術實踐并不熟悉,亟須進一步深入了解。

最近,我很欣喜地了解到,由Honeycomb創始人以及谷歌SRE核心專家撰寫的這本權威著作《可觀測性工程》已經引入中國,并正式出版,確實感到非常高興,期待在中國打開“可觀測性”的新天地,也預祝SRE創新實踐持續在國內發揚光大。

——劉峰,中國SRE社區發起人

在軟件工程領域,可觀測性是一種理念和方法論,它讓我們對復雜軟件世界有了洞察秋毫的感知力。如果說基于傳統監控定位并解決問題的方法像老中醫的望聞問切,那么可觀測性則讓老中醫進入了現代醫學階段,有了現代診療手段。當然,與被動等待診治的“病人”不同,構建大型復雜軟件系統時,我們需要主動使用可觀測性方法,讓復雜系統具備更好的“可觀測性”。面對云原生時代涌現出來的更高強度的軟件復雜性,所有技術角色都可以從本書中獲益良多。

——劉慶,簡單云創始人

可觀測性是近年來軟件系統方面最熱門的話題之一。作為可觀測性社區的開源領袖,本書的作者詳細解釋了云原生時代可觀測性與傳統監控的區別,高屋建瓴地闡述了工程團隊應該如何從文化和工具等不同層面有效構建可觀測性,更進一步指明了構建可觀測性系統的技術難點和細節,創新性地提出了管理學層面的評估模型和趨勢預測。本書絕對是可觀測性乃至軟件工程從業人員的必讀好書。也感謝出版社將此書引入中國,功莫大焉。

——饒琛琳,《ELK Stack權威指南》作者、日志易產品副總裁

SLO(服務等級目標)是需求規劃、開發、測試、運維和運營各個階段協調配合,一起達成的重要綜合性軟件服務指標。

隨著云原生、微服務和Serverless的流行,以及開源技術棧的普及、移動化引發的計算存儲跨區域調度,開發和運行環境的多云異構性越來越明顯,軟件服務的故障越來越呈現分散、偶發、難復現等特征,故障定位、根因分析和系統調優迫切需要跨團隊和跨系統的協同合作,傳統割裂的監控和日志工具已無法滿足云原生時代開發和運維的需求。

可觀測性工具將全時、全域、全棧分散的數據進行整合,從而支撐從規劃設計、開發到運維運營的端到端SLO,并支持工程師不斷優化,最終達成目標,是云原生時代工程師最好的工具。

——任建華,華業天成資本董事總經理、數字化資深投資專家

大型復雜軟件系統往往會出現“when things work, nobody knows why”這種尷尬局面,而且這一現象伴隨著云原生技術的規模化應用正在變得更加嚴重,如何拉通開發與運維之間的有效協作、如何基于傳統監控體系去構建數據關聯分析與數據洞察的能力,以及如何在系統設計階段去構建體系化的可觀測性都成了現代軟件研發不得不面對的問題。正如顯微鏡的發明改變了人們理解疾病的方式,可觀測性的實踐必將改變我們對于復雜軟件的掌控力。

——茹炳晟,騰訊微信支付Tech Lead、騰訊研究院特約研究員、中國計算機學會CCF TF研發效能SIG主席

可觀測性作為一種全新的軟件工程文化在業界被逐漸接受,很多工程師將其視為一種范式性進步,它將幫助工程師在時間、空間維度更加深入地了解系統的運行狀態,回答發生了什么。本書作為可觀測性領域的少有佳作,全面介紹了可觀測性的發展歷程、原理及應用,非常具有學習價值。

——魏佳,匯量科技資深架構師

在軟件系統工程中,可觀測性已成為近年來備受關注的話題。隨著軟件系統規模的不斷擴大和云原生環境的日益復雜,可觀測性在軟件工程中的重要性也愈加突出。本書不僅涵蓋了可觀測性的基本知識和技術理論,還提供了詳細的實踐方案,是學習和實踐可觀測性的最佳資料,值得推薦閱讀。

——楊攀,極客邦科技副總裁&TGO鯤鵬會總經理

數字化轉型已逐漸成為中國眾多城市的長期發展核心議題。這是一個不斷迭代與漸進的過程,既需要技術的強力驅動,更離不開思維模式的轉變、體制結構的深刻改革以及商業運營模式的全面完善。在對美好生活品質的向往之下,在城市服務穩定運行和高效治理的背景中,錯綜復雜且龐大無比的數字化系統提供了堅實可靠的支撐。為了精準設計、高效研發、穩定管理以及持久優化這些數字化系統,實現可觀測性已然變得至關緊要。可觀測性有力地推動著數字化管理水平升級、城市治理范式嬗變,并使得數字治理手段日益多樣化、精確細致和專業高端,實現類似于從“X光”到“CT”的診療技術飛躍,助力我們更加全方位深入地洞悉系統內部運作狀態,并揭示數字治理新領域。我推薦本書作為技術管理者的良讀之選。

——姚震,上海市大數據股份副總裁

可觀測性是觀察、感知、探索軟件系統的運行狀態、穩定性及用戶體驗的重要能力,超越了傳統運維監控。可觀測性可幫助軟件系統提高開發敏捷性、加速測試發現問題、管理技術復雜性、增強軟件質量信心、加快排錯排障。本書是可觀測性方面的難得佳作,書中深入探討了可觀測性的各個方面,涉及理念認知、工程實踐、建設思路、成熟度度量等,也討論了探針、采樣、數據流水線等具體技術。本書內容對廣大的軟件工程師、架構師大有裨益,可以讓大家對可觀測性有更加清晰的認識,從而推進可觀測性工程建設,幫助工程師更加主動地探索軟件系統中未知的“線索”。

——張觀石,虎牙直播前SRE高級經理、架構師、《SRE原理與實踐》作者

近兩年,可觀測性技術成為繼容器云、云原生、服務網格后的又一革命性技術話題,受到全體技術人的廣泛關注。本書不僅全面闡述了可觀測性技術的可行性理念,也首次展示了該技術眾多難題的解決方案及實現細節,更有機地和當今主流的SRE、DevOps、云原生等理念深度融合,使得可觀測性技術在企業落地有了軌道和承載。

“從全局把控、從痛點入手、從案例切入”是本書的核心要義,作者用輕松易懂的方式把可觀測性這一抽象技術講解得生動又通透!本書是該領域每位從業者必不可缺的核心技術寶典!

——張冠宇,馬哥教育總經理、原美團點評運維架構師

云原生和微服務生態的蓬勃發展促進了分布式應用的實踐,這為保障軟件系統的可用性帶來了便利,同時也不可避免地增加了業務排障的復雜度,可觀測性工程的存在由此變得十分必要。本書以可觀測性的概念和原理為起點,直面其能力的落地、應用和傳播問題,以團隊化、規模化和效益化的視角構筑并展開解決方案,頗具啟發性。

——張海立,馭勢科技云平臺研發總監

可觀測性是現代工程的重要實踐,無論是生產制造還是建筑工程都有堅實的可觀測性理論和工具。軟件工程在這方面起步較晚,還在持續改進。本書系統地講解了可觀測性的概念、理論,并提供大量實踐指導和案例,非常有助于在現有的工程和組織中構建可觀測性能力。

——張海龍,CODING創始人

無論是個人愛好者進行學習提升,還是企業架構師進行架構優化,本書都是一位優秀的“導師”。全書通過對“可觀測性”“監控”“遙測”“AIOps”等多種技術棧進行對比,引導讀者正確認識可觀測性,并進一步通過案例分析帶領讀者快速構建可觀測性能力體系。

——張紅兵,「DaoCloud道客」COO

隨著近年來AIOps的流行,可觀測性再一次成為一個熱門概念。在國內大部分廠商將APM和可觀測性混為一談并兜售傳統APM軟件的背景下,普及可觀測性理念變得極為迫切。本書并沒有手把手指導你如何開發一個觀測診斷平臺,而是系統地介紹了可觀測性的概念、原理和構建可觀測性所要具備的核心能力。借助本書,你能理解在云計算已進入全面云原生時代的今天,軟件系統具備可觀測性是何等重要,以及將可觀測性的思維引入軟件系統的必要性。

——趙成陽,字節跳動軟件工程師

作為可觀測性從業者,我經歷了可觀測性從運維團隊監控告警的一部分到被越來越多的開發和測試團隊引入的過程,越來越多互聯網之外的企業主動規劃咨詢和采購可觀測性服務,我相信可觀測性技術在國內度過了創新者和早期采用者階段,形成了相互促進的優秀產品和服務、領先企業的最佳實踐以及先行者的技術布道三要素,跨越了技術成熟度的死亡之井,開始在國內走向流行。

每一次技術理念的發展,都伴隨著優秀書籍把先進的理念和最佳實踐經驗帶給大家,本書會成為可觀測性行業的必備書之一,更深入地推動可觀測性實踐,使之成為工程師團隊的一個必備技能和工具,提升中國軟件工程能力。

——趙隆兵,觀測云

本書從理論到實踐全面探討了可觀測性在現代軟件工程中的重要性和實踐路徑,具備一定的前瞻性和創新性,為構建穩定安全運行的系統提供重要的指導。對于云時代的系統架構師、運維工程師、開發人員和管理人員來說,本書將是不可或缺的技術參考書。

——鄭立,中國信息通信研究院云計算與大數據研究所副主任

過去20年是一個幸運的時代,云計算、云原生等計算機技術的發展,激發了開發者的創造力,鑄造了波瀾壯闊的數字化浪潮,相信各位讀者都是該過程的見證者與受益人。

與此同時,快速的業務迭代和豐富的使用場景常常使現實的系統與理想的設計出現差異,穩定性、成本、安全、性能等問題時刻挑戰著我們寶貴的時間和精力。如何對系統、軟件構建一套數字化的度量+管理方法變得迫在眉睫。系統從被監控到被系統地觀測再到被外部正確掌握,逐步成為行業的發展趨勢。

站在從業者的角度看,成熟的工具產品也使得個體的能力范疇越來越大,例如,我們回顧過去10年的發展,研發已經把可測性、架構穩定性等原本屬于測試、架構的范疇左移到設計、架構階段。考察一個程序的可測性、測試覆蓋程度成為開發者的必備技能。同樣,一個系統對外部是否能暴露易于觀測的接口、容易被處理和分析的遙測數據、容易通過開關控制的接口,也成為不可缺少的基本能力。

今天非常高興有機會閱讀《可觀測性工程》這本書。作為云計算系統的研發者,書里提到的理念、實操和工程原理都是務實的經驗之談,對當下工作和未來思考都有啟發,譯者翻譯得也非常專業。十分期待可觀測性工程技術能在國內得到更好的發展。

——周琦(簡志),阿里云計算技術總監/阿里云SLS技術負責人

主站蜘蛛池模板: 敦化市| 兴和县| 内黄县| 民权县| 通渭县| 于都县| 茂名市| 浦北县| 西宁市| 营口市| 老河口市| 邻水| 扎兰屯市| 苍梧县| 铜梁县| 毕节市| 南郑县| 清远市| 大余县| 临洮县| 台前县| 公主岭市| 徐水县| 西乌| 清原| 富民县| 轮台县| 博爱县| 民和| 华容县| 滁州市| 军事| 肇东市| 隆尧县| 益阳市| 甘德县| 马鞍山市| 尖扎县| 石家庄市| 商城县| 沅陵县|