導讀:當全球人民轉向遠程辦公、線上生活,IT系統(tǒng)的穩(wěn)定性、可用性被企業(yè)提升至前所未有的高度,運維的重要性也隨之凸顯。
5G基建、特高壓、城際高速鐵路、新能源汽車充電樁、大數據中心IDC、人工智能、工業(yè)互聯(lián)網七大領域新基建的提出令我們看到:未來一定是基于數字基礎設施產生的數字化、智能化的世界。運維作為整個數字化、智能化的支撐技術,也將成為企業(yè)健康發(fā)展的重要保障。
2020年4月2日,由中國軟件網總裁、海比研究總裁曹開彬帶來的全新直播對話欄目“曹云社”第二期邀請到了云智慧創(chuàng)始人兼CEO殷晉先生,圍繞當下運維的挑戰(zhàn)、云智慧的發(fā)展、運維行業(yè)發(fā)展等話題,共同探討新基建給智能運維帶來的那些機遇。
疫情下的運維行業(yè)
曹開彬:疫情期間大家都在線上進行交流、學習、工作,這導致了很多系統(tǒng)出現(xiàn)了崩潰、宕機,您怎么看這些跟云智慧產品和技術相關的一些現(xiàn)象?
殷晉:在我們看來宕機還是蠻常見的現(xiàn)象,不常見的是疫情期間我們看到了原來認為幾乎不太可能宕機的服務提供商都發(fā)生了宕機,比如釘釘、企業(yè)微信、谷歌。
之所以發(fā)生這么大范圍的事故,其實是疫情期間大家都把業(yè)務搬到網上,這對于線上系統(tǒng),或者整個IT的負載都是非常巨大的,它很容易把特別小的故障放大成大問題,進而造成很大影響。
其實在日??磥磉@些小故障不會造成太大影響,只有當并發(fā)量和系統(tǒng)負載上升到一定程度才會導致大規(guī)模故障發(fā)生。這個事情就是運維的問題。因此我覺得未來講新基建也好,數字化發(fā)展也好,其實會帶來巨大挑戰(zhàn):隨著業(yè)務越來越往線上遷移,任何運維方面的小問題可能都會變成一次宕機、故障,進而對業(yè)務造成影響。
曹開彬:如果從專業(yè)運維角度,殷總能不能跟各位總結一點,現(xiàn)在的運維跟過去10年間有什么差別呢?
殷晉:我覺得現(xiàn)在運維的挑戰(zhàn)比十年前復雜了很多,除了云計算、容器化等這些方面技術的發(fā)展外,系統(tǒng)規(guī)模也越來越大,疫情期間的沖擊是一個典型反映。以前,IT在很多企業(yè)里面就是一個記賬的,說白了就是跑業(yè)務的,業(yè)務跑的結果記錄到臺賬里面,當然臺賬會以各種各樣的形式出現(xiàn),例如辦公系統(tǒng)、財務軟件,或者現(xiàn)在的 SaaS等。這些系統(tǒng)在以前沒有和業(yè)務融合到一起。過去幾年我們看到最直接的變化就是IT和業(yè)務融合到一起了。
這樣的話,做運維不能像10年前那樣,只考慮設備、軟件、資源等等這些方面的問題,還必須得從業(yè)務的視角,系統(tǒng)性的做運維。正是因為這樣,過去十年我們看到運維的基礎理論也發(fā)生了很大的變化。
曹開彬:就像剛才說的,疫情期間這些事情會引發(fā)很多產品,甚至思維方式的改進。在疫情期間很多公司推出了一些專門的解決方案、政策或者措施幫助客戶度過疫情,云智慧有沒有做類似的事情?
殷晉:當然要做,我們本身提供的SaaS服務,能幫助我們的用戶,保障它的線上業(yè)務的可靠性和連續(xù)性。我們SaaS的用戶也非常多,包括很多政府還有企業(yè)。所以針對疫情相關行業(yè),我們推出了免費的可用性監(jiān)測服務。
第二個是加強了對于客戶服務的支持。我們想辦法讓技術人員能夠實時的幫助客戶,提供更加貼心的服務,保證疫情期間不見面但能更快的響應客戶需求。
同樣的,我們還幫助客戶提供了一些類似于故障處置和恢復等方面服務,以保障在疫情期間他們的業(yè)務能夠更加連續(xù)和穩(wěn)定。
曹開彬:從現(xiàn)在來看,目前疫情期間客戶的表現(xiàn),客戶對于我們的反饋是什么樣的?
殷晉:客戶對于我們還是蠻感謝的,甚至還有一些給我們專門發(fā)來表揚信。像我們有些客戶屬于衛(wèi)計委系統(tǒng),他們因防疫需要大量使用二維碼,但經常發(fā)生掃碼之后系統(tǒng)沒有反應,影響防疫的情況,我們幫助客戶解決了很多類似問題。
十年,從1.0版本到3.5版本
曹開彬:云智慧在運維領域做了10年,能不能總結一下運維市場大致的發(fā)展歷程,這個某種程度上也是云智慧自身的發(fā)展歷程。
殷晉:結合運維自身的發(fā)展來說,10年前我們最早做的第一個產品是監(jiān)控寶,主要是通過全球分布式監(jiān)控網絡,保障網站的可訪問性和連續(xù)性,是從系統(tǒng)的可靠性和連續(xù)性的角度去做。
隨著互聯(lián)網本身的發(fā)展,我們做到了用戶體驗的層面,就是我們的透視寶。透視寶的價值是能夠幫助企業(yè)衡量每一個終端用戶的真實體驗,比如他用什么樣的設備,通過移動端,還是網站訪問業(yè)務,遇到了什么問題。這些問題也可以做更深入的追蹤,比如追蹤到系統(tǒng)的代碼層、或某一個硬件層面。透視寶解決的是運維里面故障排查和追蹤的問題,這個問題解決不好,會大大影響IT系統(tǒng)本身的管理和效能。
現(xiàn)在IT和業(yè)務融合在一起。運維也從資源監(jiān)控、應用體驗管理,發(fā)展到了業(yè)務運維,保證業(yè)務可持續(xù)性發(fā)展。
云智慧的發(fā)展過程也是經歷了從提供最基礎的運維監(jiān)控工具到應用體驗,再到現(xiàn)在和業(yè)務融合的智能業(yè)務運維管理平臺。
曹開彬:現(xiàn)在很多業(yè)務跟IT完全融合。您能不能講講業(yè)務運營人員和IT運維人員的工作界限在哪里?
殷晉:這是現(xiàn)在變化比較大的。以前這兩個主體完全是分開的,今天我們看到這兩者的邊界正在模糊,但這中間還是有一條虛的邊界。我們先說分別在哪兒。
例如,一個典型的數字化業(yè)務場景是:為拓展新客戶,在公司里面有人專門負責廣告該怎么投放、用戶該怎么獲取,怎樣吸引他們到企業(yè)的各個觸點平臺。當用戶抵達你的平臺之后,無論從哪個渠道,他就開始和你的系統(tǒng)之間產生交付。從這刻開始,系統(tǒng)的運維就會變得非常重要。這個時候用戶的體驗就決定了業(yè)務的轉化率,甚至決定了業(yè)務的收入,客戶滿意度,是否會持續(xù)復購。
在我們看來,跟用戶、獲客、轉化相關的廣告怎么投放,這些前端事務更多偏向運營,而當你的用戶落地到平臺上來以后的工作,就偏向于運維。
曹開彬:這是一個前后臺的關系,前端是運營人員去做,后端是運維人員去做。
殷晉:可以這么理解,現(xiàn)在很多企業(yè)里面沒有分的這么清楚,甚至是有了更多的創(chuàng)新。比如,我們看到有些企業(yè)會成立獨立的部門,叫做數字化運營部,把這兩類職能整合在一起。這個帶來的業(yè)務連續(xù)性效果還是非常好的。
曹開彬:如果再往后走一走,會不會有越來越多的企業(yè)采用您剛才說的做法,叫做數字化運營部,將兩者融合在一起?
殷晉:從未來來看兩者的關系會越來越緊密,很有可能會在一個大的部門,這個部門有些叫做創(chuàng)新部門,有些叫做數字化運維部門,這個部門里面會把兩類人放在一起,互相雖然有分工,但協(xié)作的程度會更高一些。
曹開彬:我也注意到云智慧前不久拿到了投資,且從成立到現(xiàn)在咱們拿到了多輪投資。您能不能從公司發(fā)展角度說一說云智慧公司本身10年來發(fā)展的歷程?這與運維本身十年來的發(fā)展階段是否相匹配?
殷晉:我是做技術出身,所以習慣用一個產品思路,或者是版本形式描述一個公司的發(fā)展。從這個角度講,云智慧現(xiàn)在是已經過了3.0版本,到了往4.0版本去進發(fā)的階段,當然我們還沒有到正式4.0版本。
云智慧1.0階段是在2010到2013年階段,2013年拿到第一輪融資。2014到2015年是2.0的階段。后面2016到2018年是3.0版本的階段。
通常,我們看到一個軟件迭代到3.0,意味著這個軟件已經是比較好用了,在市場中間有比較強的競爭力,有很多客戶愿意花錢來買,我們公司過去幾年也是處在這個階段。從2019年開始,云智慧應該是進入到3.0向4.0發(fā)展的中間階段,我們不斷地在迭代。
4.0的標志是這個公司有很強的競爭力,云智慧到今天還沒有到4.0,相當于3.5左右的版本。我們差不多花了10年的時間,我希望再過1、2年,我們能夠很自豪的說,云智慧到了4.0版。
曹開彬:這個發(fā)展的過程跟殷總自己的預期,或者跟資本的預期能夠比較吻合嗎?
殷晉:去年6月是云智慧成立第10年,我們可能比大多數公司在第10年的狀態(tài)要好。我們自己和投資人對這個狀態(tài)還是比較滿意。當然,未來還是有很多挑戰(zhàn)。雖然看起來我們到了3.5,但是3.5到4.0還會分無數個細小版本的迭代,需要很多解決的問題。對于我們團隊而言,挑戰(zhàn)還是蠻大的。
技術創(chuàng)新、服務交付、健康發(fā)展是智能運維廠商的核心
曹開彬:這兩年運維這個市場變化特別大,也有很多友商在做類似的工作,從整個行業(yè)來看,你覺得運維有什么樣的特點?
殷晉:首先從市場角度來看,中國的運維市場跟美國比有10年左右的差距。美國數字化在2004到2006年是啟蒙時期,從2008年開始到了快速發(fā)展的時期。2016到2018年是中國數字化啟蒙的時期。
總體來講,運維在中國還是處于比較早期的階段。在這個市場里,中國從事運維這個市場的廠商并不少。大家都在不斷地迭代和探索,包括友商也好,包括云智慧自己也好,隨著這個市場的成長而發(fā)展,都會越變越好。這是肯定的。
曹開彬:對于這些廠商能按照背景、出身或者不同特點分一下類嗎?
殷晉:云智慧通常講以客戶為中心。我覺得從客戶視角看,有三個維度去考察一個運維廠商。第一,你能夠有很強的產品技術能力。第二,你有很強的服務交付能力,能夠幫助他解決他的問題。第三,你這個公司還能夠持續(xù)健康發(fā)展。現(xiàn)在市場上的很多廠商往往只具備其中一項或兩項能力,真正具備這三項能力的公司,我覺得這個市場中不太多。
我覺得云智慧努力的目標是要把三者結合的很好。這樣而言公司才能夠突破天花板。
曹開彬:我觀察到云智慧的產品布局是從基礎設施的監(jiān)控和運維到業(yè)務的運維。智能運維我覺得是另外一個維度。您怎么看智能運維?你們內部怎么來布這個局?
殷晉:智能運維很有意思,國內包括云智慧自己都是經過一段時間的探索。在我看來,智能運維更多是戰(zhàn)略性的事情,它會落地到業(yè)務或者產品的方方面面。在應用層面,“智能”這個事情也是非常復雜。今天我們一個簡單應用,把其流程畫出來,至少都有三、四十步。每一步,都需要考慮是否和“智能”的結合。
云智慧是這個行業(yè)比較早認知到智能運維是企業(yè)戰(zhàn)略層面能力的廠商。我們組建了獨立團隊去服務每個產品,每個產品里面AI也是單獨的層,不是局部功能,它是我們最底層的核心能力之一。
曹開彬:您剛才說AI在云智慧產品當中是一層。這一層大概有什么東西能簡單介紹一下嗎?這一層是需要單獨部署,還是跟我們其他的產品融合在一起?
殷晉:首先這一層是一個虛擬層,會跟我們每個產品都進行融合,融合到每個產品里面支撐具體的功能。
舉個例子,像對設備的故障,或者應用生命周期的預測,這個就是AI的能力,這會落到設備或者基礎設施運維的層面。同時,我們也會遇到預測收入這個層面的需求。例如,要預測收入和故障的關系,這個就變成業(yè)務層面的預測。
我們有一個數字化運營智能分析平臺的中間層,它里面會提供很多數據的智能化處理,包括我們的算法、模型等基礎能力,它會被每個產品調用,在具體的每個產品里面形成支撐某一個具體場景的功能。
曹開彬:云智慧做智能運維有什么特別策略嗎?
殷晉:云智慧做智能運維有個18字真理——“以數據為基礎、以場景為導向、以算法為支撐”。
我覺得所有的智能運維一定來源于非常好的數據基礎,這個不具備的話沒有辦法做智能化。同時,如果沒有明確的業(yè)務場景,或者需求,或者功能方面的落腳點,你的智能化就是為了AI而AI,是沒有意義的。工程化算法是要擬合數據的,根據數據和前面的場景需求選擇合適的算法,或者自己去設計算法。
只有具備上述3個條件,才能真正形成一個AI落地的智能運維。
曹開彬:智能運維的出現(xiàn),導致現(xiàn)在業(yè)界經常在討論運維人員的飯碗還能不能保住。您如何看待這個問題?
殷晉:現(xiàn)在業(yè)界兩個方向應用“智能”,一是NoOps,一是BetterOps。前者目的是消除運維,讓一切自動化;后者目的是幫助運維人員更好地運維,但不是完全消除運維。在我們可預見的未來,在這么復雜的運維場景下完全去追求自動化,我認為是很難的,如果是20年之后,這個方向可能是對的。但是短期內消除運維的風險是巨大的。我們的思路是后者,目的是要保住運維人員的飯碗,讓智能幫助他們更好地運維。
曹開彬:如果從這個視角,智能運維還有其他理念出現(xiàn)嗎?
殷晉:當然還有一些。但我都不知道是什么理念,都是在喊口號。走的路線很奇怪,既不是往純粹的自動化方向迭代,也不是往讓人類的工作變得更好的方向迭代??赡苁且恍┧^中間路線。
曹開彬:從用戶角度,我看到咱們的運維場景有兩種類型的用戶,一種是IT和互聯(lián)網公司,例如做SaaS應用或者做云的。第二種是傳統(tǒng)行業(yè)用戶,比如金融行業(yè)、零售行業(yè)用戶。云智慧的目標客戶主要是傳統(tǒng)行業(yè)嗎?
殷晉:是的,我們公司的目標是把先進的互聯(lián)網運維能力帶給傳統(tǒng)企業(yè)。數字化真正巨大的價值就是讓傳統(tǒng)企業(yè)實現(xiàn)一種高效率經營。這是我們追求的一個目標。
曹開彬:現(xiàn)在很多傳統(tǒng)公司變成了互聯(lián)網公司或軟件公司,他們把不同業(yè)務往數字化方向走,這對于運維會是怎樣的機遇?
殷晉:這個肯定是一個巨大的趨勢。疫情某種方面是一個催化劑。疫情之后,原來還在猶豫是否上數字化的企業(yè),現(xiàn)在沒有什么好猶豫的,只能這么做。這個對于我們云智慧這類的公司來說是一個特別大的機會,當用戶的業(yè)務和線上的聯(lián)系越緊密,它就會越來越依賴運維。
曹開彬:傳統(tǒng)企業(yè)數字化往往借助各種云服務。從運維視角來看,有些要在云端運維,有些要在本地運維,這個邊界怎么界定?
殷晉:一般而言,公有云的IaaS廠商通常會提供基礎保障,比如說服務器、內存這種資源層面的監(jiān)控管理。但是企業(yè)的APP怎么樣,我們的業(yè)務轉化、應用、用戶體驗怎么樣,這些事是基礎運維工具不管的,這個時候就需要專業(yè)的廠商,例如云智慧,和公有云廠商合作,才能夠幫助客戶得到更好的IT支持。
云智慧希望跟我們的合作伙伴能夠達到共生共贏的狀態(tài),一起為客戶提供長期的服務,不斷地增強幫助客戶解決問題的能力。
新基建下的智能運維更光明
曹開彬:業(yè)界流行一個詞叫做多云管理、CMP,MSP也是熱點。云智慧是否也可以說是這方面的一分子,是否會推出CMP平臺呢?
殷晉:多云管理更多從IaaS資源的協(xié)調管理、資源的高效利用角度出發(fā)的。我們立足幫客戶直接解決系統(tǒng)應用過程中出現(xiàn)的問題。對于云智慧而言,我們還是專注,專注數字化運營和數字化運維這件事情。直到我們在全球能夠排上號,我們才會考慮做更多的事情。
曹開彬:剛才您提到我們這次融資非常重要的目的是要提升我們的交付能力,同時繼續(xù)打造生態(tài)。從現(xiàn)在來看,智能運維交付的難點主要在什么地方?
殷晉:中國現(xiàn)在面臨的環(huán)境叫做三化疊加,信息化、數字化、智能化,同時還要加上一個云化。客戶的部署環(huán)境很復雜,有些客戶在公有云上,有些客戶是混合云,有些客戶完全是私有部署,自建數據中心。系統(tǒng)復雜度是最大的難點,這對我們的交付能力提出了很高的要求。有些客戶還有定制化要求。因此,我們不僅希望自己做,更希望能夠和合作伙伴一起去做交付。
曹開彬:云智慧的產品、解決方案的交付是怎樣一個方式呢?
殷晉:從銷售側來說,我們肯定希望讓產品觸達到更多的客戶。云智慧雖然現(xiàn)在差不多有400人,但是我們70%還是技術研發(fā)人員。所以我們希望有很多的銷售伙伴來幫我們把這個產品帶到客戶面前。
第二個,客戶側我們面臨的就是各種各樣的客戶交付需求。我們也是希望有很多服務交付伙伴能夠為客戶提供更直接的服務支持。
曹開彬:從發(fā)展伙伴的角度看,什么樣的伙伴、渠道對于云智慧是比較適合的?
殷晉:這個分開看,如果是銷售的話相對來講比較簡單,銷售更多的是熟悉客戶就很好。但如果是從更全面的角度來看,最好的伙伴是有軟件方面的經驗。這樣對于產品理解起來會更快一些,也能為客戶提供更加專業(yè)的支持和服務。
曹開彬:我們每年都會做中國軟件生態(tài)大會,我們現(xiàn)在叫做中國數字智能生態(tài)大會,會有伙伴會來關心一些新的產品,或者新的技術,您能不能說一些我們對于伙伴有沒有什么特別的支持嗎?
殷晉:讓我們的合作伙伴通過跟云智慧的合作能賺到錢這個是我們的出發(fā)點,我們所有政策的出發(fā)點都是圍繞這個來的。當然最核心的是讓我們的客戶通過雙方的合作三方共同獲益,而且是長期獲益。
曹開彬:能不能結合新基建,談談您對未來運維發(fā)展趨勢的判斷呢?
殷晉:新基建我是從三個角度來看。第一個層面,數字化需要很好的能源或者能量的支撐,所以新基建有特高壓和新能源充電樁。同樣要能夠讓數字化的要素能夠流動的更快,比如像城際高鐵和軌道交通,讓數字化里面的人或貨在這個過程能夠流轉的更快,5G是讓數字化要素信息流轉的更快,數據中心是能夠讓數據流轉留存。最上層是數字化的應用,包括人工智能、工業(yè)互聯(lián)網都是為了讓數字化的應用很快的構建起來,這些應用的價值能夠充分的跟業(yè)務結合,充分的發(fā)揮。
這三個層面最終融合在一起就形成了企業(yè)非常復雜的數字化圖景,這個系統(tǒng)一旦建起來就再也離不開運維了。這么復雜的東西融合在一起如果沒有特別好的運維是搞不定的。但是,光靠運維的人肯定也搞不定,因為太復雜了。所以只能靠軟件本身、靠智能化去運維這么復雜的數字化系統(tǒng)。我相信,在未來的數字中國,做智能運維前途非常光明。