應用

技術

物聯網世界 >> 物聯網新聞 >> 物聯網熱點新聞
企業(yè)注冊個人注冊登錄

【漫畫】通俗易懂講清楚什么是機器學習?

2020-02-05 09:24 伯樂在線

導讀:理解機器學習真的沒那么難。

理解機器學習真的沒那么難。

在一個風和日麗的周末……

01

故事一:瑞雪兆豐年

這就是瑞雪兆豐年的故事。頭年的瑞雪和來年的豐收,本是兩個看起來并不相關的現象,但是智慧的農民伯伯通過幾十年甚至幾代人的經驗,總結出了兩個現象之間的規(guī)律。

現代的農業(yè)學家通過科學的分析,弄清了瑞雪兆豐年規(guī)律背后的本質原理。但是對于古代農民伯伯來說,知道規(guī)律就足夠了,可以通過規(guī)律來為下一年的生產生活做出有效的調整。

02

故事二:啤酒和尿布

上個世紀90年代,沃爾瑪超市已經是美國最大的零售企業(yè),擁有大量的顧客資源。那時候的沃爾瑪已經采用了先進的計算機技術,隨時記錄著每天眾多顧客購物車中所挑選的商品明細。

從此,沃爾瑪的銷售額得到了顯著提升,啤酒尿布的故事也廣為流傳,成為了銷售界和IT界津津樂道的成功典范……

這就是沃爾瑪啤酒和尿布的故事。顧客購買啤酒的行為和顧客購買尿布的行為,原本是兩個看起來沒什么關聯的現象。但是沃爾瑪的技術專家以大量的用戶購物數據為樣本,通過先進的算法,最終尋找到了兩者之間的重要關聯和規(guī)律。

為什么購買啤酒的人更有可能同時購買尿布呢?是因為有了小孩的男人比別人更愛喝啤酒?還是因為愛喝啤酒的男人比別人更顧家?這些臆測似乎都有些牽強。

但是沃爾瑪不需要關心規(guī)律背后的本質。對企業(yè)來講,利用發(fā)現的規(guī)律,獲得實實在在的利益就足夠了。

機器學習按照方式不同主要分為三大類,有監(jiān)督學習(Supervised learning)、無監(jiān)督學習(Unsupervised learning)以及半監(jiān)督學習(Semi-supervised learning)。

監(jiān)督學習:通過已有的一部分輸入數據與輸出數據之間的對應關系,生成一個函數,將輸入映射到合適的輸出。在瑞雪兆豐年的例子中,頭年降雪量就是輸入,來年畝產量就是輸出。

非監(jiān)督學習:直接對輸入數據集進行建模,尋找關聯。例如啤酒尿布的例子,只需要尋找關聯性,并不需要什么明確的目標值輸出。

半監(jiān)督學習:綜合利用有輸入輸出的數據,和只有輸入的數據來進行訓練??梢院唵卫斫獬杀O(jiān)督學習和非監(jiān)督學習的綜合。