深度學習、機器學習與人工智慧各有何不同?

人工智慧是涵蓋範圍極廣的領域,包含許多相互關聯的術語和概念,經常被當做統稱,泛指任何類型的智慧機器。但實際上,「人工智慧」、「機器學習」和「深度學習」是不同的術語,三者之間有著細微的差異。

如要進一步瞭解人工智慧和機器學習技術對貴公司的助益,請造訪這個網頁,進一步瞭解 Google Cloud 的 AI 和機器學習產品與解決方案。

新客戶最多可以獲得價值 $300 美元的免費抵免額,盡情體驗 Vertex AI 和其他 Google Cloud 產品。

如要進一步瞭解 AI、深度學習和機器學習之間的關係,請繼續參閱以下的說明。

什麼是深度學習?

深度學習是機器學習技術的分支,透過人工類神經網路來處理及分析資訊。類神經網路由多層的運算節點組成,一層層堆疊在深度學習演算架構中。每層各包含一個輸入層、輸出層和隱藏層。類神經網路會被饋給訓練資料,協助演算法學習並提升準確率。如果類神經網路除了輸入層和輸出層外,還包含多個隱藏層,就屬於深層類神經網路,而這正是深度學習的基礎。

深度學習演算法的設計靈感源自人腦的運作方式,特別擅長分析大量非結構化資料,許多我們現在認定為 AI 的工作都採用這項技術,包括圖像與語音辨識、物件偵測和自然語言處理。深度學習可以在資料集中建立複雜的非線性關係,不過需要的訓練資料和運算資源都比機器學習多。

深度學習常用的幾種類神經網路包括:

  • 「前饋類神經網路」(FF) 是最早發明的類神經網路類型之一,資料經過一層層的人工神經元,向輸出層單向傳播。
  • 循環類神經網路 (RNN) 與前饋類神經網路不同,差別在於這類神經網路通常會使用時間序列資料或序列相關的資料。循環類神經網路具有上一層的「記憶」,這個記憶會依附在這一層的輸出內容中。
  • 長短期記憶 (LSTM) 是進階版 RNN,可利用記憶體「記住」前層發生的事情。
  • 「卷積類神經網路」(CNN) 包含現代人工智慧中最常見的幾種類神經網路,使用明確的分層 (卷積層,然後是池化層),先過濾圖片的不同部分,然後 (在全連接層中) 再將圖片組合在一起。
  • 生成對抗網路 (GAN) 涉及兩個類神經網路 (即「生成器」和「鑑別器」),兩者會相互競爭,最終可提升輸出內容的準確度。

什麼是機器學習?

機器學習是人工智慧的分支,不必特別編寫程式碼,就能讓系統自主學習並改進。機器學習演算法透過模式和資料辨識程序,在新資料輸入系統時進行預測。

機器學習通常會使用數種不同的模型,包括:

監督式學習

「監督式學習」是一種使用已標註的訓練資料 (結構化資料),把特定輸入資料對應至某個輸出結果的機器學習模式。在監督式學習中,輸出結果是已知的 (例如,辨識一張蘋果圖片),模型是根據已知的輸出結果資料進行訓練。簡單來說,要訓練演算法準確辨識出蘋果圖片,只要餵給它已標記為蘋果的圖片就可以了。

目前最常用的監督式學習演算法包括:

  • 線性迴歸
  • K-近鄰演算法
  • 單純貝氏分類
  • 多項式迴歸演算法
  • 決策樹

非監督式學習

非監督式學習是一種使用未標註的資料 (非結構化資料) 來進行資料模式學習的機器學習模式。與監督式學習不同,非監督式學習的輸出結果無法事先得知。相反地,演算法會在沒有人為輸入內容的情況下從資料中學習 (因此稱為「非監督式」學習),並根據屬性分類資料。

現今最常用的非監督式學習演算法包括:

  • 模糊平均數
  • k-means 分群法
  • 階層分群法
  • 主成分分析法
  • 偏最小平方迴歸演算法

半監督式學習

一種稱為「半監督式學習」的混合式機器學習方法也常被業界採用,在這種方法中只有部分資料會被標註。在半監督式學習中,演算法必須設法整理及建構資料,才能獲得已知結果。舉例來說,機器學習模型會被告知結果是蘋果,但只有部分訓練資料會被標註為蘋果。

強化學習

「增強式學習」是一種藉由一連串嘗試錯誤 (trial and error) 的反覆試驗過程來「從做中學」的機器學習模式。「智能體」(agent) 會透過一種回饋循環的過程學習執行指定工作,直至學習成果達到目標範圍為止。代理執行工作時如果表現良好,就會獲得正面回饋,如果表現不佳,則會得到負面回饋。

什麼是人工智慧?

人工智慧是一個科學領域,著重於打造出可推論、學習及採取行動的電腦和機器,而這些行為通常需要人類智慧判斷,或需處理規模超出人類分析能力的大量資料。人工智慧是一個十分龐大的領域,涉及的學科包括電腦科學、資料與分析、軟體工程,甚至是哲學。

就商業層面而言,人工智慧是可應用於許多領域的一套技術,這些領域包括資料分析、預測、自然語言處理、建議、機器自動化及智慧資料擷取等。

人工智慧、機器學習與深度學習的比較

雖然這些詞彙彼此相關,但它們之間有明確的階層關係:深度學習是機器學習的一種專門技術,而機器學習則是人工智慧這個廣泛領域中的核心範疇。三者主要的差異在於功能、複雜度和特徵工程。

功能

人工智慧

機器學習

深度學習

範圍和定義

最廣泛的概念,這個領域致力於打造系統或機器,執行通常需要人類智慧才能完成的工作 (例如:推論、解決問題、學習、感知)。

AI 的分支,著重於開發能從資料中學習並根據資料做決策的系統,「無需」針對每個情境透過程式設計給予明確的指示。

機器學習的分支,使用多層式人工類神經網路 (ANN),直接從大量原始資料中學習複雜模式和階層式資料表示法。

目標


在機器中模擬或複製人類智慧。

讓機器從資料中學習,準確執行特定工作。

使用深層類神經網路,自動從資料中學習特徵,藉此提高準確度並處理更複雜的模式 (特別是非結構化資料)。

做法

可使用各種技術:邏輯、規則型系統、搜尋演算法、最佳化,以及重要性可能最高的「機器學習」和「深度學習」。

使用各種演算法 (例如:線性迴歸、SVM、決策樹、隨機森林) 來剖析資料、從中學習,並據以做出周全的決策或預測。

採用複雜且包含許多參數的多層式人工類神經網路 (設計靈感源自人腦結構)。

資料條件

會因 AI 類型而有極大的差異。規則式 AI 可能只需少量資料,但仰賴機器學習/深度學習的 AI 則需要大量資料。

須搭配大量結構化或加上標籤的資料,才能有效訓練演算法。效能通常會隨資料量的增加而有所提升。

須搭配「非常龐大」的資料集 (通常包含數百萬個資料點),才能有效訓練深度網路。資料規模對效能表現有極大的影響。

硬體需求

視情況而定,簡單的 AI 可以在基本硬體上運作。

通常可在標準 CPU 上執行,但複雜模型會需要更強大的運算能力。

由於需要大量平行運算,因此通常須搭配高效能運算資源 (尤其是 GPU 或 TPU),才能有效率地完成訓練。

特徵工程


視使用的方法而定。

通常須進行大量的「手動」特徵工程。人類須從原始資料中選取、轉換及建立相關的輸入特徵,才能協助演算法學習。

可「自動」擷取特徵,網路會直接從原始資料透過層層結構逐步學習相關特徵,減少手動進行特徵工程的需求。

訓練時間

非學習型 AI 不適用。如果是機器學習/深度學習型 AI,訓練時間差異極大。

從幾秒到幾小時不等,對於適用機器學習的工作,訓練速度通會比深度學習快。

由於資料集龐大且網路架構複雜,因此通常需要極長的訓練時間 (數小時、數天,甚至是數週)。

可解釋性

視情況而定,規則型系統的可解釋性極高,使用複雜機器學習/深度學習技術的 AI 難以解釋。

視情況而定,較簡單的模型 (例如:決策樹、線性迴歸) 的可解釋性相對較高。複雜模型 (例如:集成方法) 的可解釋性可能較低。

通常缺乏透明度。由於深度學習模型的參數複雜且數量龐大,因此很難瞭解模型做出特定決策的原因

主要用途和範例


專家系統、西洋棋程式、一般問題解決器、虛擬助理和自動駕駛汽車的整體概念。

電子商務或串流服務的推薦系統、垃圾郵件過濾、預測性維護、結構化資料中的醫療診斷、客戶流失預測。

圖片辨識 (標記相片)、自然語言處理 (翻譯、情緒分析)、語音辨識 (語音助理)、自駕車感知系統、進階醫學影像分析。

功能

人工智慧

機器學習

深度學習

範圍和定義

最廣泛的概念,這個領域致力於打造系統或機器,執行通常需要人類智慧才能完成的工作 (例如:推論、解決問題、學習、感知)。

AI 的分支,著重於開發能從資料中學習並根據資料做決策的系統,「無需」針對每個情境透過程式設計給予明確的指示。

機器學習的分支,使用多層式人工類神經網路 (ANN),直接從大量原始資料中學習複雜模式和階層式資料表示法。

目標


在機器中模擬或複製人類智慧。

讓機器從資料中學習,準確執行特定工作。

使用深層類神經網路,自動從資料中學習特徵,藉此提高準確度並處理更複雜的模式 (特別是非結構化資料)。

做法

可使用各種技術:邏輯、規則型系統、搜尋演算法、最佳化,以及重要性可能最高的「機器學習」和「深度學習」。

使用各種演算法 (例如:線性迴歸、SVM、決策樹、隨機森林) 來剖析資料、從中學習,並據以做出周全的決策或預測。

採用複雜且包含許多參數的多層式人工類神經網路 (設計靈感源自人腦結構)。

資料條件

會因 AI 類型而有極大的差異。規則式 AI 可能只需少量資料,但仰賴機器學習/深度學習的 AI 則需要大量資料。

須搭配大量結構化或加上標籤的資料,才能有效訓練演算法。效能通常會隨資料量的增加而有所提升。

須搭配「非常龐大」的資料集 (通常包含數百萬個資料點),才能有效訓練深度網路。資料規模對效能表現有極大的影響。

硬體需求

視情況而定,簡單的 AI 可以在基本硬體上運作。

通常可在標準 CPU 上執行,但複雜模型會需要更強大的運算能力。

由於需要大量平行運算,因此通常須搭配高效能運算資源 (尤其是 GPU 或 TPU),才能有效率地完成訓練。

特徵工程


視使用的方法而定。

通常須進行大量的「手動」特徵工程。人類須從原始資料中選取、轉換及建立相關的輸入特徵,才能協助演算法學習。

可「自動」擷取特徵,網路會直接從原始資料透過層層結構逐步學習相關特徵,減少手動進行特徵工程的需求。

訓練時間

非學習型 AI 不適用。如果是機器學習/深度學習型 AI,訓練時間差異極大。

從幾秒到幾小時不等,對於適用機器學習的工作,訓練速度通會比深度學習快。

由於資料集龐大且網路架構複雜,因此通常需要極長的訓練時間 (數小時、數天,甚至是數週)。

可解釋性

視情況而定,規則型系統的可解釋性極高,使用複雜機器學習/深度學習技術的 AI 難以解釋。

視情況而定,較簡單的模型 (例如:決策樹、線性迴歸) 的可解釋性相對較高。複雜模型 (例如:集成方法) 的可解釋性可能較低。

通常缺乏透明度。由於深度學習模型的參數複雜且數量龐大,因此很難瞭解模型做出特定決策的原因

主要用途和範例


專家系統、西洋棋程式、一般問題解決器、虛擬助理和自動駕駛汽車的整體概念。

電子商務或串流服務的推薦系統、垃圾郵件過濾、預測性維護、結構化資料中的醫療診斷、客戶流失預測。

圖片辨識 (標記相片)、自然語言處理 (翻譯、情緒分析)、語音辨識 (語音助理)、自駕車感知系統、進階醫學影像分析。

展開下一步行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品,開始在 Google Cloud 中建構產品與服務。