現今的企業受到資料轟炸,要制定更好的業務決策,就必須正視這個問題。然而,傳統工具難以分析龐大的資料量,也無法執行複雜的處理作業。員工必須花費大量時間建構、測試、疊代和部署分析模型,才能找出資料中的模式和洞察資訊。機器學習技術可讓機構在資料規模擴大時,迅速取得相關洞察。
新客戶最多可獲得價值 $300 美元的免費抵免額,盡情體驗 Vertex AI 和其他 Google Cloud 產品。
機器學習是人工智慧的一部分,採用類神經網路和深度學習技術,讓系統透過大量資料自主學習並改善成效,完全無須特別編寫程式。
機器學習可讓電腦系統在累積更多「體驗」時,不斷進行調整和強化。因此,只要提供較大且更多要處理的資料集,就能提高這些系統的效能。
幾乎所有產業和業務活動都正在運用機器學習技術。機器學習技術可幫助物流業調整運送和送貨路線、零售業個人化購物體驗以及管理庫存、製造商實現工廠自動化,以及確保各地機構的安全。使用者透過智慧型手機或揚聲器使用語音查詢時,系統會使用機器學習技術解讀要求,並協助找到所需結果。機器學習技術的用途非常廣泛,而且還在持續擴充。
資料產生速率每天都在加快,全世界每天持續產生的資料量更勝以往。如果不使用機器學習技術,幾乎不可能分析並運用所有相關資料。因此,機器學習正在為人類使用電腦以及其他機器打開一個嶄新領域。機器學習技術可協助企業實現重要功能,例如詐欺偵測、辨識安全性威脅、提供個人化建議和推薦內容、透過聊天機器人實現自動化客戶服務、語音轉錄和翻譯、資料分析等。機器學習技術也推動了未來的創新發展,例如自動駕駛車、無人機和飛機、擴增實境與虛擬實境,以及機器人技術。
雖然人工智慧 (AI) 和機器學習 (ML) 是常見的同義詞,但並非可互換的字詞。
人工智慧是電腦科學的一個領域,涉及建立能夠以類似人類智慧的方式推理、學習並採取行動的電腦和機器,或是涉及資料規模超出人類可以分析的系統。這個領域包含許多不同的學科,包括資料分析、統計資料、軟硬體工程、神經科學,甚至是哲學。
人工智慧是電腦科學的一個廣泛類別,但機器學習是其中一種應用方式,涉及訓練機器執行工作,而無需專門為其進行程式設計。機器學習的使用更加明確,是透過如類神經網路、監督式與非監督式學習、決策樹和線性迴歸等技術,從資料中提取知識的方法。
就像機器學習是人工智慧的分支一樣,深度學習也是機器學習的分支。深度學習技術是透過在資料集上訓練類神經網路。類神經網路是一種使用人工神經元系統的模型,這些神經元是運算節點,用於分類及分析資料。資料會匯入類神經網路的第一層,且每個節點都會做出決定,然後將這些資訊傳遞至下一層的多個節點。超過三層的訓練模型被稱為「深層類神經網路」或「深度學習」。一些現代類神經網路有成千上百層。
機器學習運作時,會使用資料集訓練演算法來達到預期結果,例如識別模式或辨識物件。機器學習是指將模型最佳化的過程,讓模型能根據訓練資料樣本預測正確的回應。
假設訓練資料的品質越高,機器學習演算法收到的訓練樣本越多,模型就會越準確。演算法會在訓練期間比對模型與資料,即所謂的「校正程序」。如果結果不符合預期,系統就會重新訓練演算法,直到輸出準確的回應為止。基本上,演算法會從資料中學習,並根據輸入和回應是否符合線性、叢集或其他統計資料相關性來得出結果。
什麼是機器學習的訓練資料?端看所用的機器學習模型類型而定。
廣義來說,機器學習技術中使用了三種模型。
監督式學習是一種機器學習模型,會使用加上標籤的訓練資料 (結構化資料),將特定特徵對應至特定標籤。在監督式學習中,輸出內容為已知的內容 (例如辨識蘋果的圖片),並且模型是根據已知輸出的資料進行訓練。簡單來說,要訓練演算法準確辨識出蘋果圖片,只要餵給它已標記為蘋果的圖片就可以了。
目前最常用的監督式學習演算法包括:
非監督式學習是一種機器學習模型,會使用未加上標籤的資料 (非結構化資料) 來學習模式。有別於監督式學習,輸出內容的「正確性」無法事先得知。相反地,演算法會在沒有人為輸入內容的情況下從資料中學習 (因此不受監督),並根據屬性分類資料。舉例來說,如果演算法提供蘋果和香蕉的圖片,演算法本身會自行分類哪張圖片是蘋果,哪張圖片是香蕉。非監督式學習適合用於建構描述性模型和模式比對。
現今最常用的非監督式學習演算法包括:
另外,還有一種混合的機器學習方法,稱為「半監督式學習」,其中只有部分資料加上標籤。在半監督式學習中,演算法必須設法整理及建構資料,才能獲得已知結果。舉例來說,機器學習模型會被告知結果是梨子,但只有部分訓練資料標示為梨子。
強化學習是一種透過一系列試驗和錯誤實驗、「透過實踐學習」的機器學習模型。「智能體」(agent) 會透過一種回饋循環的過程學習執行指定工作,直至學習成果達到目標範圍為止。代理程式執行工作的情況良好時會獲得正面強化,並在表現不佳時得到負面強化。舉例來說,Google 研究人員訓練了強化學習演算法來玩圍棋遊戲。模型事先不瞭解圍棋規則,只是隨機移動棋子並「學習」最佳走法。演算法是透過正面強化與負面強化訓練,讓機器學習模型在遊戲中擊敗人類玩家。
模式識別
機器學習演算法耗用的資料量越多,就越能找出資料的趨勢和模式。舉例來說,電子商務網站可能會運用機器學習技術來瞭解使用者在網站上的購物方式,並使用這項資訊為使用者提供更符合需求的推薦內容,或是找出有助於開發新產品商機的趨勢資料。
自動化
機器學習和人工智慧可取代人類勞工大部分枯燥乏味的工作。一些繁瑣的業務工作使得員工無法執行更有意義的工作,機器人程序自動化等公用程式可執行這些工作。電腦視覺和物體偵測演算法則可協助機器人從組裝線上挑選和包裝物品。全天候運作的詐騙偵測和威脅評估機器學習技術,可及早找出安全漏洞,避免造成問題。
持續改善
有了合適的資料類型,機器學習演算法就會持續改善,變得更快、更準確。GPT-3 資料集會持續改善其生成文字的方式,就是一個很好的例子。
潛在的偏差
機器學習的成效通常取決於所使用的資料。如果將偏差的資料集提供給機器學習演算法,就會產生偏差的結果。
資料擷取
機器學習需要大量資料才能派上用場。由於許多機器學習用途都以監督式學習為基礎,因此一開始開發演算法時,請務必取得並清理結構化資料,如果資料位在組織內的各個孤立位置,這可能並不容易。
所需專業水準
雖然機器學習、人工智慧和雲端供應商試圖簡化設定及執行機器學習演算法的程序,但機構通常需要程式設計人員和數據資料學家,才能瞭解及運用訓練演算法及其結果。
資源密集型
機器學習可能相當耗時,需要大量的運算資源和員工時間才能開始處理資料並提升成效。
以下舉例說明機器學習的用途:
機器流程自動化
RPA 結合機器學習技術可打造能夠自動處理複雜工作的智慧型自動化解決方案,例如處理貸款的應用程式。
銷售最佳化
客戶資料可以訓練機器學習演算法進行客戶情緒分析、銷售預測分析和客戶流失預測。
客戶服務
機器學習應用程式包括聊天機器人和自動化虛擬助理,可自動執行例行的客戶服務工作,並加快問題解決速度。
安全性
機器學習技術可協助企業改善威脅分析功能,瞭解如何更妥善因應網路攻擊者、駭客和惡意軟體。
數位行銷
機器學習技術可協助行銷人員找出新客戶,適時向合適的目標對象提供適當的行銷資料。
防範詐欺行為
機器學習技術可協助信用卡公司和銀行審查大量交易資料,即時找出可疑的活動。