【AWS 2022新戰略3：以SageMaker為核心，降低ML門檻擴大影響力】完善端到端資料戰略，AI工具鏈變成生態系平臺

AWS的AI戰略就是要涵蓋企業從資料、分析到AI的完整旅程，來提供最完整的服務，還有一套可以涵蓋端到端的安全控管機制。（圖片來源／AWS）

5年前發表的AI工具服務，逐漸成了AWS發展AI生態系的關鍵平臺。

數據市場向來是公雲業者最激烈的戰場，這幾年的戰火更燒到AI市場的競爭。AWS早在2017年搶進了機器學習開發工具的競爭，推出機器訓練環境的全託管服務SageMaker，到了今年，這款工具類服務，不只發展出了一個完整的機器學習工具鏈，甚至向下串聯了AWS的各種基礎架構服務，資料服務，也向上整合了多種AI應用服務，AI垂直產業解決方案，AWS在2021年年度大會上，更完整揭露要邁向一個完整AI生態系平臺的大戰略。

要了解AWS這個AI大戰略的全貌，不能單從AI產品更迭來看，而要從更大領域的資料產品面來觀察。

AWS機器學習副總裁Swami Sivasubramanian在機器學習主題演講中指出，企業需要一套端到端的數據平臺，涵蓋儲存、存取、分析、視覺化到預測，甚至為了確保正確對象在適當時間存取資料，還需要針對每一款數據工具，實施資安和存取控管。

他所提出的這個企業數據戰略，也是AWS在機器學習市場的戰略架構，甚至可以說，這個架構就是AWS規劃產品藍圖的骨架

AWS提出端到端的資料戰略

他就直言：「AWS的AI戰略就是要涵蓋企業從資料、分析到AI的完整旅程，來提供最完整的服務，還有一套涵蓋端到端的安全控管機制。」

從12年前推出Amazon RDS開始，至今都朝這個目標邁進，推出超過上百項機器學習服務，目前已經超過150萬個用戶。

從資料到AI的角度來看，AWS今年看似各自分散，眼花撩亂的新資料服務、資料湖新強化、ML工具翻新，都是為了強化這個端到端的資料戰略，包括兩大特色，一是補齊原有產品缺口，另一類則用來擴大既有產品布局。

強化資料安全性缺口是今年AI產品發表的第一個亮點。AWS新任執行長Adam Selipsky親自發表的資料湖合規工具Lake Formation新功能，可以做到單欄或單筆等級（Row and Cell-level）的權限控管，可針對單一個欄或行，來設定不同角色的存取權限，Lake Formatio會依據這些權限，自動過濾資料湖對外提供的資料，針對獲得授權的使用者，提供他們所能存取的資料。

Lake Formation新功能看似只是資料面新機制，但若回到端到端資料戰略，可以看到與另一個新產品的呼應。

AWS另一款引起眾人注目的新發表是無程式碼ML工具SageMaker Canvas，這是可以用拖拉式操作，不用寫程式就能建立ML模型，從資料準備、模型建置、訓練到推論執行都能包辦。

但將這麼方便的工具提供給更多人，讓他們更容易接觸原始資料，如何進行安全控管會成為企業採用最大考量。Lake Formation更精細的資料存取控管正補齊了SageMaker Canvas的安全性能力。這個從資料源頭進行精細資料權限控管的作法，可以一路套用到整個資料處理流程、機器學習開發流程。AWS就不用急著在各類數據工具上打造安全機制，從源頭端工具下手更有效率。

兩個看似無關的新功能，彼此卻可以相互加乘和互補，這正是AWS背後有這樣一套端到端資料戰略的思考。

圖片來源／AWS
AWS機器學習架構（AWS ML Stack），清楚呈現出AWS不同AI服務和布局的定位，中間ML層的SageMaker工具鏈是今年發表重點。

AWS今年聚焦ML工具層推廣

Swami Sivasubramanian在演講中，揭露了更詳細的AWS機器學習架構（AWS ML Stack），清楚呈現出AWS不同AI服務和布局的定位，可以分為底層的各種ML框架和基礎架構，中間的ML工具層，以及最上層的AI應用層服務。

底層ML框架和基礎架構包括了主流深度學習框架、各種雲端運算服務、GPU、FPGU等，這些是AWS擅長也持續演進的產品線。而ML工具層服務的目標是降低企業建置模型的門檻，以及擴大模型導入規模，核心產品就是2017年推出的SageMaker，逐漸發展成一套涵蓋了建置、訓練到部署的工具鏈服務。

最上層AI應用層服務，則包括了兩大類，一類是通用型核心AI服務，如視覺辨識、語音AI、文字辨識等，另一類則是專門性AI應用服務，這是從商業需求來定義的AI服務，包括了個人化AI、內部搜尋、詐欺偵測，或是產業AI服務。

AWS今年在最底層的基礎架構服務上，透過自行研發的晶片，也有不少的新進展，而上層的AI應用層，則是去年AWS年度大會的重點，垂直產業AI解決方案和特定商業需求的AI解方。

今年AWS發表重點則回到中間的SageMaker工具鏈，過去幾年已經發展出了一整套ML開發工具組服務，後來也推出整合式開發工具SageMaker Studio，還進一步往資料預處理，例如資料標記服務發展。

今年6項SageMaker新功能中，一方面推出了利用GPU來提高訓練速度的訓練編譯器，AWS宣稱可以提高50%訓練速度。而推論推薦引擎則可以自動向企業推薦可用的運算資源，來加快部署，另外還新推出了無伺服器推論服務，也能降低ML落地成推論服務的上線門檻。

另一類SageMaker新功能則是用來降低機器學習使用門檻，除了無程式碼ML工具，原有標記服務Ground Truth推出可以讓企業自訂標記流程的Plus版，不用像過去只能用內建流程，等於只能用來標記AWS提供的資料用途。

另外，SageMaker Studio 也推出了通用型筆記本，可以在單一筆記本中，直接存取使用AWS大數據平臺EMR的上執行的Spark、Hive和Presto，或是使用在Amazon S3上執行的資料湖，將資料工程、資料分析和機器學習的工作流程，整合到單一筆記本中，來進行機器學習模型建置，這是鎖定專業資料科學家和資料工程師的新工具。

而另一項新推出的Canvas無碼ML工具，則瞄準三大類業務AI需求，從行銷類需求，如銷售預測，顧客生命週期價值預測，混合行銷，或是財務類需求，如信用風險評分、貸款遲繳預測、詐欺偵測，以及維運管理類，如庫存計畫和排程、交貨時間預測、預測性維護等，AWS想要將這三類需求的非技術人員，也變成了ML模型開發成員，來擴大自家ML工具鏈的影響範圍。

最後還有一項AWS擴大AI產品影響力的關鍵工具，就是推出了SageMaker的免費精簡版Studio Lab。只要用一個電子郵件帳號就能註冊，15GB容量，也有一定可用的免費CPU或GPU運算資源可用，要來吸引更多人嘗試，甚至作為新手的練習之用。AWS還宣布每年提供1千萬美元的獎學金計畫，訓練2千位高中生和大學生的AI開發能力。

回到AWS機器學習架構來看，中間工具層從商用級付費工具，進一步提供免費版工具，這是一個吸引更多人採用的推廣戰術，再加上無程式碼ML工具來拉攏非技術人員，拉近AWS自己的AI世界，隨著這些新手越來越依賴AI，也就會使用AWS上層AI應用和下層AI基礎架構，這正是AWS今年轉而全力擴大AI工具鏈的關鍵布局。

https://www.ithome.com.tw/news/148436