【AWS 2022新戰略3:以SageMaker為核心,降低ML門檻擴大影響力】完善端到端資料戰略,AI工具鏈變成生態系平臺

AWS的AI戰略就是要涵蓋企業從資料、分析到AI的完整旅程,來提供最完整的服務,還有一套可以涵蓋端到端的安全控管機制。(圖片來源/AWS)

5年前發表的AI工具服務,逐漸成了AWS發展AI生態系的關鍵平臺。

數據市場向來是公雲業者最激烈的戰場,這幾年的戰火更燒到AI市場的競爭。AWS早在2017年搶進了機器學習開發工具的競爭,推出機器訓練環境的全託管服務SageMaker,到了今年,這款工具類服務,不只發展出了一個完整的機器學習工具鏈,甚至向下串聯了AWS的各種基礎架構服務,資料服務,也向上整合了多種AI應用服務,AI垂直產業解決方案,AWS在2021年年度大會上,更完整揭露要邁向一個完整AI生態系平臺的大戰略。

要了解AWS這個AI大戰略的全貌,不能單從AI產品更迭來看,而要從更大領域的資料產品面來觀察。

AWS機器學習副總裁Swami Sivasubramanian在機器學習主題演講中指出,企業需要一套端到端的數據平臺,涵蓋儲存、存取、分析、視覺化到預測,甚至為了確保正確對象在適當時間存取資料,還需要針對每一款數據工具,實施資安和存取控管。

他所提出的這個企業數據戰略,也是AWS在機器學習市場的戰略架構,甚至可以說,這個架構就是AWS規劃產品藍圖的骨架

AWS提出端到端的資料戰略

他就直言:「AWS的AI戰略就是要涵蓋企業從資料、分析到AI的完整旅程,來提供最完整的服務,還有一套涵蓋端到端的安全控管機制。」

從12年前推出Amazon RDS開始,至今都朝這個目標邁進,推出超過上百項機器學習服務,目前已經超過150萬個用戶。

從資料到AI的角度來看,AWS今年看似各自分散,眼花撩亂的新資料服務、資料湖新強化、ML工具翻新,都是為了強化這個端到端的資料戰略,包括兩大特色,一是補齊原有產品缺口,另一類則用來擴大既有產品布局。

強化資料安全性缺口是今年AI產品發表的第一個亮點。AWS新任執行長Adam Selipsky親自發表的資料湖合規工具Lake Formation新功能,可以做到單欄或單筆等級(Row and Cell-level)的權限控管,可針對單一個欄或行,來設定不同角色的存取權限,Lake Formatio會依據這些權限,自動過濾資料湖對外提供的資料,針對獲得授權的使用者,提供他們所能存取的資料。

Lake Formation新功能看似只是資料面新機制,但若回到端到端資料戰略,可以看到與另一個新產品的呼應。

AWS另一款引起眾人注目的新發表是無程式碼ML工具SageMaker Canvas,這是可以用拖拉式操作,不用寫程式就能建立ML模型,從資料準備、模型建置、訓練到推論執行都能包辦。

但將這麼方便的工具提供給更多人,讓他們更容易接觸原始資料,如何進行安全控管會成為企業採用最大考量。Lake Formation更精細的資料存取控管正補齊了SageMaker Canvas的安全性能力。這個從資料源頭進行精細資料權限控管的作法,可以一路套用到整個資料處理流程、機器學習開發流程。AWS就不用急著在各類數據工具上打造安全機制,從源頭端工具下手更有效率。

兩個看似無關的新功能,彼此卻可以相互加乘和互補,這正是AWS背後有這樣一套端到端資料戰略的思考。

圖片來源/AWS
AWS機器學習架構(AWS ML Stack),清楚呈現出AWS不同AI服務和布局的定位,中間ML層的SageMaker工具鏈是今年發表重點。

AWS今年聚焦ML工具層推廣

Swami Sivasubramanian在演講中,揭露了更詳細的AWS機器學習架構(AWS ML Stack),清楚呈現出AWS不同AI服務和布局的定位,可以分為底層的各種ML框架和基礎架構,中間的ML工具層,以及最上層的AI應用層服務。

底層ML框架和基礎架構包括了主流深度學習框架、各種雲端運算服務、GPU、FPGU等,這些是AWS擅長也持續演進的產品線。而ML工具層服務的目標是降低企業建置模型的門檻,以及擴大模型導入規模,核心產品就是2017年推出的SageMaker,逐漸發展成一套涵蓋了建置、訓練到部署的工具鏈服務。

最上層AI應用層服務,則包括了兩大類,一類是通用型核心AI服務,如視覺辨識、語音AI、文字辨識等,另一類則是專門性AI應用服務,這是從商業需求來定義的AI服務,包括了個人化AI、內部搜尋、詐欺偵測,或是產業AI服務。

AWS今年在最底層的基礎架構服務上,透過自行研發的晶片,也有不少的新進展,而上層的AI應用層,則是去年AWS年度大會的重點,垂直產業AI解決方案和特定商業需求的AI解方。

今年AWS發表重點則回到中間的SageMaker工具鏈,過去幾年已經發展出了一整套ML開發工具組服務,後來也推出整合式開發工具SageMaker Studio,還進一步往資料預處理,例如資料標記服務發展。

今年6項SageMaker新功能中,一方面推出了利用GPU來提高訓練速度的訓練編譯器,AWS宣稱可以提高50%訓練速度。而推論推薦引擎則可以自動向企業推薦可用的運算資源,來加快部署,另外還新推出了無伺服器推論服務,也能降低ML落地成推論服務的上線門檻。

另一類SageMaker新功能則是用來降低機器學習使用門檻,除了無程式碼ML工具,原有標記服務Ground Truth推出可以讓企業自訂標記流程的Plus版,不用像過去只能用內建流程,等於只能用來標記AWS提供的資料用途。

另外,SageMaker Studio 也推出了通用型筆記本,可以在單一筆記本中,直接存取使用AWS大數據平臺EMR的上執行的Spark、Hive和Presto,或是使用在Amazon S3上執行的資料湖,將資料工程、資料分析和機器學習的工作流程,整合到單一筆記本中,來進行機器學習模型建置,這是鎖定專業資料科學家和資料工程師的新工具。

而另一項新推出的Canvas無碼ML工具,則瞄準三大類業務AI需求,從行銷類需求,如銷售預測,顧客生命週期價值預測,混合行銷,或是財務類需求,如信用風險評分、貸款遲繳預測、詐欺偵測,以及維運管理類,如庫存計畫和排程、交貨時間預測、預測性維護等,AWS想要將這三類需求的非技術人員,也變成了ML模型開發成員,來擴大自家ML工具鏈的影響範圍。

最後還有一項AWS擴大AI產品影響力的關鍵工具,就是推出了SageMaker的免費精簡版Studio Lab。只要用一個電子郵件帳號就能註冊,15GB容量,也有一定可用的免費CPU或GPU運算資源可用,要來吸引更多人嘗試,甚至作為新手的練習之用。AWS還宣布每年提供1千萬美元的獎學金計畫,訓練2千位高中生和大學生的AI開發能力。

回到AWS機器學習架構來看,中間工具層從商用級付費工具,進一步提供免費版工具,這是一個吸引更多人採用的推廣戰術,再加上無程式碼ML工具來拉攏非技術人員,拉近AWS自己的AI世界,隨著這些新手越來越依賴AI,也就會使用AWS上層AI應用和下層AI基礎架構,這正是AWS今年轉而全力擴大AI工具鏈的關鍵布局。

https://www.ithome.com.tw/news/148436