“在阿里云粵港澳大灣區(qū)云峰會上,阿里云智能云原生應用平臺總經(jīng)理丁宇宣布,Serverless 容器服務 ASK全面升級,進一步幫助企業(yè)和開發(fā)者降本提效。”
6 月 1 日在阿里云粵港澳大灣區(qū)云峰會上,阿里云智能云原生應用平臺總經(jīng)理丁宇宣布,Serverless 容器服務 ASK全面升級,進一步幫助企業(yè)和開發(fā)者降本提效。
Gartner 曾預測,2023 年 70% 的 AI 應用將基于容器和 Serverless 技術開發(fā)。作為云原生的重要技術組成,K8s 已經(jīng)被開發(fā)者和企業(yè)廣泛認可,然而其自身復雜性和陡峭的學習曲線依然讓人望而生畏。
阿里云在 2018 年發(fā)布了首個Serverless容器服務ASK,其本質是將容器的運行時和具體的節(jié)點運行環(huán)境解耦,讓用戶無需管理K8s節(jié)點和服務器,即可直接部署應用,大幅降低容器服務的使用門檻。目前,ASK在容器化應用、在線業(yè)務彈性、AI/大數(shù)據(jù)計算類任務等場景中被廣泛使用。
此次 ASK 的全新升級,進一步整合了阿里云基礎設施的能力,在使用成本、創(chuàng)建效率、異構資源兼容、彈性供給保障等方面帶來顯著提升,解決開發(fā)者在使用K8s的復雜性挑戰(zhàn),也順應了 AI場景爆發(fā)下催生的新需求。
丁宇介紹,本次ASK升級涵蓋了多個維度,包括對組件的全托管支持、AI鏡像的秒級拉取能力,還降低了客戶的使用成本。具體來說:
1、組件全托管,零K8s運維成本
ASK新增對 CoreDNS、Metrics Server 等十多個 K8s 核心組件的托管支持,提供動態(tài)容量規(guī)劃能力,客戶無需自行部署維護,最大化降低運維復雜度。同時,ASK也新增了智能化風險識別能力,支持自動化升級K8s版本,避免升級導致的應用故障或異常風險。
2、極致彈性,準確率提升80%
ASK 提供首界首創(chuàng)基于容器鏡像緩存的 AI 大鏡像秒級拉取能力,AI 應用啟動時間降低90%。并且提供端到端的彈性加速,面向AI/大數(shù)據(jù)工作負載容器化進行全棧優(yōu)化,通過數(shù)據(jù)集加速提升 30% 訪問性能;此外,本次 ASK 還增強了智能彈性預測 AHPA能力,相比人工配置,彈性準確率提升 80%;同時新增對于 GPU 的支持。
3、普惠算力,性價比提升40%
為了給客戶提供更好的服務,釋放技術紅利,讓算力更普惠,ASK新增U實例規(guī)格支持,統(tǒng)一支持多款處理器,相比上一代主售實例降價高達40%。新增SavingPlan彈性版本,面向應用非固定波峰波谷場景,額外成本優(yōu)化10%以上。為進一步讓價格更透明,新增成本套件支持,清晰洞察彈性資源成本,讓成本治理更便捷。
以數(shù)禾科技為例,這是一家為金融機構提供高效的智能零售金融解決方案的公司,對于模型的計算能力包括計算速度、計算結果準確性、計算數(shù)據(jù)實時性等,有很高的要求。而當前的困擾是支撐模型計算的底層應用資源無法根據(jù)請求量來調整機器資源支持運算能力,這也是當前業(yè)務快速發(fā)展過程中亟待解決的痛點。同時,隨著模型在線推理服務數(shù)量的增加,數(shù)禾的模型服務也變得越來越龐大、臃腫,難以管理。這種狀況不僅導致了資源浪費,還增加了維護和升級的成本。
為了解決這些“頑疾”,數(shù)禾科技采用阿里云 ASK 部署線上模型,無需 K8s 節(jié)點管理,根據(jù)實時流量動態(tài)使用 POD,資源成本節(jié)省60%;通過 ASK Knative 服務,解決了數(shù)禾模型的灰度發(fā)布和多版本并存問題;得益于ASK 自動伸縮和縮容到 0 的優(yōu)勢,降低運行成本,大幅提升服務可用性。
“使用阿里云容器服務 Knative 和 ECI 虛擬節(jié)點配合部署,保證線上模型應對突發(fā)流量的穩(wěn)定性提升的同時,又使資源利用效率顯著提高,極大地節(jié)約了資源成本?!睌?shù)禾科技 AI 實驗室 AI 平臺負責人周偉鵬表示。
目前,ASK 已加入阿里云飛天免費試用計劃,為開發(fā)者、企業(yè)提供一定額度的免費試用資源。3分鐘就可以創(chuàng)建Kubernetes集群,開啟容器彈性之旅。