阿里巴巴(中國(guó))有限公司近日宣布了一項(xiàng)重要更新,其旗下的阿里云PAI Model Gallery平臺(tái)現(xiàn)已全面支持DeepSeek-V3、DeepSeek-R1以及所有經(jīng)過蒸餾的小參數(shù)模型(DeepSeek-R1-Distill)的一鍵部署功能。
Model Gallery作為阿里云PAI人工智能平臺(tái)的核心組件,一直致力于整合全球AI開源社區(qū)中的優(yōu)質(zhì)預(yù)訓(xùn)練模型。這一平臺(tái)涵蓋了LLM、AIGC、計(jì)算機(jī)視覺(CV)、自然語(yǔ)言處理(NLP)等多個(gè)領(lǐng)域,為用戶提供了豐富的模型選擇。
為了方便用戶快速部署所需模型,阿里云PAI提供了詳細(xì)的操作步驟。用戶首先需要登錄PAI控制臺(tái),并根據(jù)實(shí)際需求選擇相應(yīng)的地域。隨后,在工作空間列表中選定目標(biāo)工作空間,進(jìn)入快速開始模塊下的Model Gallery頁(yè)面。
在Model Gallery的模型列表中,用戶可以輕松找到并點(diǎn)擊自己感興趣的模型卡片,例如“DeepSeek-R1-Distill-Qwen-7B”。點(diǎn)擊后,系統(tǒng)將跳轉(zhuǎn)至該模型的詳情頁(yè)面,為用戶提供更多關(guān)于模型的信息。
部署過程同樣簡(jiǎn)便快捷。用戶只需在模型詳情頁(yè)面右上角點(diǎn)擊“部署”按鈕,即可根據(jù)模型類型選擇合適的部署方式。目前,DeepSeek-R1支持vLLM加速部署,而DeepSeek-V3則支持vLLM加速部署和Web應(yīng)用部署。對(duì)于DeepSeek-R1的蒸餾小模型,用戶還可以選擇使用阿里云PAI自研的高性能推理框架BladeLLM和vLLM進(jìn)行加速部署。選定部署方式和資源后,系統(tǒng)將一鍵完成部署,并生成一個(gè)PAI-EAS服務(wù)。
部署成功后,用戶可以在服務(wù)頁(yè)面查看并獲取調(diào)用的Endpoint和Token。為了更方便地使用推理服務(wù),用戶還可以點(diǎn)擊“查看調(diào)用信息”鏈接,返回模型介紹頁(yè)面查看詳細(xì)的調(diào)用方式說明。這一功能極大地提升了用戶的操作便捷性和模型應(yīng)用效率。