近日,國家超算互聯(lián)網(wǎng)平臺傳來消息,宣布將正式上線阿里巴巴開源推理模型QwQ-32B的API接口服務(wù)。據(jù)悉,用戶將有機(jī)會免費獲得100萬Tokens的使用額度。
QwQ-32B是阿里巴巴Qwen團(tuán)隊最新研發(fā)的一款推理模型,其構(gòu)建基礎(chǔ)為Qwen2.5-32B與強(qiáng)化學(xué)習(xí)的結(jié)合。根據(jù)官方發(fā)布的基準(zhǔn)評測結(jié)果,QwQ-32B在數(shù)學(xué)能力測試AIME24評測集以及代碼能力評估LiveCodeBench中的表現(xiàn),與DeepSeek-R1相當(dāng),甚至超越了o1-mini及同尺寸的R1蒸餾模型。
國家超算互聯(lián)網(wǎng)平臺迅速完成了對QwQ-32B的全面適配工作,包括基于vLLM和PyTorch的推理適配。平臺同步上線了QwQ-32B的模型鏡像和模型文件,用戶無需下載至本地,即可一鍵啟動Notebook功能,在平臺上進(jìn)行QwQ-32B模型的開發(fā),或引入專有數(shù)據(jù)進(jìn)行進(jìn)一步的私有化部署。
除了QwQ-32B模型API接口服務(wù)外,國家超算互聯(lián)網(wǎng)平臺近期還推出了DeepSeek-R1全家桶、最高671B滿血版的API部署與AI Web應(yīng)用服務(wù)。這一系列的舉措,無疑為用戶提供了更為豐富和強(qiáng)大的AI模型選擇。
對于如何使用國家超算互聯(lián)網(wǎng)平臺的QwQ-32B API調(diào)用服務(wù),平臺也給出了詳細(xì)的步驟指南。用戶只需在超算互聯(lián)網(wǎng)商城首頁搜索QwQ-32B,并點擊“去使用”按鈕,即可進(jìn)入API接口信息頁面。在頁面中,用戶可以根據(jù)需求選擇訪問形式,包括使用Postman、Apifox等HTTP工具訪問,使用Python代碼訪問,以及在終端頁面直接訪問。
目前,國家超算互聯(lián)網(wǎng)平臺已經(jīng)連接了國內(nèi)14個省份的20多家超算和智算中心,平臺上提供了超過6500款算力商品,其中AI模型服務(wù)近240款。這些模型服務(wù)既包括了DeepSeek、Qwen等國內(nèi)開源模型,也涵蓋了Llama、Stable Diffusion、Gemma等國外AI開源模型。用戶可以根據(jù)自己的需求,在平臺上選擇適合的AI模型進(jìn)行使用。