在人工智能與邊緣計算的交匯點上,微軟近日邁出了重要一步,宣布推出專為NPU(神經(jīng)處理單元)優(yōu)化的DeepSeek-R1模型。這一創(chuàng)新之舉不僅標(biāo)志著微軟對邊緣計算潛力的深刻洞察,也預(yù)示著搭載高通驍龍X芯片的Copilot+ PC將率先迎來一場技術(shù)革命,隨后英特爾酷睿Ultra 200V等平臺也將陸續(xù)加入這一行列。
微軟通過官方渠道宣布,DeepSeek-R1的首個版本——DeepSeek-R1-Distill-Qwen-1.5B,已正式入駐Azure AI Foundry和GitHub,供開發(fā)者下載使用。同時,微軟還透露,參數(shù)規(guī)模更大的7B和14B版本也即將面世,這將極大地助力開發(fā)者充分挖掘Copilot+ PC中NPU的強大性能。
微軟強調(diào),Copilot+ PC上的NPU開創(chuàng)了一種全新的AI應(yīng)用范式。在這一范式下,生成式AI不僅能夠在被調(diào)用時迅速響應(yīng),還能支持半連續(xù)運行的服務(wù)模式。這一特性使得開發(fā)者能夠利用AI推理引擎,構(gòu)建出更加主動、持續(xù)的用戶體驗。
為了實現(xiàn)這一目標(biāo),微軟在Phi Silica項目的基礎(chǔ)上,積累了豐富的推理優(yōu)化經(jīng)驗和技術(shù)。這些經(jīng)驗和技術(shù)被巧妙地融入到針對NPU優(yōu)化的DeepSeek模型中,包括模型分割以實現(xiàn)性能與效率的最佳平衡、低比特率量化以及Transformer模型到NPU的映射等。微軟還借助Windows Copilot Runtime(WCR)和ONNX QDQ格式,在多樣化的Windows生態(tài)系統(tǒng)中實現(xiàn)了模型的廣泛部署。
為了讓更多開發(fā)者能夠輕松體驗DeepSeek模型的魅力,微軟提供了便捷的下載途徑。只需在Visual Studio Code中安裝AI Toolkit擴展,開發(fā)者即可輕松獲取這一創(chuàng)新成果。同時,以O(shè)NNX QDQ格式優(yōu)化的DeepSeek模型也將很快出現(xiàn)在AI Toolkit的模型目錄中,供開發(fā)者直接從Azure AI Foundry中拉取使用。
微軟還通過實例展示了原始模型與NPU優(yōu)化模型之間的差異。在相同的提示下,原始模型和NPU優(yōu)化模型給出了略有不同的響應(yīng)。這一對比不僅彰顯了NPU優(yōu)化模型在推理能力上的提升,也進(jìn)一步驗證了微軟在模型優(yōu)化方面的深厚實力。