近期,一場(chǎng)圍繞華為技術(shù)的爭(zhēng)議風(fēng)暴正在科技界迅速蔓延。爭(zhēng)議的焦點(diǎn)在于,華為最新發(fā)布的盤古Pro MoE模型與阿里巴巴的Qwen-2.5L4B模型之間,存在高達(dá)0.927的相似度,這一數(shù)值遠(yuǎn)遠(yuǎn)超過(guò)了行業(yè)內(nèi)通常認(rèn)定的閾值0.7。更為引人注目的是,在華為的代碼庫(kù)中,竟然出現(xiàn)了“Copyright 2024 Alibaba Group”的版權(quán)聲明,這無(wú)疑為這場(chǎng)爭(zhēng)議火上澆油。
6月30日,華為宣布在華為云上開(kāi)源了包括盤古Pro MoE在內(nèi)的多項(xiàng)技術(shù)成果,這些成果迅速吸引了業(yè)界的廣泛關(guān)注,并收獲了大量贊美。然而,僅僅幾天之后,質(zhì)疑的聲音便接踵而至。7月4日,一位研究者在GitHub上發(fā)布了一份名為“LLM?Fingerprint”的研究報(bào)告,報(bào)告指出,通過(guò)模型指紋技術(shù)分析,發(fā)現(xiàn)盤古Pro MoE模型的注意力層參數(shù)與阿里Qwen模型存在顯著的重疊,甚至在部分模塊達(dá)到了逐層復(fù)現(xiàn)的程度。
面對(duì)質(zhì)疑,華為迅速做出了回應(yīng)。7月5日,華為諾亞方舟實(shí)驗(yàn)室發(fā)表聲明,堅(jiān)稱盤古Pro MoE是基于昇騰硬件自主研發(fā)的,并非基于其他廠商的模型進(jìn)行增量訓(xùn)練。同時(shí),華為也承認(rèn),在模型開(kāi)發(fā)過(guò)程中,部分基礎(chǔ)組件代碼確實(shí)參考了開(kāi)源實(shí)踐,但這一切都是嚴(yán)格遵循開(kāi)源許可證要求的。然而,華為的這一聲明并未能平息質(zhì)疑,反而引發(fā)了更多的爭(zhēng)議。
事實(shí)上,這并非華為首次面臨抄襲的質(zhì)疑。回顧華為的技術(shù)史,不難發(fā)現(xiàn),類似的爭(zhēng)議曾多次上演。從2009年被指控抄襲Quintel的專利技術(shù),到2016年被質(zhì)疑購(gòu)買土耳其教授的Polar碼專利并宣稱自研,再到2021年鴻蒙系統(tǒng)被指“套殼安卓”,華為似乎總是處于爭(zhēng)議的漩渦之中。此次“抄襲門”事件,更是被網(wǎng)友戲稱為“歷史重演”。
此次事件不僅揭示了AI行業(yè)“偽創(chuàng)新”的現(xiàn)狀,也引發(fā)了關(guān)于開(kāi)源合規(guī)和行業(yè)自律的討論。有業(yè)內(nèi)人士指出,開(kāi)源不等于無(wú)主之地,華為的行為暴露了其對(duì)開(kāi)源精神的誤解。合規(guī)不是擋箭牌,尊重原創(chuàng)才是底線。同時(shí),也有聲音呼吁加快構(gòu)建“開(kāi)源合規(guī)指引”和“行業(yè)自律標(biāo)準(zhǔn)”,以避免“套殼炒模”的負(fù)面路徑。
隨著爭(zhēng)議的持續(xù)發(fā)酵,華為可能面臨前所未有的信任危機(jī)。若華為無(wú)法通過(guò)技術(shù)細(xì)節(jié)公開(kāi)、第三方審計(jì)等方式證明其清白,將進(jìn)一步削弱其“技術(shù)自研”的公信力。長(zhǎng)期以來(lái),華為一直以“技術(shù)自研”和“民族脊梁”的形象示人,這一形象本質(zhì)上是一種營(yíng)銷策略,旨在爭(zhēng)取政策支持和用戶認(rèn)同。然而,在AI技術(shù)高度復(fù)雜化和競(jìng)爭(zhēng)激烈的當(dāng)下,技術(shù)爭(zhēng)議可能成為其人設(shè)的“軟肋”。
更為諷刺的是,華為創(chuàng)始人任正非曾在內(nèi)部講話中強(qiáng)調(diào)創(chuàng)新的重要性,而華為高管余承東也曾痛斥抄襲行為。然而,如今這些言論卻被網(wǎng)友拿來(lái)反諷,質(zhì)疑華為所謂的“創(chuàng)新”是否只是“抄作業(yè)”。開(kāi)源不是抄襲的溫床,技術(shù)自信更不該建立在別人的代碼之上。我們期待華為能夠給出經(jīng)得起推敲的解釋,而非用“合規(guī)”二字掩蓋創(chuàng)新惰性。