端側(cè)大模型迎來"輕"革命:移遠(yuǎn)通信xRWKV 打造"輕量AI大腦"

2025-07-28 14:20 來源:美通社 作者:電源網(wǎng)

7月27日,移遠(yuǎn)通信宣布與RWKV公司建立全面合作關(guān)系,雙方將依托移遠(yuǎn)的算力平臺,優(yōu)化并支持RWKV最新模型架構(gòu),共同推動大模型在端側(cè)設(shè)備的低資源占用部署。此次合作成果于2025世界人工智能大會(WAIC)首次亮相,標(biāo)志著端側(cè)大模型解決方案向更高性能、更廣場景的應(yīng)用邁出關(guān)鍵一步。


RWKV(Receptance Weighted Key Value)是全球領(lǐng)先的RNN大模型架構(gòu),它成功結(jié)合了遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的恒定復(fù)雜度和高效串行推理,以及Transformer的并行處理優(yōu)勢,使其在文本生成、時間序列、圖像和視頻、語音和音樂等領(lǐng)域表現(xiàn)出色,推理成本和訓(xùn)練成本顯著低于Transformer。

這項技術(shù)的核心突破在于引入RWKV算子替代Transformer的位置編碼和多頭注意力機(jī)制。這一革新有效解決了Transformer在處理長序列時的空間和時間復(fù)雜度問題,在確保模型性能不受影響的前提下,實現(xiàn)了內(nèi)存占用恒定、token計算復(fù)雜度恒定,意味著運算過程更高效、更省力。這一特性讓 RWKV 在端側(cè)設(shè)備部署中展現(xiàn)出顯著優(yōu)勢:處理長序列時速度更快、內(nèi)存占用更低,相當(dāng)于為終端設(shè)備配備了一個 "輕量化的AI大腦"。

在本次世界人工智能大會(WAIC)上,基于高通 QCS8550 平臺的兩大 RWKV 聯(lián)合解決方案將重磅登場:

RWKV Chat:思考永續(xù)

RWKV Chat是一款離線AI聊天應(yīng)用,無需聯(lián)網(wǎng)即可實現(xiàn)推理、深度對話與文本續(xù)寫,支持個性化會話配置,成為用戶的"口袋級"生產(chǎn)力伙伴。例如其中的RWKV7-G1 2.9B模型在高通手機(jī)平臺的速度可達(dá)30 token/s,且由于RWKV架構(gòu)無需KV cache,在超長推理后仍然可以速度恒定,內(nèi)存占用恒定。


RWKV Sudoku:超長CoT

RWKV 數(shù)獨則展示了20M超小參數(shù)模型在超長鏈?zhǔn)酵评恚–oT)下的數(shù)學(xué)解題能力,憑借恒定內(nèi)存與極少token消耗,輕松破解復(fù)雜數(shù)獨,直觀呈現(xiàn)RWKV架構(gòu)在端側(cè)的高效潛能。


在Transformer架構(gòu)主導(dǎo)大模型領(lǐng)域的當(dāng)下,移遠(yuǎn)通信以前瞻性的眼光,積極布局非Transformer的技術(shù)路線,致力于為客戶提供更低算力、更少內(nèi)存消耗的解決方案。

此次展出的RWKV7-G1 1.5B模型,經(jīng)過移遠(yuǎn)通信的工程優(yōu)化后,在SG885G模組上的實測數(shù)據(jù)表現(xiàn)亮眼,明顯優(yōu)于同等參數(shù)量的Transformer架構(gòu)的模型,具體來說,在Prefill階段:

-平均耗時減少83%
-平均處理速度提升345%

在Decoding階段:

-平均CPU使用減少23%
-平均內(nèi)存使用減少36%
-平均功耗減少18%

移遠(yuǎn)通信的SG885G基于高通QCS8550平臺開發(fā),其AI綜合算力高達(dá)48 TOPS,能夠支撐7B左右參數(shù)級的多模態(tài)模型在本地化推理,從而實現(xiàn)實時視覺理解與多模態(tài)信息融合。在模型兼容性方面,移遠(yuǎn)構(gòu)建了強(qiáng)大的端側(cè)適配體系,率先實現(xiàn)對Llama、通義千問、DeepSeek等主流開源模型的全方位兼容,兼容的參數(shù)范圍覆蓋0.5B至8B,打造出了功能強(qiáng)大的端側(cè)大模型超級平臺。此外,在架構(gòu)創(chuàng)新上,SG885G支持運行非Transformer路線的RWKV7架構(gòu),這一特征顯著降低了對算力和內(nèi)存的需求。

移遠(yuǎn)通信首席運營官張棟表示:"此次與RWKV的戰(zhàn)略合作,是移遠(yuǎn)通信 ‘讓終端擁有AI大心臟'技術(shù)理念的關(guān)鍵落地!RWKV的線性注意力架構(gòu),突破性地解決了端側(cè)設(shè)備的長序列處理瓶頸,再結(jié)合移遠(yuǎn)的高算力模組,成功將AI大模型‘裝進(jìn)'了物聯(lián)網(wǎng)終端。當(dāng)農(nóng)機(jī)能‘看懂'土壤的干濕,當(dāng)手表可以‘提醒'健康風(fēng)險,AI就不再是飄在云里的概念,而是真真切切來到了田間地頭、來到了你我的手腕上,讓科技真正服務(wù)于每一處需要它的地方。"

RWKV聯(lián)合創(chuàng)始人&COO羅璇表示:"我們希望讓每一臺設(shè)備都聰明起來,就像為它們植入了會思考的‘大腦'。隨著RWKV架構(gòu)在移遠(yuǎn)算力平臺上實現(xiàn)規(guī)模化部署,讓終端設(shè)備突破資源限制,構(gòu)建‘云端能力+本地智能'的雙引擎協(xié)同生態(tài),為萬物智聯(lián)時代奠定技術(shù)基石。"

移遠(yuǎn)通信與RWKV的戰(zhàn)略合作,不僅是一次技術(shù)與硬件的強(qiáng)強(qiáng)聯(lián)合,更是推動智能計算走向普惠的關(guān)鍵里程碑,讓"AI大模型"真正走出云端,融入萬物。

7月26日-29日,誠邀蒞臨WAIC 2025移遠(yuǎn)展臺(H1 D815),近距離體驗端側(cè)大模型解決方案的前沿科技魅力。

關(guān)于移遠(yuǎn)通信

上海移遠(yuǎn)通信技術(shù)股份有限公司(股票代碼:603236)是全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,擁有完備的IoT產(chǎn)品和服務(wù),涵蓋蜂窩模組(5G/4G/3G/2G/LPWA)、車載前裝模組、智能模組(5G/4G/邊緣計算)、短距離通信模組(Wi-Fi&BT)、GNSS定位模組、衛(wèi)星通信模組、天線等硬件產(chǎn)品,以及物聯(lián)網(wǎng)平臺、認(rèn)證與測試服務(wù)、RTK網(wǎng)絡(luò)校正方案、工業(yè)智能、智慧農(nóng)業(yè)等服務(wù)與解決方案。公司具備豐富的行業(yè)經(jīng)驗,產(chǎn)品廣泛應(yīng)用于智慧交通、智慧能源、金融支付、智慧城市、無線網(wǎng)關(guān)、智慧農(nóng)業(yè)&環(huán)境監(jiān)控、智慧工業(yè)、智慧生活&醫(yī)療健康、智能安全等領(lǐng)域。更多信息,敬請訪問移遠(yuǎn)官網(wǎng)https://www.quectel.com.cn/,關(guān)注微信公眾號/視頻號"移遠(yuǎn)通信"或發(fā)送郵件至marketing@quectel.com。

端側(cè)大模型 移遠(yuǎn)通信 RWKV 輕量AI大腦

一周熱門