重構人機交互范式 ViLLA架構實現(xiàn)多模態(tài)深度融合
區(qū)別于傳統(tǒng)單模態(tài)大模型,啟元模型通過三層異構神經(jīng)網(wǎng)絡構建感知決策閉環(huán):視覺模塊采用動態(tài)注意力機制處理環(huán)境信息,語言引擎集成多輪對話上下文記憶,而獨創(chuàng)的Latent Action空間則將抽象指令轉化為可執(zhí)行的動作序列。在測試中,模型展現(xiàn)出跨場景任務遷移能力——面對"整理雜亂書桌"指令時,系統(tǒng)能自主規(guī)劃路徑、識別物品類別并完成精準抓取擺放,全程無需人工干預。
全場景落地加速 智能終端迎來革命性升級
基于啟元基座開發(fā)的具身智能終端已進入規(guī)?;瘻y試階段。在工業(yè)質檢領域,搭載該模型的機械臂可將零件缺陷識別準確率提升至99.7%,同時將操作效率提高3倍;智能家居系統(tǒng)中,家庭服務機器人可通過三維語義理解實現(xiàn)"擦桌子時避開裝飾品"等精細化動作。更值得關注的是醫(yī)療護理場景,經(jīng)過專業(yè)數(shù)據(jù)訓練的機器人已能協(xié)助完成導診分診、康復器械操作等專業(yè)任務,為老齡化社會提供解決方案。
產(chǎn)學研聯(lián)動構建生態(tài)壁壘
智元科技聯(lián)合清華大學、中科院自動化所等機構成立"具身智能聯(lián)合實驗室",計劃年內開放百萬級參數(shù)級的開源訓練框架。公司CEO李峰透露:"我們將持續(xù)投入超20億元研發(fā)資金,年內推出支持多國語言、適配主流硬件的開發(fā)者套件,與合作伙伴共建具身智能產(chǎn)業(yè)生態(tài)。"隨著國家"新一代人工智能發(fā)展規(guī)劃"的深入推進,智元科技此次突破或將加速我國在通用人工智能賽道上的國際競爭力。