豆包:視頻生成模型“VideoWorld”可僅靠視覺認知世界 現已開源

2025-02-10 13:42:00 證券時報網 

證券時報e公司訊,據豆包大模型團隊消息,視頻生成實驗模型“VideoWorld”由豆包大模型團隊與北京交通大學、中國科學技術大學聯合提出。VideoWorld在業界首次實現無需依賴語言模型,即可認知世界。正如李飛飛教授9年前TED演講中提到“幼兒可以不依靠語言理解真實世界”,VideoWorld僅通過“視覺信息”,即瀏覽視頻數據,就能讓機器掌握推理、規劃和決策等復雜能力。團隊實驗發現,僅300M參數量下,VideoWorld已取得可觀的模型表現。作為一種通用視頻生成實驗模型,VideoWorld去掉語言模型,實現了統一執行理解和推理任務。同時,它基于一種潛在動態模型,可高效壓縮視頻幀間的變化信息,顯著提升知識學習效率和效果。

(責任編輯:王治強 HF013)

【免責聲明】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com

看全文
寫評論已有條評論跟帖用戶自律公約
提 交還可輸入500

最新評論

查看剩下100條評論

熱門閱讀

    和訊特稿

      推薦閱讀

        主站蜘蛛池模板: 锡林郭勒盟| 神农架林区| 太仆寺旗| 芦山县| 日喀则市| 铜川市| 屯门区| 图片| 平乐县| 临夏县| 济宁市| 洛川县| 衡山县| 吉安市| 吉林市| 柏乡县| 赤城县| 巴彦淖尔市| 隆化县| 肥城市| 肃南| 即墨市| 伊金霍洛旗| 鹤山市| 禹州市| 神农架林区| 南投县| 青田县| 壤塘县| 沁阳市| 潢川县| 凤阳县| 怀仁县| 宁国市| 青川县| 会宁县| 弋阳县| 鸡泽县| 名山县| 丰台区| 凌海市|