廣告
香港股市 將收市,收市時間:1 小時 37 分鐘
  • 恒指

    17,234.02
    +32.75 (+0.19%)
     
  • 國指

    6,101.70
    +1.48 (+0.02%)
     
  • 上證綜指

    3,047.76
    +2.93 (+0.10%)
     
  • 滬深300

    3,526.90
    +5.28 (+0.15%)
     
  • 美元

    7.8291
    -0.0018 (-0.02%)
     
  • 人民幣

    0.9251
    +0.0004 (+0.04%)
     
  • 道指

    38,460.92
    -42.77 (-0.11%)
     
  • 標普 500

    5,071.63
    +1.08 (+0.02%)
     
  • 納指

    15,712.75
    +16.11 (+0.10%)
     
  • 日圓

    0.0501
    -0.0001 (-0.30%)
     
  • 歐元

    8.3943
    +0.0186 (+0.22%)
     
  • 英鎊

    9.7790
    +0.0220 (+0.23%)
     
  • 紐約期油

    82.95
    +0.14 (+0.17%)
     
  • 金價

    2,331.00
    -7.40 (-0.32%)
     
  • Bitcoin

    64,298.67
    -2,331.38 (-3.50%)
     
  • CMC Crypto 200

    1,390.89
    +8.31 (+0.60%)
     

科技|阿里達摩院釋放「文本生成視頻模型」 利用AI生成影片

科技|阿里達摩院釋放「文本生成視頻模型」   利用AI生成影片
科技|阿里達摩院釋放「文本生成視頻模型」 利用AI生成影片

阿里巴巴(9988)旗下達摩院近日低調地在魔搭社區(ModelScope)放出了「文本生成視頻大模型」。據內媒報導,該模型由文本特徵提取、文本特徵到視頻隱空間擴散模型、視頻隱空間到視頻視覺空間這3個子網絡組成,整體模型參數約17億,支持英文輸入。擴散模型採用Unet3D結構,通過從純高斯噪聲視頻中,迭代去噪的過程,實現視頻生成的功能。

報導指,這個模型目前已經開放給用戶試玩,只要輸入一些簡單的描述詞,就可以看到生成的視頻效果,舉例輸入「A panda eating bamboo on a rock」,就可以看到一隻大熊貓坐在岩石上吃竹子的畫面。

網上圖片
網上圖片

不過,目前這個模型還不支持中文輸入,而且生成的視頻長度多在2至4秒,等待時間從20多秒到1分多鐘不等,畫面的真實度、清晰度以及長度等方面還有待提升。

Fortune Insight 聯乘 《華爾街日報》推出全新訂閱計劃「FI Prime Plus」,只需輸入優惠碼「FIP30free」,即可免費一個月暢讀《華爾街日報》全網內容和Fortune Insight大部份收費內容
按此訂閱:https://prime.fortuneinsight.com/web/wsj

Subscribe FORTUNE INSIGHT Telegram: 
http://bit.ly/2M63TRO

Subscribe FORTUNE INSIGHT YouTube channel:
http://bit.ly/2FgJTen