廣告
香港股市 將在 8 小時 41 分鐘 開市
  • 恒指

    18,868.71
    -326.89 (-1.70%)
     
  • 國指

    6,701.78
    -115.90 (-1.70%)
     
  • 上證綜指

    3,116.39
    -42.15 (-1.33%)
     
  • 道指

    39,330.74
    -340.30 (-0.86%)
     
  • 標普 500

    5,310.89
    +3.88 (+0.07%)
     
  • 納指

    16,902.92
    +101.38 (+0.60%)
     
  • Vix指數

    11.82
    -0.47 (-3.83%)
     
  • 富時100

    8,339.23
    -31.10 (-0.37%)
     
  • 紐約期油

    77.20
    -0.37 (-0.48%)
     
  • 金價

    2,346.30
    -46.60 (-1.95%)
     
  • 美元

    7.8081
    +0.0010 (+0.0132%)
     
  • 人民幣

    0.9270
    +0.0001 (+0.01%)
     
  • 日圓

    0.0495
    -0.0001 (-0.18%)
     
  • 歐元

    8.4489
    +0.0005 (+0.01%)
     
  • Bitcoin

    67,885.60
    -2,349.93 (-3.35%)
     
  • CMC Crypto 200

    1,471.39
    -31.27 (-2.08%)
     

商湯升級大模型對標GPT-4 Turbo 上海技術交流日發布「日日新5.0」

商湯升級大模型對標GPT-4 Turbo 上海技術交流日發布「日日新5.0」

生成式人工科技領域競爭激烈,商湯(0020.HK)昨天在上海舉辦「技術交流日」,發布升級的「日日新SenseNova 5.0」大模型體系。商湯董事長兼首席執行官徐立在發布會中表示,「日日新5.0」在知識、推理、數學、代碼場景,全面對標GPT-4 Turbo,即主流客觀評測上達到或超越GPT-4 Turbo。商湯股價昨收0.61元,微升1.7%。

自去年4月首次發布以來,商湯「日日新SenseNova」大模型體系已推出五個大版本。徐立稱,「日日新5.0」基於超過10TB tokens訓練,覆蓋大量合成數據,並採用混合專家架構,推理時上下文窗口可有效到達200K左右。

推企業一體機 面向多領域

徐立在大會上實時演示該模型一系列的應用功能,在創作文案、文字生成圖像、數據分析能力等方面,與Open AI GPT-4等市面上熱門大模型工具的結果作對比。當中,徐立示範歷屆高考作文題目,日日新5.0比起GPT-4,更融合中國文化元素,寫作風格較為自由,亦不受寫作模板限制;文生圖功能方面,對比多個模型的結果亦較切合現實,並符合指令。

商湯推出應用於終端設備的「商湯端側大模型」,可在Android或iOS移動終端機、PC平台、車載平台等應用。徐立在發布會期間示範其擴圖技術,顯示完成擴圖速度遠遠快過友商雲端應用程式。

同時,商湯亦推出邊緣產品「商湯企業級大模型一體機」,面向金融、代碼、醫療、政務等多個領域。其中,代碼行業的「小浣熊.代碼大模型一體機」每部35萬元人民幣起,單部可支援100人規模研發團隊使用,數據不出域,調用成本最低可達每天每人4.5元人民幣;在醫療層面,亦可建構歷史體檢健康檔案,並上載體檢報告,就異常指標提供日常健康建議、危機提示等。

廣告

ChatGPT開發者OpenAI早前推出文生影片工具Sora備受關注,徐立表示,商湯科技在文生視頻平台方面也取得了技術突破,公司正開發相關工具,未來通過輸入一段文字或完整的描述,就可以生成一段影片,而且人物的服飾、髮型、場景都可以根據預先設定,保持影片內容的連貫性和一致性。

預告進軍文生視頻平台

此外,商湯亦與華為昇騰原生發布行業大模型,打造為金融、醫療、政務、代碼等行業而設的大模型產業生態。

王舒婷.上海