廣告
香港股市 已收市
  • 恒指

    18,475.92
    +268.79 (+1.48%)
     
  • 國指

    6,547.29
    +110.20 (+1.71%)
     
  • 上證綜指

    3,104.82
    -8.22 (-0.26%)
     
  • 滬深300

    3,604.39
    -19.52 (-0.54%)
     
  • 美元

    7.8116
    -0.0017 (-0.02%)
     
  • 人民幣

    0.9264
    +0.0003 (+0.03%)
     
  • 道指

    38,664.40
    +438.74 (+1.15%)
     
  • 標普 500

    5,128.75
    +64.55 (+1.27%)
     
  • 納指

    16,162.48
    +321.52 (+2.03%)
     
  • 日圓

    0.0509
    +0.0003 (+0.51%)
     
  • 歐元

    8.4120
    +0.0341 (+0.41%)
     
  • 英鎊

    9.8040
    +0.0120 (+0.12%)
     
  • 紐約期油

    78.09
    -0.86 (-1.09%)
     
  • 金價

    2,307.80
    -1.80 (-0.08%)
     
  • Bitcoin

    61,764.05
    +2,574.16 (+4.35%)
     
  • CMC Crypto 200

    1,337.20
    +60.22 (+4.72%)
     

商湯升級大模型對標GPT-4 Turbo 上海技術交流日發布「日日新5.0」

商湯升級大模型對標GPT-4 Turbo 上海技術交流日發布「日日新5.0」

生成式人工科技領域競爭激烈,商湯(0020.HK)昨天在上海舉辦「技術交流日」,發布升級的「日日新SenseNova 5.0」大模型體系。商湯董事長兼首席執行官徐立在發布會中表示,「日日新5.0」在知識、推理、數學、代碼場景,全面對標GPT-4 Turbo,即主流客觀評測上達到或超越GPT-4 Turbo。商湯股價昨收0.61元,微升1.7%。

自去年4月首次發布以來,商湯「日日新SenseNova」大模型體系已推出五個大版本。徐立稱,「日日新5.0」基於超過10TB tokens訓練,覆蓋大量合成數據,並採用混合專家架構,推理時上下文窗口可有效到達200K左右。

推企業一體機 面向多領域

徐立在大會上實時演示該模型一系列的應用功能,在創作文案、文字生成圖像、數據分析能力等方面,與Open AI GPT-4等市面上熱門大模型工具的結果作對比。當中,徐立示範歷屆高考作文題目,日日新5.0比起GPT-4,更融合中國文化元素,寫作風格較為自由,亦不受寫作模板限制;文生圖功能方面,對比多個模型的結果亦較切合現實,並符合指令。

商湯推出應用於終端設備的「商湯端側大模型」,可在Android或iOS移動終端機、PC平台、車載平台等應用。徐立在發布會期間示範其擴圖技術,顯示完成擴圖速度遠遠快過友商雲端應用程式。

同時,商湯亦推出邊緣產品「商湯企業級大模型一體機」,面向金融、代碼、醫療、政務等多個領域。其中,代碼行業的「小浣熊.代碼大模型一體機」每部35萬元人民幣起,單部可支援100人規模研發團隊使用,數據不出域,調用成本最低可達每天每人4.5元人民幣;在醫療層面,亦可建構歷史體檢健康檔案,並上載體檢報告,就異常指標提供日常健康建議、危機提示等。

廣告

ChatGPT開發者OpenAI早前推出文生影片工具Sora備受關注,徐立表示,商湯科技在文生視頻平台方面也取得了技術突破,公司正開發相關工具,未來通過輸入一段文字或完整的描述,就可以生成一段影片,而且人物的服飾、髮型、場景都可以根據預先設定,保持影片內容的連貫性和一致性。

預告進軍文生視頻平台

此外,商湯亦與華為昇騰原生發布行業大模型,打造為金融、醫療、政務、代碼等行業而設的大模型產業生態。

王舒婷.上海