商汤发布日日新5.0大模型,全面对标GPT-4 Turbo

4月24日晚,商汤官方发文介绍了公司发布的日日新5.0大模型,并表示这是“中国首个GPT-4 Turbo级别的大模型”,日日新5.0大模型具备更强的知识、数学、推理及代码能力,综合性能全面对标 GPT-4 Turbo,并在主流客观评测上达到或超越 GPT-4 Turbo。
商汤发布日日新5.0大模型,全面对标GPT-4 Turbo

据商汤的测评,日日新 5.0在大部分核心测试集指标上都超过GPT-4 Turbo,也超过了OpenAI此前竞争对手Anthropic发布的Claude 3.0 Opus。

在实际使用中,商汤表示在自然语言能力方面,创意写作、推理以及总结能力均大幅提升,文生图能力也有较大提升,本次日日新5.0另一大核心指标是多模态能力,商汤提到其多模态大模型的图文感知能力达到全球领先水平,在权威综合基准测试MMBench中综合得分排名首位。

日日新5.0模型能力提升一方面得益于采用混合专家架构(MoE),激活少量参数就能完成推理,且推理时上下文窗口达 200K 左右,其次模型基于超过10TB tokens训练、覆盖了数千亿量级的逻辑型合成思维链数据,此外能力提升也在于商汤AI大装置SenseCore算力设施与算法设计的联合调优。

翻译

搜索

复制

免责声明:文章内容来自商汤

本站不对其内容的真实性、完整性、准确性给予任何担保、明示、暗示和承诺,本文仅供读者参考!

安防信息网尊重原作者的辛勤劳动并致力于保护原著版权以及相关的知识产权,所转载的文章,其版权归原作者所有。

如本文内容影响到您的合法权益(内容、图片等),请通过邮箱5937331#qq.com联系我们,我们将第一时间回复处理。

(0)
上一篇 2024 年 4 月 28 日
下一篇 2024 年 4 月 28 日

相关推荐