山海大模型SuperBench榜单名列前茅,期待云知声上市新征程
近日,国内人工智能领域的权威机构——清华大学基础模型研究中心,正式发布了SuperBench九月综合榜单。此次评测汇集全球24个大模型,经过多轮激烈角逐,山海大模型凭借其在多项评测中的优异表现,再次证明其全球大模型比拼名列前茅的综合实力。
作为国内大模型测评的权威基准,SuperBench由清华大学人工智能研究院基础模型研究中心携手多家知名机构共同打造,旨在为大模型领域提供一套科学、客观的测评体系。本次评测数据集全面覆盖语义、对齐、代码、智能体、安全、数理逻辑和指令遵循等七大类别,共计32个子类,全方位评估大模型的各项能力。
在备受关注的人类对齐能力评测中,山海大模型3.0以8.21分的高分脱颖而出,排名全球第五、国内第二。特别是在中文语言方面,山海大模型与o1-preview并列全球第二,得分高达8.41,充分展示其在中文语言处理领域的深厚实力。在细分评测项中,山海大模型更是屡创佳绩,基本任务、综合问答、文本写作三项均进入前三,并在文本写作评测中荣获桂冠。

智能体能力评测中,山海大模型同样不负众望,以3.44分排名全球第七、国内第五。尤其是在网络购物评测中,其得分远超70,位列全球第二,彰显出其在智能体应用方面的显著优势。
安全和价值观能力评测方面,山海大模型3.0以89.4分的高分位居全球第二。在伦理道德、攻击冒犯、身体健康、隐私财产等关键评测项中,它均表现出色,位列前三,并在身体健康和隐私财产评测中夺得榜首,充分体现了其在保障用户安全和维护正确价值观方面的坚定承诺。

自2023年5月问世以来,山海大模型已在多个权威评测中屡获殊荣,包括OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测等多个权威评测,充分展现其业界领先的通用能力和行业大模型实力。此次SuperBench评测再次印证了山海大模型的综合实力和技术创新能力。
未来,山海大模型将继续深耕智慧医疗、智慧座舱、智慧交通、智慧营销等多个领域,推动大模型技术的创新发展和产业升级,为各行各业带来更加高效、智能的解决方案!
相关阅读
- 两轮电动进入智价比时代 雅迪冠能白鲨Ⅱ改写行业天花板
- 携全球海量设计师,“女装大王”拉夏贝尔回来了
- 大学生电动车推荐:智能优先,校园出行全掌控
- 高途2025财年财报:AI驱动盈利性增长,重塑教育新范式
- 智慧重塑豪华 问界成为WTT重庆冠军赛2026呈献合作伙伴
- 构建奶酪生态型企业,妙可蓝多用“13434”战略推进中国奶酪走向下半场
- 美格智能多平台成功接入Clawdbot,个人AI Agent迎来"实体化"革命
- 巨星传奇(6683.HK)盈警:受业务调整影响,预计2025财年净亏损不超过5200万
- 深耕安防三十载,智领产业新未来:王力2026全国经销商大会隆重举行
- 健力宝渴了么助力复工轻运动 解锁节后减脂新方式
推荐阅读
快讯 更多
- 01-28 11:21 | 启佑志愿重磅升级:首创“就业导向型”志愿填报新模式,破解升学与就业脱节难题
- 07-09 13:16 | 三重焕新,启航未来——Pivotal中文品牌发布暨乔迁新址、新官网上线
- 04-10 11:21 | 为“首发经济”注入创新动力,CMEF见证宽腾医学影像技术革新
- 02-20 18:53 | 手机也要上HBM芯片?三星计划推出移动版HBM,预计首款产品2028年上市
- 12-30 16:40 | 国产首款DDR5内存问世!价格战开启,复制长江存储击败三星路径!
- 12-30 16:36 | 华为手机回归第一年:全年销量或超4000万台 有望凭借Mate 70在高端市场击败苹果
- 11-26 18:19 | 众兴菌业拟与涟水县人民政府签订《招商引资合同书》 拟投资设立涟水食用菌产业园项目
- 11-26 18:16 | 美芝股份中选vivo全球AI研发中心-精装工程采购项目(标段二)
- 11-26 18:14 | 健之佳拟用不超1亿回购公司股份 维护公司价值及股东权益
- 11-26 09:53 | 格灵深瞳收购深圳市国科亿道科技有限公司部分股权并增资5000万
