山海大模型SuperBench榜单名列前茅,期待云知声上市新征程
近日,国内人工智能领域的权威机构——清华大学基础模型研究中心,正式发布了SuperBench九月综合榜单。此次评测汇集全球24个大模型,经过多轮激烈角逐,山海大模型凭借其在多项评测中的优异表现,再次证明其全球大模型比拼名列前茅的综合实力。
作为国内大模型测评的权威基准,SuperBench由清华大学人工智能研究院基础模型研究中心携手多家知名机构共同打造,旨在为大模型领域提供一套科学、客观的测评体系。本次评测数据集全面覆盖语义、对齐、代码、智能体、安全、数理逻辑和指令遵循等七大类别,共计32个子类,全方位评估大模型的各项能力。
在备受关注的人类对齐能力评测中,山海大模型3.0以8.21分的高分脱颖而出,排名全球第五、国内第二。特别是在中文语言方面,山海大模型与o1-preview并列全球第二,得分高达8.41,充分展示其在中文语言处理领域的深厚实力。在细分评测项中,山海大模型更是屡创佳绩,基本任务、综合问答、文本写作三项均进入前三,并在文本写作评测中荣获桂冠。
智能体能力评测中,山海大模型同样不负众望,以3.44分排名全球第七、国内第五。尤其是在网络购物评测中,其得分远超70,位列全球第二,彰显出其在智能体应用方面的显著优势。
安全和价值观能力评测方面,山海大模型3.0以89.4分的高分位居全球第二。在伦理道德、攻击冒犯、身体健康、隐私财产等关键评测项中,它均表现出色,位列前三,并在身体健康和隐私财产评测中夺得榜首,充分体现了其在保障用户安全和维护正确价值观方面的坚定承诺。
自2023年5月问世以来,山海大模型已在多个权威评测中屡获殊荣,包括OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测等多个权威评测,充分展现其业界领先的通用能力和行业大模型实力。此次SuperBench评测再次印证了山海大模型的综合实力和技术创新能力。
未来,山海大模型将继续深耕智慧医疗、智慧座舱、智慧交通、智慧营销等多个领域,推动大模型技术的创新发展和产业升级,为各行各业带来更加高效、智能的解决方案!
推荐阅读
快讯 更多
- 11-21 10:28 | 儒竞科技使用部分超募资金和自有资金投资建设泰国新项目 第一期计划总投资金额2.26亿
- 11-21 10:06 | 供销大集拟以现金15.11亿元收购北京新合作商业发展有限公司51%股权
- 11-21 10:03 | 永利股份拟在泰国投资设立全资子公司 计划投资金额不超过5000万泰铢
- 11-21 09:55 | 杭州高新发生生产安全责任事故 公司及董事长胡宝泉被处罚
- 11-21 09:48 | 天赐材料拟用不超1.6亿回购股份 用于实施股权激励计划或员工持股计划
- 11-21 09:42 | 恒辉安防拟用不超6000万回购公司股份 用于员工持股计划或者股权激励
- 11-15 16:49 | 《中关村企业年度发展报告(2024)》发布:中关村新三板企业平均研发强度为4.88%
- 11-14 20:28 | 传奇生物公布2024年第三季度业绩:加速布局产能与研发,巩固全球细胞治疗市场地位
- 11-14 15:43 | 朗威股份拟以自有资金不超过 1亿元投资设立全资子公司
- 11-14 15:39 | 吉林敖东拟用不超6亿回购公司股份 维护公司价值及股东权益