工业网 > 网络快报

最新中文大模型测评：百川、智谱、通义领跑国内

A+
A-

2024-04-30 18:18 来源：中国网阅读量：12080

4月30日，国内权威大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》，报告选取国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，对国内外大模型发展现状进行观察与思考。报告显示，Baichuan 3在国内大模型中排名第一，智谱GLM-4、通义千问2.1、文心一言4.0、Moonshot等大模型位列其后。从全球范围来看，国外同行的GPT-4、Claude3得分更胜一筹。

最新中文大模型测评：百川、智谱、通义领跑国内

SuperCLUE是国内权威的通用大模型综合性测评基准，其前身是第三方中文语言理解测评基准CLUE。不同于传统测评通过选择题形式的测评，SuperCLUE纳入了开放主观问题的测评。通过多维度、多视角、多层次的评测体系以及对话的形式，模拟大模型应用场景，真实有效的考察模型生成能力。同时，SuperCLUE通过构建多轮对话场景，更深层次考察大模型在真实多轮对话场景的应用效果，对大模型的上下文、记忆、对话能力全方位评测。

为更真实反映大模型通用能力，SuperCLUE本次测评由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等，题目为多轮开放式简答题。评测集共2194题。

测试结果显示，Baichuan3的文科、理科能力均衡。在知识百科能力上Baichuan 3以82分的成绩超越了GPT-4-Turbo，在所有32个参与评测的国内外大模型中排名第一。而在代表了大模型智力的“逻辑推理”能力上以68.60的成绩超越Claude3-Opus，力压一众国内大模型拔得头筹。此外，在计算、代码、工具使用能力上Baichuan 3表现同样不俗，均排名国内前三。

在评测国内外模型通用能力和专项能力的基础上，SuperCLUE还对国内模型发展现状及竞争格局进行了分析和研判。SuperCLUE认为，Baichuan 3可应用的场景相对广泛，尤其在专业技能类的任务上表现优异，重点推荐数学推理、数据分析、信息处理、智能客服/语音助手以及任务拆解规划等场景。另外，其还可以在相对复杂的行业场景中落地，可应用于教育、医疗、金融等垂直行业。

编辑：安远

上一篇：盐穴变身“充电宝”压缩空气储能赋能地下空间下一篇：返回列表

新建福厦铁路湄洲湾跨海大桥无砟轨道施工完成

新建福厦铁路湄洲湾跨海大桥无砟轨道施工完成

这是4月9日拍摄的建设中的新建福厦铁路湄洲湾跨海大桥（无人机照片）。新华社发（周义摄）4月9日，由中铁十一局承建的新建福...

网络快报 2022-04-13 09:50

“买菜难”如何缓解？五方面看上海抗疫“保供”

“买菜难”如何缓解？五方面看上海抗疫“保供”

4月9日，装有蔬菜的车队从襄阳出发前往上海（无人机照片）。新华社发（杨东摄）新华社上海4月11日电(记者周蕊)做好250...

网络快报 2022-04-13 09:50

3月金融数据超预期 M2与社融同比增速均回暖

3月金融数据超预期 M2与社融同比增速均回暖

日前，中国人民银行发布了2022年3月社会融资规模存量统计数据、2022年一季度金融统计数据与2022年一季度社会融资规...

网络快报 2022-04-13 09:48

昆明至蒙自2小时内可达！弥蒙高铁预计年内开通运营

昆明至蒙自2小时内可达！弥蒙高铁预计年内开通

据中国国家铁路集团消息，4月11日6时30分，新建弥蒙高铁接入南昆客专道岔施工圆满结束。全线轨道施工顺利完成，标志着弥蒙...

财经 2022-04-13 09:48

助力油气增储上产亚洲第一深水导管架“海基一号”海上安装就位

助力油气增储上产亚洲第一深水导管架“海基一

记者从中国海洋石油集团有限公司（以下简称中国海油）获悉，今日，我国自主设计建造的亚洲第一深水导管架“海基一号”在珠江口盆...

财经 2022-04-13 09:47

培育壮大优质企业推动建设制造强国——2022年制造业单项冠军培训班在京举办

培育壮大优质企业推动建设制造强国——202

中国工业报马艳为加快培育制造业优质企业，促进提升产业基础能力和产业链现代化水平，4月12日，2022年制造业...

中国智造 2022-04-13 09:27

遥望网络加速数字化升级开辟业务增长新曲线

遥望网络加速数字化升级开辟业务增长新曲线

4月10日，遥望网络通过线上直播形式在官网举办“AIWANTIT”遥望数字战略发布会。会上，遥望网络公开了近期爆火出圈的...

网络快报 2022-04-11 16:25

强化政策协同投资明显回升

浙江台州市域铁路S1线是采用PPP模式建设的项目，图为日前建设者正在该线温岭城南段安装接触网。周学军摄（影像中国）数据来...

财经 2022-04-11 15:27

到2025年，非化石能源消费比重提高到20%左右—— “现代能源体系”看点多

到2025年，非化石能源消费比重提高到20%

近年来，贵州省铜仁市推动荒坡山地效益最大化，让光伏清洁能源成为群众增收的“绿色银行”。图为3月25日，在铜仁市印江县杉树...

财经 2022-04-11 15:26

中国二十二冶集团华东公司：强作风讲安全求创新

中国二十二冶集团华东公司：强作风讲安全求

中国二十二冶集团华东公司成立以来，始终坚持精细化管理道路，持续创新生产经营理念，以蓬勃的生机和昂扬的斗志，持续对标一流，...

机械装备 2022-04-11 13:56

相关推荐

财经排行榜

盐穴变身“充电宝”压缩空气储能赋能地下空间

2024-04-30 18:04
20年专业制造阀门，芮迪阀门致力成为全球阀门

2024-04-30 18:04
砥砺前行，广汇物流“一通道四基地”共绘辉煌新

2024-04-30 17:26
携手央美、川美两大顶尖美院打造入画之旅，《英

2024-04-30 16:42
五一假期这些“小太阳”城市不下雨近一周热度已

2024-04-30 16:39
上海闵行“五五购物节”开幕，发布七条city

2024-04-30 16:35
徐矿集团：生态转“绿”激活力

2024-04-30 14:27
9张海报，打卡青山好风光

2024-04-30 14:20
上海男篮到底输给了谁？

2024-04-30 13:49
三六零协同办公App推推启动鸿蒙原生应用开发

2024-04-30 13:43

大家都在看

行业要闻

运动生活“易如出掌”微信刷掌服务登陆西安奥体

2024-04-30 13:35
2024年度农业主导品种主推技术发布

2024-04-30 11:50
广西积极防御强降雨强对流天气“车轮战”

2024-04-30 10:46
海口骑楼建筑历史文化街区国家4A级旅游景区揭

2024-04-30 09:36
巴黎奥运会选拔赛暨2024亚洲山地自行车锦标

2024-04-30 08:30
原创舞剧《雷雨》7月25日首演：经典文学以舞

2024-04-30 07:22
海泰新能：2023年实现净利润1.36亿元，

2024-04-30 06:24
跨越千里，蓉沪工业元宇宙迎来产业共振——成都

2024-04-30 05:37
银川火车站和客运段精心保障“五一”假期旅客出

2024-04-30 04:37
“理响中国·讲好‘中国式商量’故事”网络主题

2024-04-30 03:55

精彩图文