阿里云确认:李飞飞团队s1模型基于Qwen2.5-32B-Instruc
,阿里云今日证实,李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。
该s1模型在数学和编码能力测试中表现出与OpenAI o1和DeepSeek R1等尖端推理模型相似的效果。
据回应称,在16块H100 GPU上监督微调26分钟后,s1-32B取得了与o1和R1相当甚至更高27%竞赛数学问题表现的成果。
这一技术旨在通过训练一个人工智能模型来提取其“推理”能力,并采用了监督微调方法,比起DeepSeek使用大规模强化学习方法更具成本效益。s1利用了阿里巴巴旗下中国人工智能实验室Qwen提供的免费小型人工智能模型以及谷歌Gemini 2.0 Flash Thinking Experimental给出的答案背后思考过程。
编辑:柳暮雪
上一篇:
年年登高人人进步——达州银行开展元九登高征信宣传活动 下一篇:
返回列表
财经排行榜
-
2025-02-08 01:28
-
2025-02-07 23:16
-
2025-02-07 21:57
-
2025-02-07 21:03
-
2025-02-07 20:35
-
2025-02-07 19:50
-
2025-02-07 19:11
-
2025-02-07 17:49
-
2025-02-07 17:09
-
2025-02-07 16:23
大家都在看
行业要闻
-
2025-02-07 15:49
-
2025-02-07 15:41
-
2025-02-07 14:59
-
2025-02-07 14:09
-
2025-02-07 13:48
-
2025-02-07 13:20
-
2025-02-07 12:52
-
2025-02-07 12:12
-
2025-02-07 11:10
-
2025-02-07 10:27