首个AI高考全卷评测结果发布：最高分303，数学全不及格

首个AI高考全卷评测结果发布：最高分303，数学全不及格

2024.06.19 16:21

钛媒体App 6月19日消息，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分，此次高考测试结果显示，阿里通义千问2-72B排名第一，为303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能实验室的书生·浦语2.0排名第三，三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看，大模型的语文、英语考试水平普遍不错，但数学都不及格，最高分也只有75分。

AGI

本文内容仅供参考，不构成投资建议，请谨慎对待。

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

张zZion
这一次高考也有大模型AI参加，不理想呀
回复 6月20日 · via iphone
桃子打了个盹er
这是在试一试，智能也不智能数学都不及格
回复 6月20日 · via pc

投资日历