高考AI答题系列｜今年数学到底有多难？大模型：我也不太会啊

发布日期：2024-06-18 15:42 文章作者：三明网络

如果说高考语文作文题考验的是学生的文字功底，那么数学题目则更侧重于检验学生的图像识别与逻辑分析能力。尤其是曲线题、导数题、函数题和几何题，这些题目往往难度较高，让许多学生望而却步，也因此在网络上鲜少有人愿意深入探讨。鉴于此，我们针对当前市场上主流的8款大模型进行了测试，包括GPT-4o、kimi、文心一言、讯飞星火大模型、百小应、通义千问、360大模型以及豆包，以观察它们在面对数学“硬茬”时的表现。为了全面评估这些大模型的综合性能，我们特别选取了数学I卷中的一道立体几何题和一道函数题，旨在检验它们对空间结构的理解能力和逻辑推理能力。这两道题目各具特色，对于任何解题者来说都是一项不小的挑战。经过测试，我们发现尽管这些大模型在过去的一年里经过了多次优化和升级，但在处理这些数学题目时，它们的表现却不尽如人意。同一道题目，不同的模型给出的答案也存在较大差异，显示出它们在数学解题方面仍存在一定的局限性。值得一提的是，GPT-4o在答题过程中使用了全英文，这在一定程度上影响了其答案的准确性和可读性。通义千问在解答函数题时出现了“bug”，对同一函数式进行了无限循环，显然未能正确理解题目要求。豆包则因为tokens用尽而无法完成完整作答，显示出其在处理大规模数据时的局限性。而文心一言则对题干信息理解错误，进一步证明了这些大模型在数学解题方面仍有待提高。由此可见，今年的高考数学题目的确具有一定的难度，不仅让学生们感到困扰，就连这些经过精心训练的大模型也难以完美应对。然而，无论考试结果如何，重要的是学生们能够保持积极的心态，全力以赴地准备接下来的考试。在此，我们也祝愿所有考生能够发挥出自己的最佳水平，取得优异的成绩。

烟台三明网络专注网络营销10年+,具备APP开发、小程序定制、微商城及微商系统定制、抖音快手小程序、微信公众号、在烟台小程序开发找三明。分销商城开发、直销系统定制、直销软件开发、分销系统开发、集团网站建设、电子商务平台搭建，致力烟台互联网+行业的系统定制开发与运营。

没有销售套路，只有专业技术

资讯中心

高考AI答题系列｜今年数学到底有多难？大模型：我也不太会啊

案例中心

资讯中心

联系方式