C-Eval评估中文基础模型高级知识和推理能力
机器之心
49
C-Eval是一项评估中文基础模型高级知识和推理能力的广泛基准。它包括四个难度级别的多项选择题,涵盖52个不同的学科领域。测例库来源于互联网上的模拟考试。C-Eval榜单展示了开源模型在这一评测中的表现。该基准有助于挑选适合自然语言处理领域的大模型,促进AI应用的发展。
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
—— 由AIbase 日报组创作
© 版权所有 AIbase基地 2024, 点击查看来源出处 –