环球时讯综合 2025-08-15

彰显AI科技能力！汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分

近日，专业中文大模型测评机构SuperCLUE发布最新一期《SuperCLUE-AutoQA 中文大模型汽车知识测评基准总榜》。在此次测评中，汽车之家自研“仓颉大模型”以72.96分的总成绩位居6个参评大模型榜首，较第二名领先13.63 分，优势尤为突出。这一佳绩不仅充分印证了仓颉大模型在汽车垂直领域的卓越性能，为其在更多终端场景的应用落地筑牢基础，更直观展现了汽车之家“ALL in AI”战略转型的坚定决心与阶段性突破成果。

据了解，本次测评内容涵盖汽车咨询、汽车对比、汽车推荐、汽车资讯、用车问题5个一级维度及11个二级子维度，旨在为中文大模型汽车知识领域的评估提供全面且多维的参考。测试题目由SuperCLUE机构独立开发，分为客观题与主观题两类，通过两轮测试综合考量大模型在信息时效性、事实准确性、答案一致性和理解用户意图等方面的能力。测评结果显示，在5个一级维度中，汽车之家仓颉大模型在汽车咨询、汽车对比、汽车推荐、汽车资讯4个维度均位居第一；用车问题维度虽位列第二，但差距不足一分。

/tmp/webword_1008654665/upload_post_object_v2_3552302216

优异成绩的背后，是汽车之家仓颉大模型在模型能力、知识架构和数据资源层面构筑的三重壁垒。

着眼真实场景打造三大优势能力

深耕汽车行业20年，汽车之家对行业发展和用户行为已有深刻理解，并以此为基础重点优化仓颉大模型的三项核心能力，使其更适应当下真实交互场景，为用户提供更具价值的回应。

首先，“懂用户，善理解”。随着汽车消费市场逐渐成熟，用户向大模型咨询选购建议时，通常会提出包含多个条件的明确需求，例如“家里有两个小孩，预算20万左右，想要空间大的SUV，最好是今年新款，有什么推荐吗？”。这要求大模型具备在多条件中提取、整合并推理正确答案的能力。测评结果显示，面对这类问题时，仓颉大模型的答案准确性显著更高。

其次，“不顺从，懂澄清”。新车型更新速度快，消费者难以及时掌握全部准确信息，提问中可能夹带过时或错误内容。测评记录显示，与通用大模型往往顺应用户表述不同，仓颉大模型会先依据自身知识库核实信息，识别其中不准确之处并向用户澄清，确保回答基于真实有效的数据。

最后，“不编造，给解法”。实际交流中，部分提问本身不存在有效答案，例如用户询问“一款已停产车型的最新优惠政策”。面对这种情况，仓颉大模型不会随意编造答案，而是明确告知车型已停售，补充相关二手车行情信息，同时推荐具有类似特点的在售车型，帮助用户获得更具参考价值的选择。

提升信息质量构建专业知识图谱

对于大模型而言，调用信息的质量直接影响输出结果。为提升回答准确度、最大程度降低AI幻觉出现概率，汽车之家发挥垂直领域优势，为仓颉大模型构建了全新的信息检索链路。

目前，通用大模型较多采用对用户提问即时检索、扩散搜索的方式，即全网搜索包含相关信息的网页，再从网页中提炼、分析和推理后给出回复。在自媒体盛行的当下，互联网信息质量良莠不齐，采用这一方式的大模型难免接触大量噪音信息，这也是通用大模型幻觉率较高的主要原因。

而汽车之家依托完备的车型库体系、海量专业测评结果、真实口碑信息和全面汽车百科，为仓颉大模型搭建了完整的结构化汽车领域知识库和知识图谱。因此，仓颉大模型在回答用户提问时，仅需在这些高质量信息中筛选总结，排除了绝大部分干扰信息，既提升了信息处理效率，又有效保障了回答准确率。

挖掘数据资产筑起专有信息壁垒

数据量是影响大模型推理结果的另一重要因素。QuestMobile发布的《2025中国移动互联网半年大报告》显示，2025年6月，汽车之家全景生态总用户量达5.02亿，日均用户量达8151.91万。庞大的用户体量叠加20年积累，为仓颉大模型提供了丰厚的数据资产，其中大量私有化数据更是价值显著。

不可否认，汽车之家网站发布的公开信息，通用大模型也可获取。因此，正是私有化数据的加持，让仓颉大模型在汽车知识领域实现“遥遥领先”——用户浏览行为、最新成交底价、真实续航里程等未经加工的、通用大模型无法获得的数据筑起牢固的信息壁垒，使仓颉大模型相比通用大模型能更深刻理解业务场景、更准确识别用户意图、更全面进行推理思考，最终给出更具价值的回答。

通过本次测评，也能发现仓颉大模型在部分方面仍有提升空间。对此，汽车之家CTO项碧波表示：“成立20年以来，汽车之家一直坚持‘用户第一’的价值观，不断在内容、产品、技术、服务上投入，优化用户看车、买车、用车、换车的体验。在AI时代，汽车之家敏锐意识到AI技术有机会帮助我们跨越式提升用户体验，因此在2025年将‘ALL in AI’作为公司核心战略。仓颉大模型正是为更好解决汽车领域问题而专门研发的行业大模型，我们始终认为‘行业问题需要用行业大模型来解决’。感谢SuperCLUE的测评和反馈，其全面、务实的评价体系让我们对自研的仓颉大模型有了更客观的认识。仓颉大模型在汽车知识领域取得的领先优势，坚定了我们持续投入的信心；同时评测反馈的问题也让我们更清晰地认识到需要提升的方向。汽车之家将继续依托20年行业深耕和全景生态数据优势，不断迭代模型的理解力、推理力与执行力，让AI真正懂车、懂用户、懂场景，并将仓颉大模型的能力应用到各个业务场景中，为所有买车用户提供选车省心、买车省钱的智能服务。”

据了解，SuperCLUE是大模型时代CLUE基准的发展与延续。后者发起于2019年，是一项致力于科学、客观、中立的语言模型测评基准。SuperCLUE基于多年测评经验，结合通用大模型在学术、产业与用户侧的广泛应用，构建了多层次、多维度的综合性测评基准，其测评结果在业内广受认可并被广泛引用。

环球时讯 » 彰显AI科技能力！汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分

分享到：