彰显AI科技能力!汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分
近日,专业中文大模型测评机构SuperCLUE发布最新一期《SuperCLUE-AutoQA 中文大模型汽车知识测评基准总榜》。在此次测评中,汽车之家自研“仓颉大模型”以72.96分的总成绩位居6个参评大模型榜首,较第二名领先13.63 分,优势尤为突出。这一佳绩不仅充分印证了仓颉大模型在汽车垂直领域的卓越性能,为其在更多终端场景的应用落地筑牢基础,更直观展现了汽车之家“ALL in AI”战略转型的坚定决心与阶段性突破成果。
据了解,本次测评内容涵盖汽车咨询、汽车对比、汽车推荐、汽车资讯、用车问题5个一级维度及11个二级子维度,旨在为中文大模型汽车知识领域的评估提供全面且多维的参考。测试题目由SuperCLUE机构独立开发,分为客观题与主观题两类,通过两轮测试综合考量大模型在信息时效性、事实准确性、答案一致性和理解用户意图等方面的能力。测评结果显示,在5个一级维度中,汽车之家仓颉大模型在汽车咨询、汽车对比、汽车推荐、汽车资讯4个维度均位居第一;用车问题维度虽位列第二,但差距不足一分。
优异成绩的背后,是汽车之家仓颉大模型在模型能力、知识架构和数据资源层面构筑的三重壁垒。
着眼真实场景 打造三大优势能力
深耕汽车行业20年,汽车之家对行业发展和用户行为已有深刻理解,并以此为基础重点优化仓颉大模型的三项核心能力,使其更适应当下真实交互场景,为用户提供更具价值的回应。
首先,“懂用户,善理解”。随着汽车消费市场逐渐成熟,用户向大模型咨询选购建议时,通常会提出包含多个条件的明确需求,例如“家里有两个小孩,预算20万左右,想要空间大的SUV,最好是今年新款,有什么推荐吗?”。这要求大模型具备在多条件中提取、整合并推理正确答案的能力。测评结果显示,面对这类问题时,仓颉大模型的答案准确性显著更高。
其次,“不顺从,懂澄清”。新车型更新速度快,消费者难以及时掌握全部准确信息,提问中可能夹带过时或错误内容。测评记录显示,与通用大模型往往顺应用户表述不同,仓颉大模型会先依据自身知识库核实信息,识别其中不准确之处并向用户澄清,确保回答基于真实有效的数据。
最后,“不编造,给解法”。实际交流中,部分提问本身不存在有效答案,例如用户询问“一款已停产车型的最新优惠政策”。面对这种情况,仓颉大模型不会随意编造答案,而是明确告知车型已停售,补充相关二手车行情信息,同时推荐具有类似特点的在售车型,帮助用户获得更具参考价值的选择。
提升信息质量 构建专业知识图谱
对于大模型而言,调用信息的质量直接影响输出结果。为提升回答准确度、最大程度降低AI幻觉出现概率,汽车之家发挥垂直领域优势,为仓颉大模型构建了全新的信息检索链路。
目前,通用大模型较多采用对用户提问即时检索、扩散搜索的方式,即全网搜索包含相关信息的网页,再从网页中提炼、分析和推理后给出回复。在自媒体盛行的当下,互联网信息质量良莠不齐,采用这一方式的大模型难免接触大量噪音信息,这也是通用大模型幻觉率较高的主要原因。
而汽车之家依托完备的车型库体系、海量专业测评结果、真实口碑信息和全面汽车百科,为仓颉大模型搭建了完整的结构化汽车领域知识库和知识图谱。因此,仓颉大模型在回答用户提问时,仅需在这些高质量信息中筛选总结,排除了绝大部分干扰信息,既提升了信息处理效率,又有效保障了回答准确率。
挖掘数据资产 筑起专有信息壁垒
数据量是影响大模型推理结果的另一重要因素。QuestMobile发布的《2025中国移动互联网半年大报告》显示,2025年6月,汽车之家全景生态总用户量达5.02亿,日均用户量达8151.91万。庞大的用户体量叠加20年积累,为仓颉大模型提供了丰厚的数据资产,其中大量私有化数据更是价值显著。
不可否认,汽车之家网站发布的公开信息,通用大模型也可获取。因此,正是私有化数据的加持,让仓颉大模型在汽车知识领域实现“遥遥领先”——用户浏览行为、最新成交底价、真实续航里程等未经加工的、通用大模型无法获得的数据筑起牢固的信息壁垒,使仓颉大模型相比通用大模型能更深刻理解业务场景、更准确识别用户意图、更全面进行推理思考,最终给出更具价值的回答。
通过本次测评,也能发现仓颉大模型在部分方面仍有提升空间。对此,汽车之家CTO项碧波表示:“成立20年以来,汽车之家一直坚持‘用户第一’的价值观,不断在内容、产品、技术、服务上投入,优化用户看车、买车、用车、换车的体验。在AI时代,汽车之家敏锐意识到AI技术有机会帮助我们跨越式提升用户体验,因此在2025年将‘ALL in AI’作为公司核心战略。仓颉大模型正是为更好解决汽车领域问题而专门研发的行业大模型,我们始终认为‘行业问题需要用行业大模型来解决’。感谢SuperCLUE的测评和反馈,其全面、务实的评价体系让我们对自研的仓颉大模型有了更客观的认识。仓颉大模型在汽车知识领域取得的领先优势,坚定了我们持续投入的信心;同时评测反馈的问题也让我们更清晰地认识到需要提升的方向。汽车之家将继续依托20年行业深耕和全景生态数据优势,不断迭代模型的理解力、推理力与执行力,让AI真正懂车、懂用户、懂场景,并将仓颉大模型的能力应用到各个业务场景中,为所有买车用户提供选车省心、买车省钱的智能服务。”
据了解,SuperCLUE是大模型时代CLUE基准的发展与延续。后者发起于2019年,是一项致力于科学、客观、中立的语言模型测评基准。SuperCLUE基于多年测评经验,结合通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准,其测评结果在业内广受认可并被广泛引用。