ChatExcel定义AI DataAgent
牛透社:大模型生成的结果会不一致,而企业级客户最在乎准确性,ChatExcel怎么解决这个问题?
逄大嵬:这其实是AI行业普遍面临的问题,核心在于大模型的“幻觉”现象是当前技术现状下的客观存在,我们要做的是控制幻觉的程度——在某些场景下实现100%无幻觉,在另一些场景下设定合理的容忍度。
具体来说,我们从三个维度着手解决:
第一,对模型的选择与使用熟练度。不同模型、不同版本的能力存在差异,比如是271B还是72B参数的模型,是V3还是R1版本,需要根据场景匹配最合适的模型;
第二,工程层面的优化。通过对模型调用的工程化设计,提升结果的稳定性;
第三,模型自身的调优。包括对模型进行量化、训练专属小模型等自主优化,通过微调、训练等方式增强模型在特定场景下的准确性。
需要明确的是,从技术理论上讲,100%消除幻觉并不现实,但ChatExcel作为数据类产品,准确性和可信性是第一要求,必须达到企业级客户的高标准。因此,我们通过模型使用能力、工程能力和自主训练能力的结合,多方面共同发力,确保用户拿到的结果满足准确性要求。
牛透社:ChatExcel 是否会导致企业不再需要专业数据分析师?在实际服务中,客户更多是把它当作 “助手” 还是 “替代人工” 的工具?
逄大嵬:ChatExcel 作为一款通用型产品,适用人群非常广泛,从公司员工、老师、扶贫干部,到电商运营、财务人员等不同岗位的人都在使用。
由于不同岗位、不同工作年限的人对需求的深度不同,很难简单定义它是 “助手” 还是 “工具”。用 “Agent(代理)” 这个词来描述可能更合适 —— 它的定位会因使用者的差异而有所不同,有人会觉得它是工具,有人会认为它是助手,这是因人而异的。
从我们的观察来看,从去年到今年这半年多的实践中,它正逐渐朝着 Agent 的方向发展。我们现在越来越多地提出 Data Agent 这个概念,也是因为它在数据处理领域的 “代理人” 属性已经基本成立。
之所以强调Data Agent,是因为数据处理并非单一的分析环节,而是覆盖了多种场景下的需求(比如信息收集、数据整理等)。过去的技术只能解决单点问题,还需要堆砌大量工程量,就像很多数据厂商做的 BI 产品,存在不准确、交付成本高、洞察与实际业务脱节等问题。
而 Data Agent 出现后,从通用模型能力、AI 编码能力,到专业知识训练、产品易用性等多个维度,都在改变整个数据业务的链路。它并非要替代专业数据分析师,而是根据不同用户的需求,成为适配其工作场景的 “代理人”,提升数据处理的效率和效果。