现在很多人觉得智能客服很“智障”,主要原因如下:
一、数据与训练方面
1、数据量与质量
大语言模型的训练需要海量且高质量的数据。如果数据不足或存在偏差,模型对各种问题的理解和回答能力就会受限。例如,一些智能客服在面对小众领域或者新出现的问题时,由于缺乏相关数据,就无法给出准确答案。
数据标注的准确性也很关键。错误的标注会误导模型的学习,导致回答错误。
2、模型训练难度
训练大语言模型确实存在一定难度。它涉及到复杂的算法和大量的计算资源。例如,训练过程中需要处理神经网络的优化问题,像梯度消失或爆炸等情况,这需要专业的技术知识和经验来解决。
不同的应用场景和用户需求增加了训练的复杂性。智能客服需要适应多种行业、多种类型的用户问题,这要求模型在训练时要兼顾各种情况。
二、应用与改进方面
1、成本问题
对于企业来说,无论是开发自己的大语言模型还是使用供应商提供的服务进行升级,成本都是一个重要因素。如果成本过高,就会限制智能客服基于大语言模型的升级。例如,一些中小企业可能无法承担大语言模型的训练和部署成本。
推理成本也不容忽视。即使模型训练好了,如果每次使用(推理)的成本很高,也会影响其在智能客服中的应用。
2、安全与隐私问题
目前大语言模型大多采用云部署方式,企业在将自己的知识库接入时,存在数据泄露的风险。这使得很多企业在升级智能客服时有所顾虑,从而影响了智能客服的智能化水平提升。
企业内部的一些敏感信息可能会在与大语言模型交互过程中被暴露。
改进的方法如下:
1、模型优化
对于已有的大语言模型,可以进行微调。针对智能客服的特定应用领域,如电商、金融等,对模型进行调整,使其在这些专业领域的识别效果更好。
可以采用预训练+微调(pretraining+finetune)的模式,先在大规模通用数据上进行预训练,然后再根据智能客服的具体需求进行微调。
2、知识接入与场景化
将企业的专用知识库接入到大语言模型中,但要解决安全风险问题。例如,可以采用加密技术或者本地部署等方式来保护数据安全。
以多种场景、多种独立技能的方式来封装不同的AI机器人应用。在智能客服产品内,找到合适的场景单独引入大语言模型能力的AI机器人,提高智能客服的针对性和准确性。
3、提升用户体验
让智能客服的回答更人性化,能够理解用户的情绪。例如,大模型可以冷启动,不需要标注数据,只需要把客户的业务知识维护进去,就能达到较好的效果,回复能够接得上用户的话题。