AI工程专家-刘杨
-
人工智能的”瘦身”革命:小模型如何实现大智慧?
最近,人工智能领域的著名专家Andrej Karpathy发表了一则推文,引发了很多讨论。他提到,未来的人工智能模型(也叫LLMs,Large Language Models)可能…
-
MLP与KAN:哪种神经网络在电商客服机器人中表现更优?
科学家们一直在探索如何让机器变得更聪明,能够像人类一样思考和学习。在这方面,神经网络是非常重要的工具。今天,我们要了解两种神经网络:多层感知器(MLP)和Kolmogorov-Ar…
-
Transformer模型如何提升电商客服机器人的智能与效率?
在今天的科技世界里,有一种叫做“Transformer”的模型非常重要。Transformer模型是一种人工智能技术,能够帮助计算机理解和生成自然语言。现在,我们来了解一下Tran…
-
如何利用基于离散 Token 的自回归多模态模型提升电商客服机器人的服务质量?
随着电商的发展,客户服务需求越来越多样化和复杂化。为了提升客户服务体验,许多电商平台开始使用客服机器人。而在这些机器人中,基于离散 Token 的自回归多模态模型起到了关键作用。本…
-
优化大模型,提升电商客服自主应答率:有哪些策略可行?
以目前的大模型技术,在电商客服场景中,自主应答率能达到多少? 目前来看,在电商客服场景中,使用大模型(如GPT-4、GPT-3等)技术进行自主应答的能力已经取得了显著的进展,但其自…
-
以目前的大模型技术,在电商客服场景中,自主应答率能达到多少?
以下内容来自GPT-4o的问答: 问题:以目前的大模型技术,在电商客服场景中,自主应答率能达到多少? 回答:在电商客服场景中,使用大模型(如GPT-4、GPT-3等)技术进行自主应…
-
如何用“加性边距”改善行业细分的Embedding模型?
背景 对于一家店铺(如石头科技),建立动态可增减的标准Q列表。对于一个输入消费者Q,需要快速识别,将其分类到一个现成的标准Q。 思考 这个任务跟人脸识别有相似性(对象分类但类别列表…
-
考考大模型:如何评测大模型的复杂推理能力?
一、量化评测集 复杂推理类 GSM8k GSM8K 是OpenAI 2021年创建的8.5K 高质量小学数学应用题数据集。数据集分为7.5K 训练问题和1K 测试问题。这些问题需要…
-
Sora技术深度解析:如何理解Sora中的“世界模拟器”?
一、Sora技术概述 Sora 的本质是 「世界的模拟器」。 OpenAI 技术报告中透露,Sora 能够深刻地「理解」运动中的物理世界,堪称为真正的世界模型。 OpenAI 在其…