随着互联网的普及和消费者购物习惯的改变,电商行业的竞争越来越激烈。传统的销售策略已经无法满足消费者个性化的需求,而且用户留存和转化率也成为了电商企业面临的重要挑战。面对庞大的数据量和复杂的市场环境,如何进行准确的预测和高效的管理一直是电商从业者们面临的挑战。谷歌研究院近期推出的一款时序预测模型TimesFM,正以其强大的预测能力和零样本学习能力,为电商企业带来了新的机遇。
论文:A decoder-only foundation model for time-series forecasting
一、时序数据预测
时序数据,从专业定义上来讲是按时间顺序排列的数据集合,这些数据可以在任何时间间隔(例如,每秒、每分钟、每小时、每天、每月、每年等)观察和收集。通俗来说,时序数据就是一个有序的“数据日志”。日常生活中,互联网、金融、气象、科研、医疗等领域都会产生海量的时序数据。
时间序列预测的本质就是根据过去发生的一系列事件来预测出未来事件的技术。它的核心原理就是利用了大量的历史数据来学习这些时间的模式和趋势,从而能在一个没有额外信息的情况下对那些新的或者从未见过的数据做出准确的预测。
虽然大型基础语言模型在NLP、CV及多模态领域已被证实其潜力,但在时序领域,构建模型却面临着许多挑战:
- 稀缺的公共时序数据集
- 各式多样且难以预测的时序数据:涵盖多领域的时序数据,每个领域的数据特征都有可能不尽相同
- 差异大的时间粒度:时序模型往往适用于特定的时间粒度(每小时、每天、每周等),而在各个粒度下都能表现出色的通用时序模型的构建成为了一大挑战
- 多变的语境和范围:时序分析中的上下文长度和范围可能各不相同,如果构建一个具备灵活适应不同上下文长度和范围的基础模型是通用时序分析的重中之重
二、TimesFM
TimesFM的核心是使用了结合真实世界时序和虚拟时序的数据,结合patch时序数据处理方法,共同训练了一个decoder-only形式的时序预测模型,模型的整体结构如下:
首先,模型根据定义的输入patch和输出patch的大小,将输入数据分割成N个输入patch,其中N等于输入数据的长度除以定义的输入patch的大小。
第一个patch先经过残差块的处理进行关键特征提取,提取后的结果会加上位置编码向量,以便模型理解每个patch在输入数据中的位置信息。
紧接着,加上位置编码向量的结果会被传递到一个堆叠的transformer中。这里采用的因果自注意力机制确保每个输出标记只能关注它之前的输入标记,保证了时序数据的顺序性。
Transformer的输出经过一轮残差块的处理后生成一个输出patch,即预测范围/视野。这个输出patch将与实际数据进行比较来计算损失,从而优化模型。
模型在后续将逐次处理更多的输入patch来得到对应的输出patch。
由于patch的设定,导致模型在训练过程中只能见到输入patch倍数的序列预测任务,不利于其他patch尺寸的预测。因此TimesFM将patch进行随机mask,以适配各种类型长度patch的预测任务。
TimesFM模型在1000 亿个真实世界时间点的大型时间序列语料库上进行训练。在zero-shot推断下,模型在Monash(下图左),DART(下图中),ETT(下图右)数据集上进行测试,其结果在各项基准测试中稳居前三。
TimesFM虽然仅拥有2亿个参数,但在不同领域和时间粒度的各种未见数据集上的零样本性能也接近于在这些数据集上显式训练的SOTA监督方法。
三、TimesFM引领电商
生活中的时序数据无处不在,而时序预测就是通过分析历史数据的变化趋势和模式,来预测未来的数据变化。
应用在电商领域,TimesFM模型可以通过收集并处理分析流量统计、交易统计、商品统计、客户统计、业务员统计等来学习这些统计数据中的季节性变化、周期性波动以及可能的异常事件,充分挖掘历史销售数据中的潜在规律,准确预测未来商品的需求量。这将为电商企业提供了重要的决策支持,帮助其更好地制定采购计划和销售策略,提高市场竞争力。
通过精准的销量预测,电商企业可以更好地掌握商品的库存情况,避免因过多库存而带来的资金压力,也能有效减少因断货而造成的销售损失。这有助于提高库存周转率,降低库存成本,从而增加企业的盈利空间。
通过准确的销量预测和优化的库存管理,企业可以实现供需平衡,最大化销售额和利润。这为企业的可持续发展奠定了坚实基础,提升了企业的市场竞争力。
总的来说,谷歌推出的TimesFM模型为电商行业带来了更多的发展机遇和挑战,或将引领电商行业进入时序预测的新纪元。
四、参考
- CSDN博客-专业IT技术发表平台
- 仅需200M,零样本性能超越有监督!谷歌时序预测基础模型TimesFM
- TimesFM基础模型惊艳亮相,引领时序预测迈向新纪元
- 时间序列模型(一):时序的相关概念 – 知乎
- 速查手册:一文了解电商中统计的专业术语 – 哔哩哔哩