多模态版DeepSeek-R1的评测表现真的超越了GPT-4o吗?

Viewed 114

多模态版DeepSeekR1在部分评测中的表现超越了GPT4o。基于北大港科大联合出品的自研全模态框架AlignAnything推出的多模态版DeepSeekR1(AlignDSV),在部分视觉理解表现评测集上展现出了超越GPT4o的能力。例如在图文结合询问减肥时适合喝哪一款饮品时,AlignDSV能够精确指出图中饮品的款数、名称以及减脂时最适合饮用的饮品。

通过多模态训练,DeepSeekR1不仅在文本任务上有所提升,在科学任务、复杂推理等方面也表现出色。它的模态穿透能力反哺了文本推理能力,使其在数学、代码和推理任务中的表现可与OpenAIo1相媲美,这也证明了其强大的推理能力。在一些基准测试中,DeepSeekR1也超越了SOTA推理模型OpenAIo1。

需要注意的是,目前只是在部分评测集和特定任务上有超越GPT4o的表现。AI领域发展迅速,各个模型都在持续进化,未来的评测结果可能会随着技术发展和更多样化的测试而发生变化。但就当前而言,多模态版DeepSeekR1在部分评测表现上确实超越了GPT4o。

0 Answers