多模态版DeepSeek-R1的评测表现真的超越了GPT-4o吗？

Question

多模态版DeepSeekR1在部分评测中的表现超越了GPT4o。基于北大港科大联合出品的自研全模态框架AlignAnything推出的多模态版DeepSeekR1（AlignDSV），在部分视觉理解表现评测集上展现出了超越GPT4o的能力。例如在图文结合询问减肥时适合喝哪一款饮品时，AlignDSV能够精确指出图中饮品的款数、名称以及减脂时最适合饮用的饮品。

通过多模态训练，DeepSeekR1不仅在文本任务上有所提升，在科学任务、复杂推理等方面也表现出色。它的模态穿透能力反哺了文本推理能力，使其在数学、代码和推理任务中的表现可与OpenAIo1相媲美，这也证明了其强大的推理能力。在一些基准测试中，DeepSeekR1也超越了SOTA推理模型OpenAIo1。

需要注意的是，目前只是在部分评测集和特定任务上有超越GPT4o的表现。AI领域发展迅速，各个模型都在持续进化，未来的评测结果可能会随着技术发展和更多样化的测试而发生变化。但就当前而言，多模态版DeepSeekR1在部分评测表现上确实超越了GPT4o。

多模态版DeepSeek-R1的评测表现真的超越了GPT-4o吗？

0 Answers