多模态DeepSeek来了，北大港科联合发布的Align-DS-V到底有多厉害？

Question

北大港科联合发布的AlignDSV相当厉害。在部分视觉理解表现评测集上，它超过了GPT4o。这意味着在处理视觉相关的任务时，AlignDSV有着卓越的性能。

通过多模态训练，AlignDSV不仅仅在文本任务上有提升，还在科学任务、复杂推理等方面表现出色。它的多模态能力实现了模态穿透，这种穿透还能够反哺文本推理能力。这就好像是各个能力之间相互协作、相互促进，使得模型在多种任务场景下都能发挥出强大的效能。

从成本效益的角度来看，DeepSeek的V3模型仅用557.6万的训练成本，就实现了与OpenAIO1推理模型相近的性能。虽然没有明确表明AlignDSV的训练成本情况，但可以推测其在成本控制与性能达成之间有着较好的平衡。