北大港科联合发布的AlignDSV相当厉害。在部分视觉理解表现评测集上,它超过了GPT4o。这意味着在处理视觉相关的任务时,AlignDSV有着卓越的性能。
通过多模态训练,AlignDSV不仅仅在文本任务上有提升,还在科学任务、复杂推理等方面表现出色。它的多模态能力实现了模态穿透,这种穿透还能够反哺文本推理能力。这就好像是各个能力之间相互协作、相互促进,使得模型在多种任务场景下都能发挥出强大的效能。
从成本效益的角度来看,DeepSeek的V3模型仅用557.6万的训练成本,就实现了与OpenAIO1推理模型相近的性能。虽然没有明确表明AlignDSV的训练成本情况,但可以推测其在成本控制与性能达成之间有着较好的平衡。