MindJourney: una nueva forma de enseñar a la IA a entender el espacio en 3D
Uno de los mayores desafíos de los modelos de lenguaje y visión (VLMs, por sus siglas en inglés) es que, aunque pueden identificar objetos y describir escenas en imágenes estáticas