DeepSeek presenta modelo con atención dispersa para reducir a la mitad los costos de inferencia
La compañía china DeepSeek ha lanzado un modelo experimental llamado V3.2-exp, orientado a optimizar el rendimiento de operaciones en contextos largos, uno de los grandes desafíos técnicos en los modelos