英伟达联合香港理工大学、南京大学推出开源视觉定位模型 LocateAnything,输入一张图加一句话,就能框出你要找的东西。 靠"一次画一个框"的并行解码新方法,它在单张顶级显卡上每秒能定位近 13 个目标,速度和精度同时领先同类模型,而且已经开源、免费下载。