最新资讯

2026-05-30
英伟达 LocateAnything：AI"看图找东西"慢，这个开源视觉定位模型把它提速了 10 倍
英伟达联合香港理工大学、南京大学推出开源视觉定位模型 LocateAnything，输入一张图加一句话，就能框出你要找的东西。靠"一次画一个框"的并行解码新方法，它在单张顶级显卡上每秒能定位近 13 个目标，速度和精度同时领先同类模型，而且已经开源、免费下载。