Bonsai Image 4B:原本要跑在数据中心的画图 AI,现在能离线装进你的手机
加州理工团队创立的 PrismML 推出 Bonsai Image 4B,一个开源免费的端侧画图模型。 它能完整运行在 iPhone 和 Mac 上,全程离线,输入一句话就能出图。
以前想用 AI 画图,基本都得联网。打开网页或者 App,输入一句话,请求发到云端的服务器,算完再传回来。你画的每一张图,都要先经过别人的机器。
现在有个开源画图模型,把这套流程整个搬进了你的手机。

把云端的活儿搬回手机
这个模型叫 Bonsai Image 4B,做出它的公司 PrismML 团队来自加州理工。它能完整地在 iPhone、iPad 和 Mac 上离线运行,不需要网络,也不用把你的内容传给任何人。
一个能画图的 AI 模型通常体积很大,普通手机根本装不下、也跑不动。PrismML 做的事情,就是给这个端侧模型"瘦身"。

关键是把模型压小
它的底子是一个 40 亿参数的开源画图模型 FLUX.2 Klein。原版跑起来要占用接近 12GB 内存,能满足这个量级的手机几乎没有。
PrismML 用的办法叫低比特量化。说人话就是:原本模型里每个数字记得很精细,他们把这些数字简化成只有"正"和"负"两种状态。模型一下子小了八倍多,运行时只占 1.5GB 左右,新一点的手机就扛得住了。
代价是画质会打折。压得最狠的版本,出图大约有原版九成的水准;保留一点精度的版本能到九成五。对随手画着玩的人来说,这点差距基本看不出来。

普通人能拿它做什么
离线 AI 画图最直接的好处有三个。
不花钱。 模型按 Apache 2.0 协议开源放出,谁都能免费下载使用。PrismML 还做了个叫 Bonsai Studio 的 iPhone App,装好模型文件,输入一句描述就能出图。
不联网。 在飞机上、在信号差的地方、在不想让内容上传的时候,它照样能画。你输入的提示词和生成的图,全程待在自己手机里。
够快。 在 iPhone 17 Pro Max 上画一张图大约九秒,在 M4 芯片的 Mac 上六秒左右。
也别把它想得太神
它不是万能的。模型文件本身要占三到四 GB 存储,下载得有点耐心;出图速度比起云端顶级服务还是慢一截;默认生成的图尺寸也不大。
但它真正有意思的地方,是证明了一件事:一个过去只能靠数据中心显卡撑起来的 AI,如今能塞进一部手机,而且免费。
过去两年,AI 能力一直在往"更大、更贵、更依赖云端"的方向走。Bonsai Image 4B 这次走的是反方向。
等画图、写字、翻译这些本事都能离线装进口袋,AI 才算真正落到了普通人手里。
参考资料
相关报道
AI 监控摄像头救下两条命:行为识别 AI 从画面里认出想轻生的人
东京科技公司 Asilla 给现成的监控摄像头装上行为识别 AI,能认出在月台边缘、屋顶栏杆附近反复徘徊或长时间停留的人,发现异常立刻通知保安。 这套 AI 行为分析系统用约 700 万份影像训练,目前在东京和神奈川约 40 处车站和商场运行,至今已拦下至少两人。
AI 声音克隆几秒就能仿出你家人的声音,但一个暗号就能拆穿这种诈骗
美国去年因 AI 相关诈骗损失约 8.9 亿美元,其中 AI 声音克隆诈骗增长最快。 骗子只要拿到几秒钟录音,就能仿出亲人的声音,FBI 和专家都承认连他们自己都难以分辨真假。 与其纠结声音是真是假,不如记住几个固定的防骗动作,尤其是和家人约定一个"安全暗号"。
OpenAI 重启机器人团队:先帮工人盖楼,再让每个人都有一台人形机器人
做出 ChatGPT 和 Sora 的 OpenAI,正在悄悄招人重启机器人业务。 而这家公司五年前刚亲手关掉自己的机器人部门,说过机器人这条路走不通。