豆包手机!GUI Agent是真革命还是开倒车?| 深度对话张和

豆包做了一个手机助手,也就是 GUI Agent,然后立马就被微信和淘宝给封杀、设卡、穿小鞋。很多人看热闹,觉得这是豆包的滑铁卢,评论区里一半的人在吵吵隐私问题,另一半人在嘲笑它操作成功率只有 60 分。但在我看来,字节跳动这是拿着金箍棒把行业给捅了个窟窿,这一棒子下去,不管是想看热闹的还是想捂盖子的,都得被震醒。 腾讯封路,阿里设卡,手机里没有中间商可以赚差价 张和最早在小米内部推动 GUI Agent 立项时,哪怕面对重重阻力,逻辑也硬得像块石头:既然自动驾驶在人命关天的物理世界里都能做到 99% 的准确率,那么在手机这个容错率极高、全是结构化数据的虚拟世界里,没理由做不到 90% 以上。

豆包手机!GUI Agent是真革命还是开倒车?| 深度对话张和

豆包做了一个手机助手,也就是 GUI Agent,然后立马就被微信和淘宝给封杀、设卡、穿小鞋。很多人看热闹,觉得这是豆包的滑铁卢,评论区里一半的人在吵吵隐私问题,另一半人在嘲笑它操作成功率只有 60 分。但在我看来,字节跳动这是拿着金箍棒把行业给捅了个窟窿,这一棒子下去,不管是想看热闹的还是想捂盖子的,都得被震醒。

腾讯封路,阿里设卡,手机里没有中间商可以赚差价

张和最早在小米内部推动 GUI Agent 立项时,哪怕面对重重阻力,逻辑也硬得像块石头:既然自动驾驶在人命关天的物理世界里都能做到 99% 的准确率,那么在手机这个容错率极高、全是结构化数据的虚拟世界里,没理由做不到 90% 以上。

张和认为,GUI Agent 本质上就是“不会出人命的自动驾驶”。 今天的豆包手机助手,就像 2022 年底刚出来的 ChatGPT,或者早期的特斯拉 FSD,看着笨拙、偶尔幻觉、成功率勉强及格(50-60分)。 但请记住,从 60 分到 90 分的进化速度,往往会快得让你怀疑人生。只要投入自动驾驶级别的数据集和训练算力,基于 Transformer 架构,甚至不需要什么重大理论突破,这事儿就能成。

自动驾驶怕的是封路,而 GUI Agent 也一样。最大的问题不是模型不够强,而是腾讯把微信这条路给你封了,阿里把淘宝这条路给你堵了 。这就是典型的“路权”之争。拥有模型和生态的巨头们,正在人为地制造断点。为什么?去掉中间商!

巨头互殴的终局,Agent 对 Agent 的谈判

未来的终局很清晰:超级 APP(如微信、淘宝)为了护食,会在内部搞自己的 Agent,实现闭环;而操作系统(小米、苹果)则会把控全局。当 OS 级的 Agent 想要调用淘宝的服务时,它不会再去模拟点击,而是直接跟淘千问喊话:“嘿,帮我订水果。”至于那些没有能力做 AI 的中长尾 APP?对不起,你们只能乖乖接受 OS 的全权代理,甚至连反抗的资格都没有。工具类 APP 被消灭是必然的,因为用户只需要结果,不需要过程。

还有一个大饼,未来手机是云端的虚拟机

其实,这场战役的终局,反而会让硬件厂商重新夺回话语权。现在的局面是:软件厂商(如字节)急着证明自己,试图越过操作系统直接操作 App;而硬件厂商(如苹果、小米)则在“扮猪吃老虎”。他们手里握着系统权限这张王牌,只要时机成熟,随时可以切断第三方的路,或者坐收渔翁之利 。

为什么?因为只有硬件厂商掌握着最底层的传感器和上下文 。无论是未来的 AI 眼镜,还是现在的手机,它们本质上正在变成云端超级大脑的“虚拟机” 。想象一下,你戴着眼镜,手机揣在兜里。你对眼镜下令,眼镜指挥手机里的 GUI Agent 在后台疯狂操作,最后把结果反馈到你的耳机里。这时候,手机实际上已经退化成了一台随身携带的“云端虚拟机”。

这就解释了为什么 OpenAI 非要挖苹果的设计师做硬件,为什么今年已经出现了“百镜大战”,阿里已经祭出夸克眼睛,我相信豆包迟早也会出硬件。对了,这边也建议阿里应该立刻、马上去入股 OPPO 或 Vivo。 

乱拳打死老师傅?GUI Agent的机会在PC

对于创业者,我有句难听的实话:别在手机端的 C 端 Agent 上浪费时间了,那是巨头和 OS 厂商的自留地,没有系统级权限,你连后台保活都做不到,死路一条。

真正的金矿在 PC 端,在 B 端。去看看那些老旧的、没有任何 API 接口的税务系统、政府后台、企业内网。用 GUI Agent 去接管这些反人类的陈旧系统,帮企业打通数据孤岛,这才是创业者能活下来并且赚大钱的生意。

我们现在的状态,就像是看着马车夫在骂汽车:“这玩意儿又吵又容易坏,还不认路!”但用户是诚实的,一旦体验过“动动嘴就能搞定一切”的快感,没人会愿意再回去用那些傻逼的SaaS软件。GUIAgent行不行另说,工具类软件agent化是必然的。

别为旧时代的 App 唱挽歌了。

Best regards,

小蘇

JustSayAI Team

—————

【主播小紅書】:📕叫我小蘇就好啊

【關注頻道】:

▶️Youtube|📺B站|📕小紅書|📻Podcast

【訂閱JustSayAI早晚報】

🌈新朋友!訂閱「JustSayAI早晚報」· 每日兩封 · 一鍵聽報 

🌟老朋友!加入會員獲取JustSayAI早晚報+深度研報+文字專欄

Read more

AI 御三家,已经不打模型了:Codex 反杀,桌面端正式开打

AI 御三家,已经不打模型了:Codex 反杀,桌面端正式开打

AI 御三家,已经不打模型了:Codex 反杀,桌面端正式开打 我觉得很多人还没看明白,御三家现在抢的根本不是“谁代码更聪明”,而是谁先把我的桌面端夺下来。Gemini 出了 Mac App,Claude 疯狂往桌面里塞功能,可真正让我respect的,还是 Codex 这个家伙,天天还在说“我先收一下口”“我已经稳稳托住了你”,一嘴黑话,结果反手就把两把最狠的刀补齐了:computer use 和 browser use。你说这还是个写代码的工具吗?这就是奥特曼心中的小龙虾啊! 桌面端的暗战,Google成了“残次品”和灭绝师太Claude Google 提前放出 Mac App,我高兴。问

By justsayai
吃着爱马仕小龙虾,收藏Claude Code源码 ,AI 界的“艳照门”爷青回!

吃着爱马仕小龙虾,收藏Claude Code源码 ,AI 界的“艳照门”爷青回!

吃着爱马仕小龙虾,收藏Claude Code源码 ,AI 界的“艳照门”爷青回! 先带你回顾下,Claude Code源码被扒个底朝天,整个硅谷彻底破防了!我看完泄露的代码,感叹世界就是一个巨大的台班子!真正牛逼的根本不是那些虚无缥缈的底层模型,而是怎么把AI当成「黑奴」来疯狂压榨的诡计! 这次泄露就跟当年的艳照门一样,全网程序员连夜保存,生怕晚一秒就被和谐了。这绝不仅仅是一次简单的代码泄露,这是AI行业的「春光外泄」!到底是谁在神化大模型?原来这帮硅谷精英,背地里搞的全是极其变态的「牛马套餐」! 潜伏在你身边的真实“无间道” 你以为Claude只是一个没有感情的打字机?错!它其实是个玩狼人杀

By justsayai
Gemma4真相:它不是智能,是苦力!

Gemma4真相:它不是智能,是苦力!

Gemma4真相:它不是智能,是苦力! 聊聊Gemma4。 很多人还在欢呼Google大善人又撒钱了,但我看明白了,这根本不是什么技术普惠,这是一场彻头彻尾的“苦力”大收割! 你要是真把Gemma4当成什么无所不能的智能神明,那你真的会被坑得连裤衩都不剩。 真相是什么?真相是:这玩意儿根本不是智能,它就是一个不要钱的、专门干脏活累活的电子黑奴! 最近这段时间,我把这几个所谓的顶级模型轮番折腾了一遍。结果呢?我彻底无语了! 第一刀:云端AI的无底斩杀线 我给大家算笔真实的账。我是Perplexity的Max会员,一个月两百美刀的保护费交着。前段时间,他们推出了那个牛逼哄哄的Computer Us

By justsayai
把Token搞成顺差?中国 AI 的“拼多多”时代,我只愿中东无战事!|对话沈帅波

把Token搞成顺差?中国 AI 的“拼多多”时代,我只愿中东无战事!|对话沈帅波

把Token搞成顺差?中国 AI 的“拼多多”时代,我只愿中东无战事!|对话沈帅波 如果你以为中美AI的终极博弈是比拼模型参数大、技术更科幻,那你的认知已被彻底淘汰了。今天我把话放这:大模型的技术霸权不是重点,未来的王道,是谁能把Token搞成批发价! 当美国人还在煞有介事地炫耀AGI有多接近人类时,中国AI已简单粗暴地切入“拼多多”时代。我不管你技术有没有领先,我Token比你便宜,我就是能比你挥霍!这是什么概念?以前羡慕美国人在家24小时开空调?现在中国网民在家24小时挂小龙虾(OpenClaw)疯狂烧Token!在这场算力与能源的肉搏战里,谁怕谁啊?今天就把这遮羞布撕开,看看这场科技革命

By justsayai