出品|网易科技《态度》专栏作者|雀星编辑|丁广生 手机行业正在经历一场前所未有的“根本性革命”。轰动一时的豆宝AI手机并不是一帆风顺的。几天之内,腾讯的微信、网购、淘宝这款以“用AI连接一切”为目标的手机在短时间内就碰壁了。然而战争尚未结束,新的变数又到来。就在豆宝被围攻之际,智浦突然宣布开源其“手机用”的AutoGLM模型,支持微信、淘宝等50多个高频应用场景,为任何厂商打造“类豆宝”功能提供开源路径。这一个与另一个形成鲜明对比。一方面是字节跳动的紧密整合和较低级别的入职“噗模型”。另一条是智浦开创的开源之路。由此可见战局已从“一点点推进”转变为“生态冲突”。腾讯、阿里巴巴等平台以“安全”之名进行技术限制的背后,实际上是新旧网关之间的激烈争夺。它不仅仅是技术的迭代升级,更是环境优势的核心能力、定义用户体验和未来商业模式的权利。由此,泛产业大师得以重塑。 AI手机未来的两条路径 AI手机的发展呈现出两种不同的技术路径。另一方面,“系统级集成”路线以豆宝手机为代表。豆宝手机助手获取系统级权限,直接融入操作系统最底层。 sith获取权限监控系统运行状态、读取应用界面信息、模拟用户点击交互执行复杂操作整个应用程序中的任务。这就需要手机厂商之间密切合作,将AI能力深度集成到底层操作系统中。 (图为用户查看豆宝手机,声音告诉手机去买一瓶酱油。来源:iFANr)这种ce代码方法的好处是执行效率高,体验流畅。但更紧密的融合需要手机厂商的全力配合,也难免会引发权限过多的讨论。另一个是智普发起的“开源视觉路线”。该解决方案不请求系统级权限,而是使用计算机视觉技术来模拟人类与手机交互的基本方式。首先通过屏幕截图“看到”并了解界面,然后通过对模型的广泛分析“思考”要做什么,最后模拟手指动作来完成指令。 AutoGLM 的创新之处在于Agent的行为分为两层:“计划者”和“执行者”,各自负责决策和执行。这有效解决了“大模型可以理解但无法精确教授”的行业难题。该技术路径的优点是兼容性强,且不依赖于应用厂商的认可。但技术复杂度较大,体验的流畅性和稳定性面临很大挑战。 (图为智浦AutoGLM接入手机界面) 本质上,豆宝正在改造手机本身,让AI成为操作系统的核心组件。智浦则为用户提供了一个通过远程控制模式操作应用程序在云端工作的人工智能助手。这两种技术都允许人工智能像人类一样与移动应用程序交互。虽然目的是让复杂的任务可以跨多个完成对于人们最关心的隐私保护问题,两种解决方案所指向的方向根本不同。豆宝AI手机需要系统级权限,理论上允许访问手机上的所有数据。尽管开发团队强调使用虚拟屏幕操控、权限分离、本地处理等安全措施,并承诺在模型训练中不会存储或输入敏感数据,但这样的设计仍然难以完全消除用户隐私担忧。一位评论者指出:“代码很干净,但是维护它的人呢?” AutoGLM 试图通过其“云中电话”解决方案从架构上避免这种风险。所有操作均在云端虚拟手机测试环境中完成,模型无权访问用户真实手机上的私有数据。虽然这种设计降低了隐私风险s,它还引入了新的问题,例如网络依赖性、操作延迟和其他体验级别的挑战。豆宝和AutoGLM的不同选择,体现了两家公司在大车型时代的不同战略定位。豆宝的背后,是字节跳动的“硬件梦”和超级入门野心。尽管Byte明确表示不打算开发自己的手机,而是正在与多家手机厂商洽谈合作,但它正在通过软件定义硬件改造现有的门户体系,目标是保持AI时代的超级门户地位。这种差异化的定位也体现在市场表现上。豆宝手机因其创新而受到广泛关注。首批生产的3万台被抢购一空,闲鱼价格上涨至万元左右。智浦将自己定位为人工智能能力提供商,不与竞争对手直接竞争手机制造商。除了开源AutoGLM之外,Zhipu还支持Honor和Sam。我们与Sung等各大手机厂商合作,将代理体验带入他们的旗舰手机中。通过开源策略,智浦希望成为AI手机生态系统中的“拼图关键一块”,而不是主导者。 AI手机正迎来智能驾驶时代吗?随着人工智能手机概念的不断升温,业界开始出现一些发人深省的隐喻。正如自动驾驶技术正在彻底改变汽车行业一样,AI智能代理正在帮助移动行业获得“时刻”的技术成熟度,如今的AI手机肯定处于“辅助驾驶”的早期阶段。豆宝和AutoGLM都能够完成数十项复杂的操作,例如订外卖或预订航班。这证明了大数据的根本可行性。用于理解图形界面和执行复杂任务的缩放模型。然而,与早期的自动驾驶系统一样,当前的AI移动助手仍然要面对各种边界条件,其可靠性和通用性与真正成熟可用的产品仍有很大差距。此前,彩联社在实际测试中发现,遇到专门设计的应用界面时,操作的适配可能会不太流畅。更复杂的挑战来自于生态层面的游戏。应用开发者和AI助手之间的冲突本质上与“流量控制权”的重新分配有关。周鸿祎此前承认,此类应用可以绕过应用程序,提供直接访问。完成任务并直接为用户提供服务的AI助手,直接颠覆了大型互联网公司的外护城河。很快,用户报告了诸如以下应用程序上的登录异常和风险管理消息微信和淘宝。迫于压力,豆宝团队于12月5日发布公告,规范了人工智能在货币支付、积分激励等敏感场景下的运行能力限制。 BuryInternet 平台面临着艰难的战略决策。我们是应该“不断筑高墙”来保护自己的领地,还是应该主动开放API,与AI代理一起构建新的生态系统?这类博弈不仅发生在技术层面,还涉及深层的商业利益分配。从产业发展来看,AI手机的崛起正在推动整个产业链的变革和成熟。芯片、传感器等上游产业链面临新的发展机遇,AI芯片、算力各方面的企业都在探索与AI融合的新机遇。与此同时,行业竞争焦点从硬件参数转向生态逻辑集成功能。随着高通、联发科等芯片厂商在设备侧大规模模型的适配上处于领先地位,设备品牌的差异化领域将更多地体现在AI能力的融合和创新上。这一变化预示着手机行业或将进入新的重组。市场数据也支持了人工智能手机的发展潜力。据IDC预测,2024年全球生成式AI手机出货量预计将达到2.342亿部,同比增长363.6%。到2028年,这一数字预计将达到9.12亿台。虽然高增长预期背后蕴藏着巨大的市场潜力,但也说明行业尚未形成稳定的格局,各种技术路线都有各自的发展空间。从用户需求角度分析,智能手机创新长期停滞不前。根据一项研究中信证券最新报告显示,目前全球更换周期已延长至51个月。人工智能代理被视为下一波机器更换浪潮的关键驱动力。然而,用户对人工智能助手的接受程度不仅取决于技术能力,还取决于建立信任。隐私安全、操作可靠性和使用成本等因素会影响用户的采用决策。 AI手机的形态不会被单一路径所主导。系统级控制组合和可视化代理路径各有优势,并且具有在竞争中相互学习和融合的潜力。行业观察人士指出,最终的结果将取决于哪些技术能够真正落地、稳定、广泛运行并赢得用户的信任。