还难忘「AI 给东说念主类发的第一个红包」吗?世博shibo登录入口
昨年10月智谱发布众人首个Phone-Use家具AutoGLM,开启Agent的新期间。
今天,AutoGLM 2.0再次升级,将Agent运用提高到新的高度——
众人首个手机Agent,东说念主东说念主可用;
草创Agent+云手机/云电脑的新本领范式,不霸占用户手机和电脑;
冲破硬件范围,在职何配置、任何场景下开动,匡助用户代理操作;
国产模子(GLM-4.5、GLM-4.5V)驱动,具备推理、代码与多模态的万能才略。
众人首个手机Agent,东说念主东说念主可用;
草创Agent+云手机/云电脑的新本领范式,不霸占用户手机和电脑;
冲破硬件范围,在职何配置、任何场景下开动,匡助用户代理操作;
国产模子(GLM-4.5、GLM-4.5V)驱动,具备推理、代码与多模态的万能才略。
即刻起,东说念主东说念主王人可使用AutoGLM。咱们将快速迭代推出新功能(“定时任务”很快上线,AI每上帝动替你干活)。运用商店搜索“AutoGLM”,或点击文末“阅读原文”。
张开剩余72%操作实施舍手
畴前的AI多停留在“对话”层面;一般的智能体助手也多局限于信息查询和转头。
AutoGLM 2.0 则竣事了质的飞跃——它不再仅仅“说”,而是真的好像“作念”。
事实上,在AutoGLM 1.0中,咱们已探索过让AI代替用户完成部离异机操作,但只在有限场景下凯旋。跟着AutoGLM 2.0的发布,它照旧成长为别称实施型助手,好像在「云霄」自主完成各样化的任务。
在生涯场景中,用户只需一句话,就能让 AutoGLM 操作好意思团、京东、小红书、抖音等几十个高频运用:点外卖、订机票、查房源,举例帮你买「秋天的第一杯奶茶」。
在办公场景中,它一样能跨网站实施全经由责任,操作网页版的飞书、网易邮箱、知乎、微博、抖音、微头条等网站:从信息检索到实质撰写,再到生成视频、PPT 或播客,并径直完成小红书、抖音等应付媒体平台实质发布。
这意味着,AI不再是一个“聊天器具”,而是一个能真的替你干活的万能代理东说念主。不仅能给出谜底,还能把任务好意思满实施,匡助用户直率时辰与元气心灵,透顶改变东说念主与AI的配合神色。
为AI配一台手机
AutoGLM的主要亮点,是一个APP让一部手机成为真的的“新物种”。
在AutoGLM 2.0中,咱们为AI配备了专属智能体手机/智能体电脑,让它不错在云霄自骨干活、完成任务,而无需占用用户的土产货配置,期间用户不错使用其他 APP(如刷抖音、打游戏)。
这意味着AI不仅能“自动驾驶手机”,还可“异步代理办公”。让手机造成具备自主实施、跨端配合才略的智能体手机。
AutoGLM会以这么的家具口头出现,源于咱们对AGI早期口头的协调。咱们以为从Agent到AGI,还需要自高3A原则:
Around-the-clock(全时):24 小时开动,即使用户离线,Agent 依然在实施任务; Autonomy without interference(自主零烦躁):孤苦开动,不占用用户屏幕与算力,平行寰宇的搭子; Affinity(全域贯穿):跳出浏览器对话框,特别手机、电脑、腕表、眼镜、家电等配置,操作物理寰宇。借助AutoGLM深广的云霄实施才略,东说念主与配置的交互神色正在被再行界说。
咱们已将AutoGLM的操作实施才略封装为API,拓荒者只需节略接入,即可将这一才略无缝融入各样硬件配置,从AI眼镜等可一稔配置到传统家电。
AutoGLM初次让硬件具备好意思满的手机级操作才略,无需在端侧堆叠复杂系统或大容量电板。举例,不错通过智能眼镜点一杯咖啡。
当天起,AutoGLM移动端API恳求通说念及拓荒者生态共建打算厚爱上线。除手机与电脑外,腕表、眼镜、家电等配置王人能成为Agent驱动的智能助手。
期待与更多拓荒者共同探索AI融入物理寰宇的无尽可能。
本领SOTA
AutoGLM不错在国内免费向所有这个词东说念主灵通,因为它是纯国产Agent,资本相较于接入海外模子的Agent有了数目级的下落。
AutoGLM由智谱最新开源SOTA讲话模子GLM-4.5与视觉推理模子GLM-4.5V驱动。AutoGLM将基座模子原生才略证实到极致,并有计划在「端到端异步强化学习」方面的多项冲破恶果,不错完成推理、编码、沟通、Agentic与GUI操作等多类任务,并可证据需求天真调用最适应的「大脑」完成实施。
ComputerRL:提倡API-GUI协同范式,提高数据各样性与计较效用;校正GRPO并提倡 Entropulse 机制,增强探索与战略各样性。 MobileRL:窜改难度自适合强化学习要津(推理自举预热 + 难度自适合GRPO),显赫提高移动端任务的巩固性与拘谨效用。 AgentRL:通过交叉采样与任务上风归一化机制,贬责多任务熟练中的不巩固与梯度区分不均,增强举座鲁棒性与效用。在Device Use基准测试(涵盖手机、电脑和网页操作)中世博shibo登录入口,AutoGLM发达优于ChatGPT Agent、UI-TARS-1.5和Claude Sonnet4,展现出更强的鲁棒性与通用性,处于主流Agent的SOTA水平。
发布于:上海市