AutoGLM是什么
AutoGLM是智谱推出的全球首个手机Agent,通过AI技术为用户提供高效的操作代理服务。AutoGLM基于国产GLM-4.5和GLM-4.5V模型,具备推理、代码和多模态能力。AutoGLM实现了云端执行,不占用用户本地设备资源,用户通过语音指令让其完成各种操作,如点外卖、订机票、查房源等。AutoGLM支持跨设备操作,突破硬件限制。AutoGLM的操作执行能力被封装为API,开发者能将其集成到各类硬件设备中,如AI眼镜、手表、家电等。
2025年3月31日,智谱推出首个免费、具备深度研究和操作能力的AI Agent:AutoGLM沉思
AutoGLM的主要功能
- 云端操作代理:
- 生活场景:用户能通过语音指令让AutoGLM操作美团、京东、小红书、抖音等几十个高频应用,完成点外卖、订机票、查房源等任务。
- 办公场景:AutoGLM能跨网站执行全流程工作,操作网页版的飞书、网易邮箱、知乎、微博、抖音、微头条等网站,完成信息检索、内容撰写、生成视频、PPT或播客,并直接发布到社交媒体平台。
- 独立运行:
- 专属智能体手机/电脑:AutoGLM为AI配备云端的专属设备,使其能独立运行,不占用用户本地设备的资源,用户能同时使用其他APP。
- 异步代理办公:用户能在离线状态下,让AutoGLM继续执行任务,实现24小时不间断服务。
- 跨设备操作:
- 突破硬件限制:AutoGLM能在任何设备和场景下运行,支持跨设备操作,如手机、电脑、手表、眼镜、家电等。
- API封装:AutoGLM的操作执行能力被封装为API,开发者能集成到各类硬件设备中,让硬件具备完整的手机级操作能力。。
AutoGLM的技术原理
- 国产模型驱动:AutoGLM基于智谱最新开源的SOTA语言模型GLM-4.5和视觉推理模型GLM-4.5V,具备推理、代码和多模态能力。模型能完成推理、编码、研究、Agentic与GUI操作等多类任务,根据需求灵活调用最合适的“大脑”完成执行。
- 端到端异步强化学习:
- ComputerRL:提出API-GUI协同范式,提升数据多样性与计算效率;改进GRPO并提出Entropulse机制,增强探索与策略多样性。
- MobileRL:创新难度自适应强化学习方法(推理自举预热+难度自适应GRPO),显著提升移动端任务的稳定性与收敛效率。
- AgentRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定与梯度分布不均,增强整体鲁棒性与效率。
如何使用AutoGLM
- 在线体验:
- 访问官网:访问 AutoGLM官网 https://autoglm.zhipuai.cn/。
- 启动云机:页面加载完成后,点击启动按钮,启动AutoGLM的云端设备。
- 与AutoGLM交互:在输入框输入问题或指令。
- 例如,输入以下指令:
- “帮我查一下明天从北京到上海的机票。”
- “帮我点一杯咖啡。”
- “帮我生成一个关于环保的PPT。”
- 查看结果:AutoGLM在云端处理请求,并将结果返回到页面上。
- 客户端:
- 下载版应用:下载AutoGLM客户端。
- 注册与登录:完成账号注册和登录,进入应用。
- 语音指令:打开应用后,点击语音输入按钮,说出指令,AutoGLM自动识别语音指令,并在云端执行相应的操作。
- 文字输入:在应用的输入框中输入文本指令。输入完成后,点击“发送”按钮,AutoGLM会根据指令进行操作。
- 查看结果:AutoGLM在云端完成任务后,将结果返回到设备上。
AutoGLM的项目地址
- 官网地址:https://autoglm.zhipuai.cn/
- 项目官网:https://xiao9905.github.io/AutoGLM/
AutoGLM的应用场景
- 社交媒体管理:在社交平台上自动执行点赞、评论、分享等操作。
- 在线购物:在电商平台上搜索商品、比较价格、下单购买、跟踪物流等。
- 旅行预订:在旅游网站上搜索并预订酒店、机票、火车票等。
- 外卖订购:在外卖平台上浏览菜单、下单、支付以及追踪订单状态。
- 日常信息查询:如查询天气、新闻、股票信息等。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。