跳到正文
This is Oscar
返回

用 Gemma 4 将最先进的 Agent 能力带到边缘设备

原文标题:Bring state-of-the-art agentic skills to the edge with Gemma 4
原文链接:https://developers.googleblog.com/bring-state-of-the-art-agentic-skills-to-the-edge-with-gemma-4/

Bring state-of-the-art agentic skills to the edge with Gemma 4

Gemma 4 Banner

作者:Google AI Edge Team

今天,Google DeepMind 发布了 Gemma 4——一系列最先进的开源模型,重新定义了在你自己的硬件上所能实现的可能性。Gemma 4 现已在 Apache 2.0 许可证下发布,为开发者提供了强大的端侧 AI 开发工具包。借助 Gemma 4,你可以超越聊天机器人,构建直接在设备上运行的 Agent 和自主 AI 应用场景。Gemma 4 支持多步规划、自主行动、离线代码生成,甚至音视频处理——所有这些都无需专门的微调。它还面向全球用户,支持超过 140 种语言。

我们很高兴地宣布,从今天起你就可以在边缘设备上体验 Gemma 4 的全面能力!通过全新的 AICore Developer Preview 访问 Android 内置的 Gemma 4 模型,或利用 Google AI Edge 在移动端、桌面和边缘设备上构建 Agent 化的应用内体验。

在本文中,我们将展示如何使用 Google AI Edge Gallery 和 LiteRT-LM 开始构建。

Google AI Edge Gallery 支持 iOSAndroid,让你能够构建和试验完全在设备端运行的 AI 体验。今天,我们非常激动地宣布推出 Agent Skills——这是首批完全在设备端运行多步自主 Agent 工作流的应用之一。由 Gemma 4 驱动,Agent Skills 能够:

要体验 Gemma 4 E2B 和 E4B 模型的实际效果,请立即下载 Google AI Edge Gallery 应用。在应用内,你可以通过我们的指南轻松开始试验并创建自己的 Skills。我们迫不及待地想看到你构建的成果,欢迎在 GitHub Discussion 中分享你的 Skills!

使用 LiteRT-LM 跨设备部署 Gemma 4

对于希望在应用内或更广泛设备上部署 Gemma 4 的开发者,LiteRT-LM 在整个硬件范围内提供出色的性能。LiteRT-LM 在 LiteRT 之上添加了 GenAI 专用库——LiteRT 已经凭借其高性能库 XNNPack 和 ML Drift 赢得了数百万 Android 和边缘设备开发者的信任。LiteRT-LM 在此技术栈之上,通过以下新特性进一步提升模型性能:

为了支持 Agent 用例所需的扩展 Context 长度,LiteRT-LM 利用前沿的 GPU 优化,在 3 秒内2 个不同的 Skills 处理 4,000 个输入 Token

LiteRT-LM 还能将较小的 Gemma 4 模型部署到 IoT 和边缘设备上,并实现令人瞩目的性能。例如,在 Raspberry Pi 5 上,Gemma 4 E2B 实现了 133 tokens/秒 的预填充吞吐量和 7.6 tokens/秒 的解码吞吐量。凭借这样的性能,你可以在资源受限的硬件上完全离线运行智能家居控制器、语音助手和机器人应用。

准备好开始了吗?查看 LiteRT-LM 文档 获取完整指南和设备特定的性能指标。你还可以查看 Gemma 4 E2BGemma 4 E4B 的模型卡片。

在任何设备上运行

Gemma 4 今天发布,支持范围前所未有的平台:

今天,我们还发布了一个新的 Python 包和 CLI 工具,让在控制台中试验 Gemma 变得前所未有的简单,并为 IoT 设备上的基于 Gemma 的 Python 管道提供支持。litert-lm CLI 支持 Linux、macOS 和 Raspberry Pi,开发者无需编写任何代码即可试用最新的 Gemma 4 模型能力。CLI 现在还支持驱动 Google AI Edge Gallery 中 Agent Skills 的工具调用。LiteRT-LM 的 Python 绑定提供了从 Python 深度定制端侧 LLM 管道的灵活性。使用我们的 指南 即可在终端中快速上手 LiteRT-LM。

端侧 Agent 体验的时代已经到来,我们希望你对在边缘设备上构建感到兴奋。无论你在哪种设备上构建,都可以从 Google AI Edge Gallery 中的 Agent Skills 示例LiteRT-LM 入门指南 开始。我们迫不及待地想看到你的作品!

致谢

特别感谢以下重要贡献者在此项目上的工作:

Advait Jain, Alice Zheng, Amber Heinbockel, Andrew Zhang, Byungchul Kim, Cormac Brick, Daniel Ho, Derek Bekebrede, Dillon Sharlet, Eric Yang, Fengwu Yao, Frank Barchard, Grant Jensen, Hriday Chhabria, Jae Yoo, Jenn Lee, Jing Jin, Jingxiao Zheng, Juhyun Lee, Lu Wang, Lin Chen, Majid Dadashi, Marissa Ikonomidis, Matthew Chan, Matthew Soulanille, Matthias Grundmann, Milen Ferev, Misha Gutman, Mohammadreza Heydary, Pradeep Kuppala, Qidong Zhao, Quentin Khan, Ram Iyengar, Raman Sarokin, Renjie Wu, Rishika Sinha, Rodney Witcher, Ronghui Zhu, Sachin Kotwani, Suleman Shahid, Tenghui Zhu, Terry Heo, Tiffany Hsiao, Wai Hon Law, Weiyi Wang, Xiaoming Hu, Xu Chen, Yishuang Pang, Yi-Chun Kuo, Yu-Hui Chen, Zichuan Wei 以及 gTech 团队。

引用


分享到:

上一篇
我的 Agent 如何在生产环境中自我修复
下一篇
开源模型已经跨越了一个门槛