发布时间:2026-02-06 作者:admin
Swiggy推出了Hermes V3,这是一款由生成式AI驱动的文本转SQL助手。借助该助手,员工可以用简洁的英语进行数据查询。Hermes部署于Slack平台,融合了向量检索、会话记忆、代理编排与解释层等功能,能够基于自然语言输入生成精准的SQL查询语句。
Swiggy是印度的一家在线食品订购与配送企业,其最初推出的Hermes是一个轻量级接口,员工可通过它提出简单问题,系统会针对内部数据存储执行相应SQL查询并反馈结果。不过早期版本存在诸多不足:在派生指标上有局限性,无法保留对话上下文,面对相似提示时输出结果不一致,且缺乏验证生成SQL的明确方式。为解决这些问题,工程团队借助少样本学习、元数据检索技术,结合围绕大型语言模型构建的结构化工作流,对系统进行了重新构建。
之前的Hermes整体架构(来源:Swiggy技术博客)
在第三次迭代时,Hermes构建了一套基于向量的提示检索机制,其核心是借助历史SQL语句在Snowflake平台上运行。考虑到生产环境中的多数查询缺少具有描述性的元数据,团队转而利用具备大上下文处理能力的语言模型,把SQL查询转化为自然语言形式的解释,从而成功补全了原本缺失的查询意图信息。随后,这些生成的提示会通过向量相似性技术完成索引构建,并以少样本示例的形式融入后续流程,这样一来,Hermes就能依据过往的分析模式来理解新的请求,进而大幅提升SQL生成的精准度。
正如Swiggy的工程师Meghana Negi与Rutvik Reddy所着重指出的:
Hermes目前借助一个精心构建的过往已执行查询及其提示词的数据库,通过向量相似性检索方式,并结合对话上下文进行记忆,不仅将SQL生成的准确率从54%提升至93%,还实现了流畅自然的多轮交互。
Hermes V3工作流(来源:Swiggy技术博客)
Hermes V3具备对话记忆功能,支持多轮查询时直接关联此前的交流内容,无需用户重复说明上下文。由于系统能够实时追踪会话状态,还可将简单指令拓展为复合性请求,因此用户交互过程自然且顺畅。此外,通过一个编排代理,该系统实现了ReAct模式的推理循环,能把复杂问题拆解为可复用工作流中的一系列离散任务,具体包括意图解析、完整性校验、元数据查询、示例调取、中间逻辑搭建、SQL语句生成以及必要情况下的澄清问询等环节。
用于查询生成代理流的结构化智能(来源:Swiggy技术博客)
另一个值得注意的提升之处在于新增了一个解释层面,它能够揭示生成SQL语句时所依据的假设,并且为其分配置信度分值。这种透明化的设计让非技术背景的利益相关者也能明白查询语句的形成逻辑,进而加深他们对机器生成的洞察结果的信任程度。
Hermes V3系统与Swiggy的安全、合规及元数据基础设施实现深度整合。借助基于角色的访问控制、单点登录、临时授权与审计日志等机制,可保障敏感数据访问严格遵循内部治理规范。而混合式元数据检索策略,既能高效获取相关的模式、表及列的详细信息,又能将令牌使用量控制在LLM服务限制范围内,同时维持良好性能。
Hermes的架构整合了多种开源与云原生技术。其检索功能依托向量数据库和嵌入模型搭建;编排逻辑借助LangChain等工具构建结构化提示工作流;可观察性框架则以分层方式实现来源追溯与监控。而Snowflake用于数据分析、PostgreSQL或同类事务性数据库,以及API网关等,均是支撑Hermes功能的更广泛生态系统中的组成部分。
发布于 2026-03-10 16:05:18
发布于 2026-03-10 16:05:14
发布于 2026-03-10 16:04:40
发布于 2026-03-10 16:04:34
发布于 2026-03-10 16:04:30
发布于 2026-03-10 16:03:55