LLM Gateway 简介
什么是 LLM Gateway?
LLM Gateway 是一个企业级的 LLM API 统一网关系统,为多个大语言模型提供商(OpenAI、DeepSeek、通义千问、Claude、Gemini等)提供统一的 OpenAI 兼容 API 接口。
通过 LLM Gateway,您可以:
统一接入
一次接入,支持 38+ 主流 LLM 提供商,兼容 OpenAI API 格式
智能路由
基于负载均衡、成本、性能、优先级的多策略智能路由系统
成本优化
语义缓存、自动降级、成本追踪,降低API 调用成本
企业安全
Prompt 防火墙、PII 检测、访问控制、审计日志
核心特性
🚀 智能路由系统
基于多维度指标的智能路由决策:
- 负载均衡:轮询、随机、最少连接、加权轮询
- 成本优化:自动选择最低成本的可用模型
- 性能优先:基于实时延迟选择最快的模型
- 优先级路由:按渠道优先级分配,支持健康检查降级
- 综合平衡:综合考虑性能、成本、可靠性的加权评分
💰 语义缓存
基于向量相似度的智能缓存系统:
- 自动识别语义相似的查询,返回缓存结果
- 相似度阈值可配置(默认 0.85)
- 支持 Redis Stack 向量搜索
- 可节省 30-70% API 调用成本
- 平均响应时间 < 100ms(缓存命中)
🛡️ Prompt 防火墙
多层安全防护,保护您的系统和数据:
- 恶意输入检测:SQL 注入、XSS、Prompt 注入
- PII 自动检测:邮箱、手机、身份证、信用卡等 10+ 类型
- 内容过滤:关键词、正则表达式、自定义规则
- 多种动作:拦截、脱敏、记录、审核
- 性能优化:结果缓存,平均延迟 1-3ms
⚡ 限流控制
三级限流体系,精准控制访问频率:
- 系统级限流:全局并发控制
- 用户级限流:按用户限制请求频率
- 令牌级限流:精细化的 API Key 管理
- 支持 Redis 分布式限流,Redis 不可用时,自动降级到内存限流
📊 完整的管理功能
- 渠道管理:多渠道配置、健康检查、自动启停
- 用户管理:用户组、配额管理、OAuth 登录
- 令牌管理:API Key 生成、权限控制、IP 白名单
- 访问日志:详细的请求日志、统计分析
支持的 LLM 提供商
支持 38+ 主流 LLM 提供商,所有提供商统一使用 OpenAI 兼容的 API 格式,无需修改现有代码。
国际主流提供商
| 提供商 | 代表模型 | 特色 |
|---|---|---|
| OpenAI | GPT-4, GPT-4o, GPT-3.5 Turbo | 业界标杆,性能卓越 |
| Anthropic | Claude 3.5 Sonnet, Claude 3 Opus |