常见问题

关于 Seizn Memory API 的常见问题,从入门到高级操作。

Q1什么是 Seizn Memory?它解决什么问题?
Seizn Memory 是一个为 AI 应用程序提供持久、可搜索记忆的 AI 记忆基础设施。与仅存储/搜索向量的向量数据库不同,Seizn 包含完整的产品层:记忆提取、策略管理、密钥管理、删除、审计日志和 SDK。它解决了跨 AI 会话维护上下文和实现个性化 AI 体验的问题。
入门
Q2Seizn 与 Pinecone 或 Weaviate 等向量数据库有何不同?
向量数据库是向量的存储/搜索基础设施。Seizn 是建立在其之上的完整记忆系统,提供:从对话中自动提取记忆、记忆类型分类、命名空间/作用域管理、API 密钥轮换、审计日志、SDK 和治理功能。可以理解为「记忆基础设施」与「搜索基础设施」的区别。
入门
Q3使用 Seizn 需要 RAG 吗?
不需要。最常见的起点是:存储记忆 -> 搜索 -> 注入提示词。RAG(自动上下文组合 + 响应生成)是下一步。您可以简单开始,根据需要增加复杂性。
入门
Q4构建 PoC 的最快方法是什么?
1) POST /api/memories 存储用户偏好。2) GET /api/memories 搜索。3) 将结果注入 LLM 提示词。4) 之后,添加 /api/extract 进行自动提取,添加 /api/query 获取记忆增强响应。
入门
Q5应该在 /api/memories 中存储什么?
存储跨对话有效的信息:偏好(语气、语言、格式)、事实(工作、工具、项目结构)、指令(「总是用表格总结」)、关系(「Alice 是团队负责人」)。除非使用会话作用域,否则避免存储临时或会话特定的数据。
核心概念
Q6哪些数据不应该存储?
永远不要存储:密码、API 密钥、令牌、会话 Cookie(认证信息)、社会安全号、护照号、银行账户(PII)、信用卡信息(支付数据)。对于临时数据,如果需要可以使用带 TTL 的会话作用域。
核心概念
Q7为什么命名空间很重要?
命名空间按项目/租户/环境分离记忆。没有它,数据会混合,搜索质量下降,删除/导出变得困难。推荐:'org:acme/app:chat/env:prod' 或 'project:myapp/env:staging'。生产环境中永远不要只使用 'default'。
核心概念
Q8什么时候应该使用作用域(user/session/agent)?
user:全局适用于用户的偏好。session:仅在此对话中有效的目标或上下文。agent:多代理系统中特定于一个代理的规则。正确使用作用域可以减少提示词长度并提高响应一致性。
核心概念
Q9什么是 memory_type?为什么重要?
memory_type 对记忆进行分类:fact(不变信息)、preference(用户选择)、instruction(要遵循的规则)、relationship(人/组织联系)、experience(过去事件)。这是用于过滤、删除和策略应用的最强大的维度。
核心概念
Q10threshold 和 limit 如何工作?
limit:要检索的候选记忆数量(太低会错过相关记忆,太高会产生噪音上下文)。threshold:0-1 相似度截止值(越高越严格)。从 limit=10、threshold=0.7 开始。如果缺少记忆,将 threshold 降至 0.6,limit 提高到 20。如果结果不相关,将 threshold 提高到 0.75-0.8。
搜索与检索
Q11为什么我的搜索结果不相关?
通常是以下原因之一:1) 命名空间混合,2) 存储的记忆太多(噪音),3) threshold 太低,4) 内容太抽象(「喜欢东西」与具体事实)。解决方案:分离命名空间、使内容具体化、提高 threshold。
搜索与检索
Q12随着记忆增长,搜索质量下降了。我该怎么办?
添加重要性评分,只保留高重要性的记忆。使用 TTL 自动过期旧记忆。定期将相似记忆合并为摘要。分离命名空间以减少搜索范围。
搜索与检索
Q13我应该如何使用 /api/extract?
推荐流程:1) 使用 auto_store=false 调用以预览提取的记忆。2) 向用户显示结果以确认。3) 只存储已批准的记忆。4) 一旦提取质量得到证明,切换到 auto_store=true 进行自动化。
提取
Q14model=haiku 和 model=sonnet 有什么区别?
haiku:更快、更便宜,适合大多数情况。sonnet:更准确,更适合重要提取(入职、合同、政策)。大批量/初始提取使用 haiku,重要场景使用 sonnet。
提取
Q15存储后可以修改记忆吗?
可以,但推荐的模式是:创建新记忆 + 删除/归档旧记忆。这种方法更适合审计追踪,并防止回归问题。
运营
Q16如何删除记忆?
两种方法:1) 按 ID 删除(精确),2) 按命名空间删除(批量清理)。对于企业/合规,确保「完全删除 + 审计日志」。清楚地记录您的删除策略。
运营
Q17我收到 429 Too Many Requests 错误。我该怎么办?
您已达到速率限制。解决方案:1) 实现指数退避(1秒 -> 2秒 -> 4秒)。2) 在服务器端排队请求。3) 减少请求频率:缓存重复查询、批量操作、降低提取频率。
运营
Q18如何降低成本?
最大成本驱动因素:1) 提取频率 - 减少调用。2) 搜索范围 - 使用命名空间缩小。3) 模型选择 - 日常使用 haiku,重要的使用 sonnet。4) 缓存 - 缓存重复查询。5) 尽可能批量操作。
运营
Q19可以在浏览器(前端)中使用 API 密钥吗?
不推荐 - 密钥泄露风险高。从您的服务器(Next.js Route Handler、Cloudflare Worker、无服务器函数)调用 Seizn,让浏览器调用您的服务器。永远不要将 API 密钥暴露给客户端代码。
安全与合规
Q20我的安全/法务团队需要什么文档?
他们需要:1) 数据范围(存储/不存储什么),2) 加密(静态:AES-256,传输中:TLS),3) 租户隔离方法,4) 删除/保留策略,5) 审计日志访问,6) 密钥轮换/过期策略。在文档中保留安全与治理页面。
安全与合规
Q21什么是 Graph-RAG 记忆系统?
Seizn 使用 Graph-RAG 架构,将向量嵌入与知识图谱关系相结合。记忆存储为具有类型化边(relates_to、supports、contradicts 等)的节点。这使得能够:通过图遍历进行上下文回忆、用于主题聚类的自动社区检测、以及具有有效期的时间知识跟踪。
核心概念
Q22什么是记忆分层系统(Hot/Warm/Cold)?
Seizn 根据使用情况自动将记忆组织到不同层级:Hot 层(频繁访问,保留在快速缓存中)、Warm 层(偶尔访问,标准检索)、Cold 层(很少使用,归档但可搜索)。层级管理器根据访问模式自动提升/降级记忆,同时优化性能和成本。
核心概念
Q23跨语言搜索如何工作?
Seizn 为每个记忆存储原始内容和规范英语表示。搜索查询与两种嵌入进行匹配,使得像用英语搜索找到印地语记忆这样的场景成为可能。我们使用支持 100+ 种语言的多语言嵌入模型(BGE-M3、LaBSE),具有高跨语言对齐度。
搜索与检索
Q24记忆提取支持哪些语言?
Seizn 支持 35+ 种语言的记忆提取和搜索,包括:英语、中文(简体/繁体)、印地语、西班牙语、法语、德语、日语、韩语、俄语、乌克兰语、阿拉伯语,以及所有主要印度语言(泰米尔语、泰卢固语、孟加拉语等)。语言以 95%+ 的准确率自动检测。
搜索与检索
Q25什么是 MCP 集成?如何使用?
MCP(模型上下文协议)允许像 Claude Desktop 这样的 AI 助手直接访问 Seizn 记忆。安装我们的 MCP 服务器(npx @seizn/mcp-server),将其添加到 Claude Desktop 配置中,助手就可以在对话期间自动保存和检索记忆。这实现了跨会话的持久个性化。
入门
Q26Seizn 的记忆系统由什么技术驱动?
Seizn 构建于:带有 React Server Components 的 Next.js 16、Supabase(PostgreSQL + pgvector 用于向量搜索)、Voyage AI voyage-3 模型(1024 维嵌入)、Claude 用于记忆提取和分析。我们使用 HNSW 索引实现亚 100ms 向量搜索、WebSocket 实时订阅和 Redis 缓存。
入门
Q27如何将 Seizn 集成到我的 LLM 工作流中?
三种主要方法:1) REST API - 直接 HTTP 调用以获得完全控制,2) SDK(TypeScript/Python)- 带重试逻辑的类型安全包装器,3) MCP 服务器 - 与 Claude Desktop 和其他 MCP 兼容助手的自动集成。对于生产环境,我们建议使用 SDK 配合服务器端调用来保护您的 API 密钥。
运营
Q28什么是 Context API?如何使用?
Context API(GET /api/context)返回可直接注入 LLM 提示的预格式化字符串。它结合了:用户档案、最近记忆、相关事实和图上下文。根据上下文预算使用 format=brief(~500 tokens)、detailed(~1500 tokens)或 extended(~3000 tokens)。
运营

还有其他问题?

查看我们的文档或联系支持团队。