Question 1

什麼是Seizn Memory？它解決什麼問題？

Accepted Answer

Seizn Memory是為AI應用程式提供持久、可搜尋記憶體的AI記憶體基礎設施。與僅存儲/搜尋向量的向量資料庫不同，Seizn包含完整的產品層：記憶體提取、策略管理、密鑰管理、刪除、審計日誌和SDK。它解決了跨AI會話維護上下文和實現個人化AI體驗的問題。

Question 2

Seizn與Pinecone或Weaviate等向量資料庫有何不同？

Accepted Answer

向量資料庫是向量的存儲/搜尋基礎設施。Seizn是建構在其上的完整記憶體系統，提供：從對話中自動提取記憶體、記憶體類型分類、命名空間/範圍管理、API密鑰輪換、審計日誌、SDK和治理功能。將其視為「記憶體基礎設施」vs「搜尋基礎設施」。

Question 3

使用Seizn需要RAG嗎？

Accepted Answer

不需要。最常見的起點是：存儲記憶體 -> 搜尋 -> 注入提示。RAG（自動上下文組合 + 回應生成）是下一步。您可以從簡單開始，根據需要增加複雜性。

Question 4

構建PoC的最快方法是什麼？

Accepted Answer

1) POST /api/memories存儲用戶偏好。2) GET /api/memories搜尋。3) 將結果注入LLM提示。4) 稍後，添加/api/extract用於自動提取，/api/query用於記憶體增強回應。

Question 5

應該在/api/memories中存儲什麼？

Accepted Answer

存儲跨對話有效的資訊：偏好（語氣、語言、格式）、事實（工作、工具、專案結構）、指令（「總是用表格總結」）、關係（「Alice是團隊負責人」）。除非使用會話範圍，否則避免存儲臨時或會話特定的數據。

Question 6

不應該存儲什麼數據？

Accepted Answer

絕不存儲：密碼、API密鑰、令牌、會話cookie（認證資訊）、SSN、護照號碼、銀行帳戶（PII）、信用卡資訊（支付數據）。對於臨時數據，如需要可使用帶TTL的會話範圍。

Question 7

為什麼命名空間很重要？

Accepted Answer

命名空間按專案/租戶/環境分離記憶體。沒有它，數據會混合，搜尋品質下降，刪除/導出變得困難。建議：'org:acme/app:chat/env:prod'或'project:myapp/env:staging'。在生產環境中絕不只使用'default'。

Question 8

何時應該使用範圍（user/session/agent）？

Accepted Answer

user：全局適用於用戶的偏好。session：僅對此對話有效的目標或上下文。agent：多代理系統中特定代理的規則。正確使用範圍可減少提示長度並提高回應一致性。

Question 9

什麼是memory_types，為什麼重要？

Accepted Answer

memory_type對記憶體進行分類：fact（不變的資訊）、preference（用戶選擇）、instruction（要遵循的規則）、relationship（人/組織連結）、experience（過去的事件）。這是過濾、刪除和策略應用最強大的軸心。

Question 10

threshold和limit如何運作？

Accepted Answer

limit：檢索的候選記憶體數量（太低=錯過相關的，太高=噪音上下文）。threshold：0-1相似度截止（越高=越嚴格）。從limit=10、threshold=0.7開始。如果錯過記憶體，將threshold降至0.6並將limit提高到20。如果獲得不相關的結果，將threshold提高到0.75-0.8。

Question 11

為什麼我的搜尋結果不相關？

Accepted Answer

通常是以下之一：1) 命名空間混合，2) 存儲的記憶體太多（噪音），3) threshold太低，4) 內容太抽象（「喜歡東西」vs具體事實）。修復：分離命名空間，使內容具體，提高threshold。

Question 12

記憶體增長後搜尋品質下降了。該怎麼辦？

Accepted Answer

添加重要性評分，僅保留高重要性記憶體。使用TTL自動過期舊記憶體。定期將相似記憶體合併為摘要。分離命名空間以減少搜尋範圍。

Question 13

應該如何使用/api/extract？

Accepted Answer

建議流程：1) 使用auto_store=false調用以預覽提取的記憶體。2) 向用戶顯示結果以供確認。3) 僅存儲已批准的記憶體。4) 一旦提取品質得到證明，切換到auto_store=true進行自動化。

Question 14

model=haiku和model=sonnet有什麼區別？

Accepted Answer

haiku：更快、更便宜，適合大多數情況。sonnet：更準確，適合重要提取（入職、合約、政策）。對大量/初始提取使用haiku，對高風險場景使用sonnet。

Question 15

存儲後可以修改記憶體嗎？

Accepted Answer

可以，但建議的模式是：創建新記憶體 + 刪除/歸檔舊的。這種方法更有利於審計追蹤並防止回歸問題。

Question 16

如何刪除記憶體？

Accepted Answer

兩種方法：1) 按ID刪除（精確），2) 按命名空間刪除（批量清理）。對於企業/合規，確保「完全刪除 + 審計日誌」。明確記錄您的刪除策略。

Question 17

我收到429 Too Many Requests。該怎麼辦？

Accepted Answer

您已達到速率限制。解決方案：1) 實施指數退避（1秒 -> 2秒 -> 4秒）。2) 在伺服器端排隊請求。3) 降低請求頻率：緩存重複查詢，批量操作，降低提取頻率。

Question 18

如何降低成本？

Accepted Answer

最大成本驅動因素：1) 提取頻率 - 減少調用。2) 搜尋範圍 - 使用命名空間縮小。3) 模型選擇 - 常規使用haiku，重要使用sonnet。4) 緩存 - 緩存重複查詢。5) 盡可能批量操作。

Question 19

可以在瀏覽器（前端）使用API密鑰嗎？

Accepted Answer

不建議 - 密鑰暴露風險高。從伺服器調用Seizn（Next.js Route Handler、Cloudflare Worker、無伺服器函數），讓瀏覽器調用您的伺服器。絕不將API密鑰暴露給客戶端程式碼。

Question 20

我的安全/法務團隊需要什麼文檔？

Accepted Answer

他們需要：1) 數據範圍（存儲/不存儲什麼），2) 加密（靜態：AES-256，傳輸中：TLS），3) 租戶隔離方法，4) 刪除/保留策略，5) 審計日誌訪問，6) 密鑰輪換/過期策略。在您的文檔中保留安全與治理頁面。

Question 21

什麼是 Graph-RAG 記憶體系統？

Accepted Answer

Seizn 使用 Graph-RAG 架構，將向量嵌入與知識圖譜關係相結合。記憶體儲存為具有類型化邊（relates_to、supports、contradicts 等）的節點。這使得：透過圖遍歷進行上下文回憶、用於主題聚類的自動社區檢測、以及具有有效期的時間知識追蹤成為可能。

Question 22

什麼是記憶體層級系統（Hot/Warm/Cold）？

Accepted Answer

Seizn 根據使用情況自動將記憶體組織到不同層級：Hot 層（頻繁存取，保留在快速快取中）、Warm 層（偶爾存取，標準檢索）、Cold 層（很少使用，歸檔但可搜尋）。層級管理器根據存取模式自動提升/降級記憶體，同時優化效能和成本。

Question 23

跨語言搜尋如何運作？

Accepted Answer

Seizn 為每個記憶體儲存原始內容和規範英語表示。搜尋查詢與兩種嵌入進行匹配，使得像用英語搜尋找到印地語記憶體這樣的情境成為可能。我們使用支援 100+ 種語言的多語言嵌入模型（BGE-M3、LaBSE），具有高跨語言對齊度。

Question 24

記憶體提取支援哪些語言？

Accepted Answer

Seizn 支援 35+ 種語言的記憶體提取和搜尋，包括：英語、中文（簡體/繁體）、印地語、西班牙語、法語、德語、日語、韓語、俄語、烏克蘭語、阿拉伯語，以及所有主要印度語言（泰米爾語、泰盧固語、孟加拉語等）。語言以 95%+ 的準確率自動檢測。

Question 25

什麼是 MCP 整合？如何使用？

Accepted Answer

MCP（模型上下文協定）允許像 Claude Desktop 這樣的 AI 助手直接存取 Seizn 記憶體。安裝我們的 MCP 伺服器（npx @seizn/mcp-server），將其添加到 Claude Desktop 配置中，助手就可以在對話期間自動儲存和檢索記憶體。這實現了跨會話的持久個人化。

Question 26

Seizn 的記憶體系統由什麼技術驅動？

Accepted Answer

Seizn 建構於：帶有 React Server Components 的 Next.js 16、Supabase（PostgreSQL + pgvector 用於向量搜尋）、Voyage AI voyage-3 模型（1024 維嵌入）、Claude 用於記憶體提取和分析。我們使用 HNSW 索引實現亞 100ms 向量搜尋、WebSocket 即時訂閱和 Redis 快取。

Question 27

如何將 Seizn 整合到我的 LLM 工作流程中？

Accepted Answer

三種主要方法：1) REST API - 直接 HTTP 呼叫以獲得完全控制，2) SDK（TypeScript/Python）- 帶重試邏輯的類型安全包裝器，3) MCP 伺服器 - 與 Claude Desktop 和其他 MCP 相容助手的自動整合。對於生產環境，我們建議使用 SDK 配合伺服器端呼叫來保護您的 API 金鑰。

Question 28

什麼是 Context API？如何使用？

Accepted Answer

Context API（GET /api/context）返回可直接注入 LLM 提示的預格式化字串。它結合了：使用者檔案、最近記憶體、相關事實和圖上下文。根據上下文預算使用 format=brief（~500 tokens）、detailed（~1500 tokens）或 extended（~3000 tokens）。

常見問題

還有其他問題嗎？