よくある質問

Seizn Memory APIに関する一般的な質問、入門から高度な運用まで。

Q1Seizn Memoryとは何ですか?どのような問題を解決しますか?
Seizn Memoryは、AIアプリケーション向けの永続的で検索可能なメモリを提供するAIメモリインフラストラクチャです。ベクトルの保存/検索のみを行うベクトルデータベースとは異なり、Seiznはメモリ抽出、ポリシー管理、キー管理、削除、監査ログ、SDKを含む完全な製品レイヤーを提供します。AIセッション間のコンテキスト維持とパーソナライズされたAI体験を可能にする問題を解決します。
はじめに
Q2SeizはPineconeやWeaviateなどのベクトルデータベースとどう違いますか?
ベクトルデータベースはベクトルの保存/検索インフラです。Seiznはその上に構築された完全なメモリシステムで、会話からの自動メモリ抽出、メモリタイプ分類、名前空間/スコープ管理、APIキーローテーション、監査ログ、SDK、ガバナンス機能を提供します。「メモリインフラ」vs「検索インフラ」と考えてください。
はじめに
Q3Seiznを使用するにはRAGが必要ですか?
いいえ。最も一般的な出発点は:メモリを保存 -> 検索 -> プロンプトに注入です。RAG(自動コンテキスト構成 + 応答生成)は次のステップです。シンプルに始めて、必要に応じて複雑さを追加できます。
はじめに
Q4PoCを最速で構築する方法は?
1) POST /api/memoriesでユーザー設定を保存。2) GET /api/memoriesで検索。3) 結果をLLMプロンプトに注入。4) 後で自動抽出用の/api/extractとメモリ拡張応答用の/api/queryを追加。
はじめに
Q5/api/memoriesに何を保存すべきですか?
会話間で有効な情報を保存:好み(トーン、言語、フォーマット)、事実(仕事、ツール、プロジェクト構造)、指示(「常にテーブルで要約」)、関係(「Aliceがチームリーダー」)。セッションスコープを使用しない限り、一時的またはセッション固有のデータの保存は避けてください。
コア概念
Q6保存してはいけないデータは?
決して保存しないでください:パスワード、APIキー、トークン、セッションクッキー(認証情報)、社会保障番号、パスポート番号、銀行口座(PII)、クレジットカード情報(決済データ)。一時的なデータには、必要に応じてTTL付きのセッションスコープを使用してください。
コア概念
Q7名前空間が重要な理由は?
名前空間はプロジェクト/テナント/環境でメモリを分離します。なければデータが混在し、検索品質が低下し、削除/エクスポートが困難になります。推奨:'org:acme/app:chat/env:prod'または'project:myapp/env:staging'。本番環境で'default'だけを使用しないでください。
コア概念
Q8スコープ(user/session/agent)はいつ使用すべきですか?
user:ユーザーにグローバルに適用される好み。session:この会話でのみ有効な目標やコンテキスト。agent:マルチエージェントシステムで1つのエージェントに固有のルール。スコープを適切に使用すると、プロンプトの長さが短くなり、応答の一貫性が向上します。
コア概念
Q9memory_typeとは何ですか?なぜ重要ですか?
memory_typeはメモリを分類します:fact(不変の情報)、preference(ユーザーの選択)、instruction(従うべきルール)、relationship(人/組織のつながり)、experience(過去のイベント)。フィルタリング、削除、ポリシー適用のための最も強力な軸です。
コア概念
Q10thresholdとlimitはどのように機能しますか?
limit:取得する候補メモリの数(低すぎると関連するものを見逃し、高すぎるとノイズの多いコンテキスト)。threshold:0-1の類似度カットオフ(高いほど厳格)。limit=10、threshold=0.7から始めてください。メモリが不足している場合はthresholdを0.6に下げ、limitを20に上げてください。無関係な結果が出る場合はthresholdを0.75-0.8に上げてください。
検索と取得
Q11検索結果が無関係な理由は?
通常は次のいずれか:1) 名前空間が混在、2) 保存されたメモリが多すぎる(ノイズ)、3) thresholdが低すぎる、4) コンテンツが抽象的すぎる(「物が好き」vs具体的な事実)。解決策:名前空間を分離、コンテンツを具体化、thresholdを上げる。
検索と取得
Q12メモリが増えると検索品質が低下しました。どうすればいいですか?
重要度スコアリングを追加し、高重要度のメモリのみを保持。TTLを使用して古いメモリを自動期限切れに。定期的に類似したメモリを要約に統合。検索範囲を減らすために名前空間を分離。
検索と取得
Q13/api/extractはどのように使用すべきですか?
推奨フロー:1) auto_store=falseで呼び出して抽出されたメモリをプレビュー。2) ユーザーに確認のため結果を表示。3) 承認されたメモリのみを保存。4) 抽出品質が証明されたら、自動化のためにauto_store=trueに切り替え。
抽出
Q14model=haikuとmodel=sonnetの違いは?
haiku:より高速、より安価、ほとんどのケースに適合。sonnet:より正確、重要な抽出(オンボーディング、契約、ポリシー)に適合。バルク/初期抽出にはhaiku、重要なシナリオにはsonnetを使用。
抽出
Q15保存後にメモリを変更できますか?
はい、ただし推奨パターンは:新しいメモリを作成 + 古いメモリを削除/アーカイブです。このアプローチは監査証跡に適しており、回帰問題を防ぎます。
運用
Q16メモリを削除するにはどうすればいいですか?
2つのアプローチ:1) IDで削除(正確)、2) 名前空間で削除(一括クリーンアップ)。エンタープライズ/コンプライアンスのために「完全削除 + 監査ログ」を確保。削除ポリシーを明確に文書化してください。
運用
Q17429 Too Many Requestsエラーが発生しています。どうすればいいですか?
レート制限に達しました。解決策:1) 指数バックオフを実装(1秒 -> 2秒 -> 4秒)。2) サーバー側でリクエストをキューイング。3) リクエスト頻度を減らす:重複クエリをキャッシュ、バッチ操作、抽出頻度を下げる。
運用
Q18コストを削減するにはどうすればいいですか?
最大のコスト要因:1) 抽出頻度 - 呼び出しを減らす。2) 検索範囲 - 名前空間で絞り込む。3) モデル選択 - 日常にはhaiku、重要なものにはsonnet。4) キャッシング - 繰り返しのクエリをキャッシュ。5) 可能な場合はバッチ操作。
運用
Q19ブラウザ(フロントエンド)でAPIキーを使用できますか?
推奨されません - キー漏洩のリスクが高い。サーバー(Next.js Route Handler、Cloudflare Worker、サーバーレス関数)からSeiznを呼び出し、ブラウザがサーバーを呼び出すようにしてください。クライアント側のコードにAPIキーを決して公開しないでください。
セキュリティとコンプライアンス
Q20セキュリティ/法務チームに必要なドキュメントは?
必要なもの:1) データ範囲(保存されるもの/されないもの)、2) 暗号化(保存時:AES-256、転送中:TLS)、3) テナント分離方法、4) 削除/保持ポリシー、5) 監査ログアクセス、6) キーローテーション/有効期限ポリシー。ドキュメントにセキュリティとガバナンスのページを維持してください。
セキュリティとコンプライアンス
Q21Graph-RAGメモリシステムとは何ですか?
Seiznはベクター埋め込みとナレッジグラフの関係を組み合わせたGraph-RAGアーキテクチャを使用しています。メモリは型付きエッジ(relates_to、supports、contradictsなど)を持つノードとして保存されます。これにより、グラフ探索による文脈的な想起、トピッククラスタリングのための自動コミュニティ検出、有効期間を持つ時間的知識追跡が可能になります。
コア概念
Q22メモリティアシステム(Hot/Warm/Cold)とは何ですか?
Seiznは使用パターンに基づいてメモリを自動的にティアに整理します:Hotティア(頻繁にアクセス、高速キャッシュに保持)、Warmティア(時々アクセス、標準検索)、Coldティア(まれに使用、アーカイブされるが検索可能)。ティアマネージャーがアクセスパターンに基づいてメモリを自動的に昇格/降格し、パフォーマンスとコストの両方を最適化します。
コア概念
Q23クロスリンガル検索はどのように機能しますか?
Seiznは各メモリに対してオリジナルコンテンツと正規化された英語表現の両方を保存します。検索クエリは両方の埋め込みとマッチングされ、英語で検索してヒンディー語のメモリを見つけるようなシナリオが可能になります。100以上の言語を高いクロスリンガル整合性でサポートする多言語埋め込みモデル(BGE-M3、LaBSE)を使用しています。
検索と取得
Q24メモリ抽出にはどの言語がサポートされていますか?
Seiznはメモリ抽出と検索に35以上の言語をサポートしています:英語、中国語(簡体字/繁体字)、ヒンディー語、スペイン語、フランス語、ドイツ語、日本語、韓国語、ロシア語、ウクライナ語、アラビア語、およびすべての主要なインド諸語(タミル語、テルグ語、ベンガル語など)。言語は95%以上の精度で自動検出されます。
検索と取得
Q25MCP統合とは何ですか?どのように使用しますか?
MCP(Model Context Protocol)により、Claude Desktopなどのアシスタントが直接Seiznメモリにアクセスできます。MCPサーバー(npx @seizn/mcp-server)をインストールし、Claude Desktop設定に追加すると、会話中にアシスタントが自動的にメモリを保存・検索できます。これにより、セッション間で永続的なパーソナライゼーションが可能になります。
はじめに
Q26Seiznのメモリシステムを動かす技術は何ですか?
Seiznは以下で構築されています:React Server Components付きのNext.js 16、Supabase(PostgreSQL + ベクター検索用pgvector)、Voyage AI voyage-3モデル(1024次元埋め込み)、メモリ抽出・分析用Claude。100ms未満のベクター検索のためにHNSWインデックス、WebSocketリアルタイムサブスクリプション、キャッシング用Redisを使用しています。
はじめに
Q27SeiznをLLMワークフローに統合するにはどうすればいいですか?
3つの主なアプローチがあります:1) REST API - 完全な制御のための直接HTTP呼び出し、2) SDK(TypeScript/Python)- リトライロジック付きの型安全ラッパー、3) MCPサーバー - Claude Desktopや他のMCP互換アシスタントとの自動統合。本番環境では、APIキー保護のためにサーバーサイド呼び出しとSDKの使用を推奨します。
運用
Q28Context APIとは何ですか?どのように使用しますか?
Context API(GET /api/context)は、LLMプロンプトに直接注入できる事前フォーマット済みの文字列を返します。ユーザープロファイル、最近のメモリ、関連する事実、グラフコンテキストを組み合わせます。コンテキスト予算に応じて、format=brief(〜500トークン)、detailed(〜1500トークン)、extended(〜3000トークン)を使用してください。
運用

まだ質問がありますか?

ドキュメントをご確認いただくか、サポートチームにお問い合わせください。