Часто задаваемые вопросы

Распространённые вопросы о Seizn Memory API, от начала работы до продвинутых операций.

Q1Что такое Seizn Memory и какую проблему он решает?
Seizn Memory — это инфраструктура памяти ИИ, которая обеспечивает постоянную, доступную для поиска память для приложений ИИ. В отличие от векторных баз данных, которые только хранят/ищут векторы, Seizn включает полный продуктовый слой: извлечение памяти, управление политиками, управление ключами, удаление, журналы аудита и SDK. Он решает проблему поддержания контекста между сессиями ИИ и обеспечения персонализированного опыта ИИ.
Начало работы
Q2Чем Seizn отличается от векторных баз данных, таких как Pinecone или Weaviate?
Векторные базы данных — это инфраструктура хранения/поиска для векторов. Seizn — это полноценная система памяти, построенная поверх этого, обеспечивающая: автоматическое извлечение памяти из разговоров, классификацию типов памяти, управление пространствами имён/областями видимости, ротацию API-ключей, журналирование аудита, SDK и функции управления. Представьте это как «инфраструктура памяти» против «инфраструктуры поиска».
Начало работы
Q3Нужен ли мне RAG для использования Seizn?
Нет. Наиболее распространённая отправная точка: сохранить память -> поиск -> вставить в промпт. RAG (автоматическая композиция контекста + генерация ответа) — следующий шаг. Вы можете начать просто и добавлять сложность по мере необходимости.
Начало работы
Q4Какой самый быстрый способ создать PoC?
1) POST /api/memories для сохранения пользовательского предпочтения. 2) GET /api/memories для поиска. 3) Вставить результаты в промпт LLM. 4) Позже добавить /api/extract для автоизвлечения и /api/query для ответов с расширенной памятью.
Начало работы
Q5Что мне следует хранить в /api/memories?
Храните информацию, которая остаётся действительной между разговорами: предпочтения (тон, язык, формат), факты (работа, инструменты, структура проекта), инструкции ("всегда резюмировать в таблицах"), отношения ("Алиса — руководитель команды"). Избегайте хранения временных или специфичных для сессии данных, если не используете область сессии.
Основные концепции
Q6Какие данные НЕ следует хранить?
Никогда не храните: пароли, API-ключи, токены, сессионные куки (данные авторизации), номера социального страхования, номера паспортов, банковские счета (PII), данные кредитных карт (платёжные данные). Для временных данных используйте область сессии с TTL, если необходимо.
Основные концепции
Q7Почему важно пространство имён?
Пространство имён разделяет память по проектам/арендаторам/средам. Без него данные смешиваются, качество поиска падает, а удаление/экспорт становится болезненным. Рекомендуется: 'org:acme/app:chat/env:prod' или 'project:myapp/env:staging'. Никогда не используйте просто 'default' в продакшене.
Основные концепции
Q8Когда следует использовать область видимости (user/session/agent)?
user: Предпочтения, которые применяются к пользователю глобально. session: Цели или контекст, действительные только для этого разговора. agent: Правила, специфичные для одного агента в мультиагентной системе. Правильное использование области сокращает длину промпта и улучшает согласованность ответов.
Основные концепции
Q9Что такое memory_types и почему они важны?
memory_type классифицирует память: fact (неизменная информация), preference (выбор пользователя), instruction (правила для следования), relationship (связи людей/организаций), experience (прошлые события). Это самая мощная ось для фильтрации, удаления и применения политик.
Основные концепции
Q10Как работают threshold и limit?
limit: Количество кандидатов памяти для извлечения (слишком низкий = пропустить релевантные, слишком высокий = шумный контекст). threshold: Порог сходства 0-1 (выше = строже). Начните с limit=10, threshold=0.7. Если не хватает памяти, понизьте threshold до 0.6 и увеличьте limit до 20. Если получаете нерелевантные результаты, повысьте threshold до 0.75-0.8.
Поиск и извлечение
Q11Почему мои результаты поиска нерелевантны?
Обычно это одно из: 1) смешанные пространства имён, 2) слишком много сохранённой памяти (шум), 3) слишком низкий threshold, 4) контент слишком абстрактный ('нравятся вещи' vs конкретные факты). Решение: разделите пространства имён, сделайте контент конкретным, повысьте threshold.
Поиск и извлечение
Q12Качество поиска упало по мере роста памяти. Что делать?
Добавьте оценку важности и сохраняйте только память высокой важности. Используйте TTL для автоматического истечения старой памяти. Периодически объединяйте похожую память в резюме. Разделяйте пространства имён для сокращения области поиска.
Поиск и извлечение
Q13Как мне использовать /api/extract?
Рекомендуемый процесс: 1) Вызвать с auto_store=false для предпросмотра извлечённой памяти. 2) Показать результаты пользователю для подтверждения. 3) Сохранить только одобренную память. 4) После подтверждения качества извлечения переключиться на auto_store=true для автоматизации.
Извлечение
Q14В чём разница между model=haiku и model=sonnet?
haiku: Быстрее, дешевле, хорош для большинства случаев. sonnet: Точнее, лучше для важных извлечений (онбординг, контракты, политики). Используйте haiku для массового/начального извлечения, sonnet для высокорисковых сценариев.
Извлечение
Q15Могу ли я изменить память после сохранения?
Да, но рекомендуемый паттерн: создать новую память + удалить/архивировать старую. Этот подход лучше для аудиторских следов и предотвращает регрессионные проблемы.
Операции
Q16Как удалить память?
Два подхода: 1) Удаление по ID (точно), 2) Удаление по пространству имён (массовая очистка). Для предприятия/соответствия обеспечьте 'полное удаление + журнал аудита'. Чётко документируйте свою политику удаления.
Операции
Q17Я получаю 429 Too Many Requests. Что делать?
Вы достигли лимита запросов. Решения: 1) Реализовать экспоненциальную задержку (1с -> 2с -> 4с). 2) Очередь запросов на стороне сервера. 3) Снизить частоту запросов: кэшировать повторные запросы, пакетные операции, снизить частоту извлечения.
Операции
Q18Как снизить расходы?
Главные драйверы расходов: 1) Частота извлечения — сократить вызовы. 2) Область поиска — использовать пространство имён для сужения. 3) Выбор модели — haiku для рутины, sonnet для важного. 4) Кэширование — кэшировать повторные запросы. 5) Пакетные операции, когда возможно.
Операции
Q19Могу ли я использовать API-ключ в браузере (фронтенд)?
Не рекомендуется — высокий риск утечки ключа. Вызывайте Seizn с вашего сервера (Next.js Route Handler, Cloudflare Worker, serverless-функция) и пусть браузер вызывает ваш сервер. Никогда не раскрывайте API-ключи клиентскому коду.
Безопасность и соответствие
Q20Какая документация нужна моей команде безопасности/юридической?
Им понадобится: 1) Область данных (что хранится/не хранится), 2) Шифрование (в покое: AES-256, в транзите: TLS), 3) Метод изоляции арендаторов, 4) Политика удаления/хранения, 5) Доступ к журналам аудита, 6) Политика ротации/истечения ключей. Поддерживайте страницу Безопасности и Управления в своей документации.
Безопасность и соответствие
Q21Что такое система памяти Graph-RAG?
Seizn использует архитектуру Graph-RAG, которая объединяет векторные эмбеддинги с отношениями графа знаний. Память хранится как узлы с типизированными рёбрами (relates_to, supports, contradicts и т.д.). Это позволяет: контекстный вызов через обход графа, автоматическое обнаружение сообществ для тематической кластеризации и временное отслеживание знаний с периодами действия.
Основные концепции
Q22Что такое система уровней памяти (Hot/Warm/Cold)?
Seizn автоматически организует память по уровням на основе использования: уровень Hot (частый доступ, хранится в быстром кэше), уровень Warm (периодический доступ, стандартное извлечение), уровень Cold (редко используется, архивирован, но доступен для поиска). Менеджер уровней автоматически повышает/понижает память на основе паттернов доступа, оптимизируя производительность и стоимость.
Основные концепции
Q23Как работает кросс-языковой поиск?
Seizn хранит как исходный контент, так и каноническое английское представление для каждой памяти. Поисковые запросы сопоставляются с обоими эмбеддингами, что позволяет сценарии вроде поиска на английском и нахождения памяти на хинди. Мы используем многоязычные модели эмбеддингов (BGE-M3, LaBSE), которые поддерживают 100+ языков с высоким кросс-языковым выравниванием.
Поиск и извлечение
Q24Какие языки поддерживаются для извлечения памяти?
Seizn поддерживает 35+ языков для извлечения и поиска памяти, включая: английский, китайский (упрощённый/традиционный), хинди, испанский, французский, немецкий, японский, корейский, русский, украинский, арабский и все основные индийские языки (тамильский, телугу, бенгальский и т.д.). Язык автоматически определяется с точностью 95%+.
Поиск и извлечение
Q25Что такое интеграция MCP и как её использовать?
MCP (Model Context Protocol) позволяет ИИ-ассистентам типа Claude Desktop напрямую получать доступ к памяти Seizn. Установите наш MCP-сервер (npx @seizn/mcp-server), добавьте его в конфигурацию Claude Desktop, и ассистент сможет автоматически сохранять и извлекать память во время разговоров. Это обеспечивает постоянную персонализацию между сессиями.
Начало работы
Q26Какие технологии лежат в основе системы памяти Seizn?
Seizn построен на: Next.js 16 с React Server Components, Supabase (PostgreSQL + pgvector для векторного поиска), модель Voyage AI voyage-3 (1024-мерные эмбеддинги), Claude для извлечения и анализа памяти. Мы используем HNSW индексы для векторного поиска менее 100мс, WebSocket подписки в реальном времени и Redis для кэширования.
Начало работы
Q27Как интегрировать Seizn в мой LLM-воркфлоу?
Три основных подхода: 1) REST API — прямые HTTP-вызовы для полного контроля, 2) SDK (TypeScript/Python) — типобезопасные обёртки с логикой повторов, 3) MCP-сервер — автоматическая интеграция с Claude Desktop и другими MCP-совместимыми ассистентами. Для продакшена мы рекомендуем SDK с серверными вызовами для защиты вашего API-ключа.
Операции
Q28Что такое Context API и как его использовать?
Context API (GET /api/context) возвращает предварительно отформатированную строку, готовую для вставки в ваш LLM-промпт. Она объединяет: профиль пользователя, недавнюю память, релевантные факты и контекст графа. Используйте format=brief (~500 токенов), detailed (~1500 токенов) или extended (~3000 токенов) в зависимости от вашего бюджета контекста.
Операции

Остались вопросы?

Ознакомьтесь с нашей документацией или свяжитесь с нашей командой поддержки.