Поширені запитання про Seizn Memory API, від початку роботи до розширених операцій.
Q1Що таке Seizn Memory і яку проблему він вирішує?
Seizn Memory — це інфраструктура пам'яті ШІ, яка забезпечує постійну пам'ять з можливістю пошуку для додатків ШІ. На відміну від векторних баз даних, які лише зберігають/шукають вектори, Seizn включає повний продуктовий рівень: витягування пам'яті, управління політиками, управління ключами, видалення, журнали аудиту та SDK. Він вирішує проблему підтримки контексту між сеансами ШІ та забезпечення персоналізованого досвіду ШІ.
Початок роботи
Q2Чим Seizn відрізняється від векторних баз даних, таких як Pinecone або Weaviate?
Векторні бази даних — це інфраструктура зберігання/пошуку для векторів. Seizn — це повноцінна система пам'яті, побудована поверх цього, що забезпечує: автоматичне витягування пам'яті з розмов, класифікацію типів пам'яті, управління просторами імен/областями видимості, ротацію API-ключів, журналювання аудиту, SDK та функції управління. Уявіть це як «інфраструктура пам'яті» проти «інфраструктури пошуку».
Початок роботи
Q3Чи потрібен мені RAG для використання Seizn?
Ні. Найпоширеніша відправна точка: зберегти пам'ять -> пошук -> вставити в промпт. RAG (автоматична композиція контексту + генерація відповіді) — наступний крок. Ви можете почати просто та додавати складність за потреби.
Початок роботи
Q4Який найшвидший спосіб створити PoC?
1) POST /api/memories для збереження користувацького налаштування. 2) GET /api/memories для пошуку. 3) Вставити результати в промпт LLM. 4) Пізніше додати /api/extract для автовитягування та /api/query для відповідей з розширеною пам'яттю.
Початок роботи
Q5Що мені слід зберігати в /api/memories?
Зберігайте інформацію, яка залишається дійсною між розмовами: налаштування (тон, мова, формат), факти (робота, інструменти, структура проєкту), інструкції ("завжди резюмувати в таблицях"), відносини ("Аліса — керівник команди"). Уникайте зберігання тимчасових або специфічних для сеансу даних, якщо не використовуєте область сеансу.
Основні концепції
Q6Які дані НЕ слід зберігати?
Ніколи не зберігайте: паролі, API-ключі, токени, сесійні куки (дані авторизації), номери соціального страхування, номери паспортів, банківські рахунки (PII), дані кредитних карток (платіжні дані). Для тимчасових даних використовуйте область сеансу з TTL, якщо потрібно.
Основні концепції
Q7Чому важливий простір імен?
Простір імен розділяє пам'ять за проєктами/орендарями/середовищами. Без нього дані змішуються, якість пошуку падає, а видалення/експорт стає болісним. Рекомендується: 'org:acme/app:chat/env:prod' або 'project:myapp/env:staging'. Ніколи не використовуйте просто 'default' у продакшені.
Основні концепції
Q8Коли слід використовувати область видимості (user/session/agent)?
user: Налаштування, які застосовуються до користувача глобально. session: Цілі або контекст, дійсні лише для цієї розмови. agent: Правила, специфічні для одного агента в мультиагентній системі. Правильне використання області скорочує довжину промпту та покращує узгодженість відповідей.
Основні концепції
Q9Що таке memory_types і чому вони важливі?
memory_type класифікує пам'ять: fact (незмінна інформація), preference (вибір користувача), instruction (правила для дотримання), relationship (зв'язки людей/організацій), experience (минулі події). Це найпотужніша вісь для фільтрації, видалення та застосування політик.
Основні концепції
Q10Як працюють threshold та limit?
limit: Кількість кандидатів пам'яті для отримання (занадто низький = пропустити релевантні, занадто високий = шумний контекст). threshold: Поріг схожості 0-1 (вище = суворіше). Почніть з limit=10, threshold=0.7. Якщо не вистачає пам'яті, знизьте threshold до 0.6 та збільште limit до 20. Якщо отримуєте нерелевантні результати, підвищіть threshold до 0.75-0.8.
Пошук та отримання
Q11Чому мої результати пошуку нерелевантні?
Зазвичай це одне з: 1) змішані простори імен, 2) занадто багато збереженої пам'яті (шум), 3) занадто низький threshold, 4) контент занадто абстрактний ('подобаються речі' vs конкретні факти). Рішення: розділіть простори імен, зробіть контент конкретним, підвищіть threshold.
Пошук та отримання
Q12Якість пошуку впала зі зростанням пам'яті. Що робити?
Додайте оцінку важливості та зберігайте лише пам'ять високої важливості. Використовуйте TTL для автоматичного закінчення терміну старої пам'яті. Періодично об'єднуйте схожу пам'ять у резюме. Розділяйте простори імен для скорочення області пошуку.
Пошук та отримання
Q13Як мені використовувати /api/extract?
Рекомендований процес: 1) Викликати з auto_store=false для попереднього перегляду витягнутої пам'яті. 2) Показати результати користувачу для підтвердження. 3) Зберегти лише схвалену пам'ять. 4) Після підтвердження якості витягування переключитися на auto_store=true для автоматизації.
Витягування
Q14У чому різниця між model=haiku та model=sonnet?
haiku: Швидший, дешевший, добрий для більшості випадків. sonnet: Точніший, кращий для важливих витягувань (онбординг, контракти, політики). Використовуйте haiku для масового/початкового витягування, sonnet для високоризикових сценаріїв.
Витягування
Q15Чи можу я змінити пам'ять після збереження?
Так, але рекомендований патерн: створити нову пам'ять + видалити/архівувати стару. Цей підхід кращий для аудиторських слідів та запобігає регресійним проблемам.
Операції
Q16Як видалити пам'ять?
Два підходи: 1) Видалення за ID (точно), 2) Видалення за простором імен (масове очищення). Для підприємства/відповідності забезпечте 'повне видалення + журнал аудиту'. Чітко документуйте свою політику видалення.
Операції
Q17Я отримую 429 Too Many Requests. Що робити?
Ви досягли ліміту запитів. Рішення: 1) Реалізувати експоненціальну затримку (1с -> 2с -> 4с). 2) Черга запитів на стороні сервера. 3) Знизити частоту запитів: кешувати повторні запити, пакетні операції, знизити частоту витягування.
Операції
Q18Як знизити витрати?
Головні драйвери витрат: 1) Частота витягування — скоротити виклики. 2) Область пошуку — використовувати простір імен для звуження. 3) Вибір моделі — haiku для рутини, sonnet для важливого. 4) Кешування — кешувати повторні запити. 5) Пакетні операції, коли можливо.
Операції
Q19Чи можу я використовувати API-ключ у браузері (фронтенд)?
Не рекомендується — високий ризик витоку ключа. Викликайте Seizn з вашого сервера (Next.js Route Handler, Cloudflare Worker, serverless-функція) і нехай браузер викликає ваш сервер. Ніколи не розкривайте API-ключі клієнтському коду.
Безпека та відповідність
Q20Яка документація потрібна моїй команді безпеки/юридичній?
Їм знадобиться: 1) Область даних (що зберігається/не зберігається), 2) Шифрування (у спокої: AES-256, в транзиті: TLS), 3) Метод ізоляції орендарів, 4) Політика видалення/зберігання, 5) Доступ до журналів аудиту, 6) Політика ротації/закінчення терміну ключів. Підтримуйте сторінку Безпеки та Управління у своїй документації.
Безпека та відповідність
Залишилися запитання?
Ознайомтеся з нашою документацією або зв'яжіться з нашою командою підтримки.