Question 1

Що таке Seizn Memory і яку проблему він вирішує?

Accepted Answer

Seizn Memory — це інфраструктура пам'яті ШІ, яка забезпечує постійну пам'ять з можливістю пошуку для додатків ШІ. На відміну від векторних баз даних, які лише зберігають/шукають вектори, Seizn включає повний продуктовий рівень: витягування пам'яті, управління політиками, управління ключами, видалення, журнали аудиту та SDK. Він вирішує проблему підтримки контексту між сеансами ШІ та забезпечення персоналізованого досвіду ШІ.

Question 2

Чим Seizn відрізняється від векторних баз даних, таких як Pinecone або Weaviate?

Accepted Answer

Векторні бази даних — це інфраструктура зберігання/пошуку для векторів. Seizn — це повноцінна система пам'яті, побудована поверх цього, що забезпечує: автоматичне витягування пам'яті з розмов, класифікацію типів пам'яті, управління просторами імен/областями видимості, ротацію API-ключів, журналювання аудиту, SDK та функції управління. Уявіть це як «інфраструктура пам'яті» проти «інфраструктури пошуку».

Question 3

Чи потрібен мені RAG для використання Seizn?

Accepted Answer

Ні. Найпоширеніша відправна точка: зберегти пам'ять -> пошук -> вставити в промпт. RAG (автоматична композиція контексту + генерація відповіді) — наступний крок. Ви можете почати просто та додавати складність за потреби.

Question 4

Який найшвидший спосіб створити PoC?

Accepted Answer

1) POST /api/memories для збереження користувацького налаштування. 2) GET /api/memories для пошуку. 3) Вставити результати в промпт LLM. 4) Пізніше додати /api/extract для автовитягування та /api/query для відповідей з розширеною пам'яттю.

Question 5

Що мені слід зберігати в /api/memories?

Accepted Answer

Зберігайте інформацію, яка залишається дійсною між розмовами: налаштування (тон, мова, формат), факти (робота, інструменти, структура проєкту), інструкції ("завжди резюмувати в таблицях"), відносини ("Аліса — керівник команди"). Уникайте зберігання тимчасових або специфічних для сеансу даних, якщо не використовуєте область сеансу.

Question 6

Які дані НЕ слід зберігати?

Accepted Answer

Ніколи не зберігайте: паролі, API-ключі, токени, сесійні куки (дані авторизації), номери соціального страхування, номери паспортів, банківські рахунки (PII), дані кредитних карток (платіжні дані). Для тимчасових даних використовуйте область сеансу з TTL, якщо потрібно.

Question 7

Чому важливий простір імен?

Accepted Answer

Простір імен розділяє пам'ять за проєктами/орендарями/середовищами. Без нього дані змішуються, якість пошуку падає, а видалення/експорт стає болісним. Рекомендується: 'org:acme/app:chat/env:prod' або 'project:myapp/env:staging'. Ніколи не використовуйте просто 'default' у продакшені.

Question 8

Коли слід використовувати область видимості (user/session/agent)?

Accepted Answer

user: Налаштування, які застосовуються до користувача глобально. session: Цілі або контекст, дійсні лише для цієї розмови. agent: Правила, специфічні для одного агента в мультиагентній системі. Правильне використання області скорочує довжину промпту та покращує узгодженість відповідей.

Question 9

Що таке memory_types і чому вони важливі?

Accepted Answer

memory_type класифікує пам'ять: fact (незмінна інформація), preference (вибір користувача), instruction (правила для дотримання), relationship (зв'язки людей/організацій), experience (минулі події). Це найпотужніша вісь для фільтрації, видалення та застосування політик.

Question 10

Як працюють threshold та limit?

Accepted Answer

limit: Кількість кандидатів пам'яті для отримання (занадто низький = пропустити релевантні, занадто високий = шумний контекст). threshold: Поріг схожості 0-1 (вище = суворіше). Почніть з limit=10, threshold=0.7. Якщо не вистачає пам'яті, знизьте threshold до 0.6 та збільште limit до 20. Якщо отримуєте нерелевантні результати, підвищіть threshold до 0.75-0.8.

Question 11

Чому мої результати пошуку нерелевантні?

Accepted Answer

Зазвичай це одне з: 1) змішані простори імен, 2) занадто багато збереженої пам'яті (шум), 3) занадто низький threshold, 4) контент занадто абстрактний ('подобаються речі' vs конкретні факти). Рішення: розділіть простори імен, зробіть контент конкретним, підвищіть threshold.

Question 12

Якість пошуку впала зі зростанням пам'яті. Що робити?

Accepted Answer

Додайте оцінку важливості та зберігайте лише пам'ять високої важливості. Використовуйте TTL для автоматичного закінчення терміну старої пам'яті. Періодично об'єднуйте схожу пам'ять у резюме. Розділяйте простори імен для скорочення області пошуку.

Question 13

Як мені використовувати /api/extract?

Accepted Answer

Рекомендований процес: 1) Викликати з auto_store=false для попереднього перегляду витягнутої пам'яті. 2) Показати результати користувачу для підтвердження. 3) Зберегти лише схвалену пам'ять. 4) Після підтвердження якості витягування переключитися на auto_store=true для автоматизації.

Question 14

У чому різниця між model=haiku та model=sonnet?

Accepted Answer

haiku: Швидший, дешевший, добрий для більшості випадків. sonnet: Точніший, кращий для важливих витягувань (онбординг, контракти, політики). Використовуйте haiku для масового/початкового витягування, sonnet для високоризикових сценаріїв.

Question 15

Чи можу я змінити пам'ять після збереження?

Accepted Answer

Так, але рекомендований патерн: створити нову пам'ять + видалити/архівувати стару. Цей підхід кращий для аудиторських слідів та запобігає регресійним проблемам.

Question 16

Як видалити пам'ять?

Accepted Answer

Два підходи: 1) Видалення за ID (точно), 2) Видалення за простором імен (масове очищення). Для підприємства/відповідності забезпечте 'повне видалення + журнал аудиту'. Чітко документуйте свою політику видалення.

Question 17

Я отримую 429 Too Many Requests. Що робити?

Accepted Answer

Ви досягли ліміту запитів. Рішення: 1) Реалізувати експоненціальну затримку (1с -> 2с -> 4с). 2) Черга запитів на стороні сервера. 3) Знизити частоту запитів: кешувати повторні запити, пакетні операції, знизити частоту витягування.

Question 18

Як знизити витрати?

Accepted Answer

Головні драйвери витрат: 1) Частота витягування — скоротити виклики. 2) Область пошуку — використовувати простір імен для звуження. 3) Вибір моделі — haiku для рутини, sonnet для важливого. 4) Кешування — кешувати повторні запити. 5) Пакетні операції, коли можливо.

Question 19

Чи можу я використовувати API-ключ у браузері (фронтенд)?

Accepted Answer

Не рекомендується — високий ризик витоку ключа. Викликайте Seizn з вашого сервера (Next.js Route Handler, Cloudflare Worker, serverless-функція) і нехай браузер викликає ваш сервер. Ніколи не розкривайте API-ключі клієнтському коду.

Question 20

Яка документація потрібна моїй команді безпеки/юридичній?

Accepted Answer

Їм знадобиться: 1) Область даних (що зберігається/не зберігається), 2) Шифрування (у спокої: AES-256, в транзиті: TLS), 3) Метод ізоляції орендарів, 4) Політика видалення/зберігання, 5) Доступ до журналів аудиту, 6) Політика ротації/закінчення терміну ключів. Підтримуйте сторінку Безпеки та Управління у своїй документації.

Часті запитання

Залишилися запитання?