Drop-in-Retriever für LangChain RAG-Pipelines mit vollständiger Tracing-Unterstützung.
SeiznRetriever ist ein Drop-in-Ersatz für jeden LangChain-Retriever. Er bietet Vektorsuche mit integriertem Tracing, Caching und Reranking.
Installieren Sie das Seizn SDK zusammen mit LangChain.
# TypeScript / JavaScript
npm install seizn @langchain/core
# Python
pip install seizn langchainErstellen Sie eine RAG-Chain mit SeiznRetriever in nur wenigen Zeilen Code.
import { SeiznRetriever } from 'seizn/langchain';
import { ChatOpenAI } from '@langchain/openai';
import { createRetrievalChain } from 'langchain/chains/retrieval';
import { createStuffDocumentsChain } from 'langchain/chains/combine_documents';
import { ChatPromptTemplate } from '@langchain/core/prompts';
// Initialize the Seizn retriever
const retriever = new SeiznRetriever({
apiKey: process.env.SEIZN_API_KEY,
dataset: 'my-docs',
topK: 5,
threshold: 0.7,
});
// Create a RAG chain
const llm = new ChatOpenAI({ model: 'gpt-4' });
const prompt = ChatPromptTemplate.fromTemplate(`
Answer the question based on the following context:
{context}
Question: {input}
`);
const documentChain = await createStuffDocumentsChain({ llm, prompt });
const retrievalChain = await createRetrievalChain({
combineDocsChain: documentChain,
retriever,
});
// Run the chain
const response = await retrievalChain.invoke({
input: 'How do I configure rate limiting?',
});
console.log(response.answer);
// Trace ID available for debugging
console.log('Trace:', response.seiznTrace);import os
from seizn.langchain import SeiznRetriever
from langchain_openai import ChatOpenAI
from langchain.chains import create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate
# Initialize the Seizn retriever
retriever = SeiznRetriever(
api_key=os.environ["SEIZN_API_KEY"],
dataset="my-docs",
top_k=5,
threshold=0.7,
)
# Create a RAG chain
llm = ChatOpenAI(model="gpt-4")
prompt = ChatPromptTemplate.from_template("""
Answer the question based on the following context:
{context}
Question: {input}
""")
document_chain = create_stuff_documents_chain(llm, prompt)
retrieval_chain = create_retrieval_chain(retriever, document_chain)
# Run the chain
response = retrieval_chain.invoke({
"input": "How do I configure rate limiting?"
})
print(response["answer"])
# Trace ID available for debugging
print("Trace:", response.get("seizn_trace"))Reduzieren Sie Latenz und Kosten durch Caching wiederholter Abfragen.
const retriever = new SeiznRetriever({
apiKey: process.env.SEIZN_API_KEY,
dataset: 'my-docs',
cache: {
enabled: true,
ttl: 3600, // 1 hour
},
});Verbessern Sie die Ergebnisqualität mit Cross-Encoder-Reranking.
const retriever = new SeiznRetriever({
apiKey: process.env.SEIZN_API_KEY,
dataset: 'my-docs',
rerank: {
enabled: true,
model: 'cohere-rerank-v3',
topN: 3,
},
});Filtern Sie Ergebnisse nach Metadatenfeldern vor der Vektorsuche.
const retriever = new SeiznRetriever({
apiKey: process.env.SEIZN_API_KEY,
dataset: 'my-docs',
filter: {
category: 'api-docs',
language: 'en',
},
});| Fehler | Ursache | Lösung |
|---|---|---|
SEIZN_AUTH_ERROR | Ungültiger oder fehlender API-Schlüssel | Prüfen Sie die Umgebungsvariable SEIZN_API_KEY |
SEIZN_RATE_LIMIT | Zu viele Anfragen pro Sekunde | Implementieren Sie exponentielles Backoff oder upgraden Sie Ihren Plan |
Empty results | Schwellenwert zu hoch oder keine passenden Dokumente | Schwellenwert senken oder Dataset-Inhalte prüfen |