AI RAG Chatbot

Documentation

RAG Architecture로 블로그 문서를 이해하는 챗봇입니다.Redis Stack 및 캐시를 최적화하여 최소한의 리소스로 작동합니다.

Knowledge Base AI

블로그 콘텐츠 기반 RAG 챗봇

안녕하세요! 저는 hhkb 블로그의 AI 챗봇입니다. 궁금한 점을 물어보세요.

궁금한 점을 물어보세요...

Live Pipeline

Backend(Kotlin)의 실시간 처리 과정

1. Input Guard

Regex 탐지 및 Injection 필터링

2. Smart Routing

메타 질문/캐시 즉시 응답 (0ms)

3. Search (Redis)

Keyword + Vector Hybrid Search

4. Context Fusion

프롬프트 최적화 및 문서 결합

5. Spring AI

LLM Inference API Call

대기 중...

1GB Environment

경량화된 아키텍처로 낮은 사양에서도 고성능을 보장합니다.

Memory Usage~256MB
OS
Alpine
Runtime
JDK 21

Backend Stack

LanguageKotlin
Vector StoreRedis Stack
FrameworkSpring Boot 3.2

Latency Budget

Cache hit0-20ms
Hybrid search60-140ms
LLM generate1.2-2.4s

Token Budget

Context size~1.2k tokens
Top-K docs4
Max output512 tokens