노느 (NONEU)

교통사고 과실비율 산정 AI - 법률 도메인 특화 RAG 챗봇

RAGFine-tuningLangGraphDjangoVector DBKo-Llama3

프로젝트 정체성

서비스 정의

교통사고 법률 판례 손해보험협회 데이터를 기반으로 사고 과실 비율을 정밀 산정하는 법률 특화 AI 챗봇

개발 여정

  • 1차: 실시간 데이터 수집 및 RAG 기초 설계, 파인튜닝을 통한 모델 최적화
  • 2차: Django 기반 서비스화 및 고도화된 Self-Query Retrieval 적용

핵심 역량 1: 법률 특화 RAG 파이프라인 및 데이터 엔지니어링

도메인 데이터 정제

PDF 형식의 복잡한 교통사고 법률 문서를 직접 분석하여, AI 학습 및 검색에 최적화된 JSON 구조로 데이터 정제(Cleaning) 및 스키마 설계

고도화된 검색 전략 (Self-Query Retrieval)

단순 벡터 유사도 검색의 한계를 극복하기 위해, 사용자의 질문에서 메타데이터(사건번호, 법원, 조문 등)를 추출하여 정확도를 극대화한 셀프 리트리버 구현

벡터 DB 구축

전처리된 데이터를 바탕으로 효율적인 임베딩 및 벡터 DB(ChromaDB/QDrant)를 구축하여 고속 검색 환경 마련

핵심 역량 2: LLM 파인튜닝 및 에이전트 설계

질의 목적 분류 모델 튜닝

사용자의 발화 의도(상담, 판례 검색, 법률 해석 등)를 정확히 구분하기 위해 Ko-Llama3 (saltlux/Ko-Llama3-Luxia-8B) 모델을 파인튜닝(PEFT/LoRA)하여 에이전트의 판단 정확도 개선

멀티 에이전트 워크플로우

파인튜닝된 모델을 LangGraph의 핵심 노드로 배치하여, 질문 의도에 따라 최적의 답변 경로를 결정하는 지능형 에이전트 구조 설계

핵심 역량 3: 빠른 프로토타이핑 및 Django 기반 서비스화

Rapid Prototyping

개발 초기 단계에서 Streamlit과 Gradio를 적극 활용하여 핵심 AI 로직을 빠르게 검증하고 피드백 반영

서비스 인프라 구축

최종 단계에서 Django 프레임워크를 도입하여 사용자 인증(로그인/회원가입), 세션 관리, DB(MySQL/RDS) 연동을 포함한 실제 서비스 수준의 백엔드 아키텍처 구현

기술적 도전 및 성과

데이터 정확도

법률 용어의 특수성을 고려한 전처리 기법으로 RAG 답변의 법적 근거 일치율 대폭 향상

성능 최적화

파인튜닝 모델 도입 후 단순 프롬프트 엔지니어링 대비 의도 분류 정확도 30% 이상 개선