노느 (NONEU)

교통사고 과실비율 산정 AI - 법률 도메인 특화 RAG 챗봇

RAGFine-tuningLangGraphDjangoVector DBKo-Llama3

프로젝트 정체성

교통사고 법률 판례 및 손해보험협회 데이터를 기반으로 사고 과실 비율을 정밀 산정하는 법률 특화 AI 챗봇

PDF 형식의 복잡한 교통사고 법률 문서를 직접 분석하여, AI 학습 및 검색에 최적화된 JSON 구조로 데이터 정제(Cleaning) 및 스키마 설계

단순 벡터 유사도 검색의 한계를 극복하기 위해, 사용자의 질문에서 메타데이터(사건번호, 법원, 조문 등)를 추출하여 정확도를 극대화한 셀프 리트리버 구현

전처리된 데이터를 바탕으로 효율적인 임베딩 및 벡터 DB(ChromaDB/QDrant)를 구축하여 고속 검색 환경 마련

사용자의 발화 의도(상담, 판례 검색, 법률 해석 등)를 정확히 구분하기 위해 Ko-Llama3 (saltlux/Ko-Llama3-Luxia-8B) 모델을 파인튜닝(PEFT/LoRA)하여 에이전트의 판단 정확도 개선

파인튜닝된 모델을 LangGraph의 핵심 노드로 배치하여, 질문 의도에 따라 최적의 답변 경로를 결정하는 지능형 에이전트 구조 설계

개발 초기 단계에서 Streamlit과 Gradio를 적극 활용하여 핵심 AI 로직을 빠르게 검증하고 피드백 반영

최종 단계에서 Django 프레임워크를 도입하여 사용자 인증(로그인/회원가입), 세션 관리, DB(MySQL/RDS) 연동을 포함한 실제 서비스 수준의 백엔드 아키텍처 구현

법률 용어의 특수성을 고려한 전처리 기법으로 RAG 답변의 법적 근거 일치율 대폭 향상

파인튜닝 모델 도입 후 단순 프롬프트 엔지니어링 대비 의도 분류 정확도 30% 이상 개선