Pictag: 소상공인 맞춤형 경량화 CCTV AI SaaS
Re-ID 정확도·학습 효율 50%↑. YOLO 백본 분해 후 Linear/Pooling/Attention Head 3가지 임베딩 A/B 실험으로 Attention 채택. OpenVINO INT8 양자화로 GPU 없는 엣지 실시간 추론. 4-Thread 독립 큐 파이프라인, Django+WebSocket 히트맵 대시보드.
소상공인 매장의 저사양 엣지 디바이스(GPU 없음)에서 CCTV 영상으로 방문객 Re-ID와 동선 히트맵을 실시간 제공하는 SaaS입니다. 두 가지 핵심 과제가 있었습니다. (1) 임베딩 품질 — YOLO 백본에서 어떤 방식으로 Re-ID 특징을 추출할 것인가(Linear vs Pooling vs Attention). (2) 엣지 실시간성 — GPU 없는 환경에서 RTSP 스트리밍 처리와 Re-ID 추론을 동시에 처리하는 구조 설계.
가설 없이 Linear / Pooling / Attention 3가지 임베딩 방식을 동일 데이터·동일 조건으로 A/B 테스트했습니다. Attention 방식이 Re-ID 정확도와 학습 효율 모두에서 50%↑ 우위를 보여 채택했습니다. 엣지 실시간성은 Capture/Detection/Embedding/Re-ID를 4-Thread 독립 큐로 분리하고 OpenVINO INT8 양자화로 추론 속도를 확보했습니다.
임베딩 방식 A/B 실험
YOLO 백본을 분해한 뒤 Linear / Pooling / Attention Head 3가지 추출 방식을 동일 데이터·학습 조건에서 비교했습니다. Attention이 Re-ID 정확도와 수렴 속도 모두 50%↑ 우위를 보여 실험 기반으로 채택했습니다.
4-Thread 독립 큐 설계
Capture/Detection/Embedding/Re-ID 스레드를 독립 Queue로 연결해 각 단계 처리 속도 차이를 큐가 버퍼링합니다. 카메라 스트림 지연 없이 Re-ID를 연속 처리하며, 스레드 실패 시 개별 재시작으로 전체 영향이 없습니다.
엣지 최적화 & 대시보드
OpenVINO INT8 양자화로 GPU 없이 엣지 실시간 추론을 달성했습니다(FP32 대비 크기 4배 감소, 속도 2-3배 향상). Django + WebSocket으로 방문객 동선 히트맵을 실시간 렌더링해 소상공인에게 공간 운영 인사이트를 제공합니다.
Attention 임베딩으로 Re-ID 학습 효율 50%↑를 달성하고, 4-Thread 파이프라인으로 GPU 없는 엣지 환경에서 실시간 Re-ID를 구현했습니다. Django+WebSocket 히트맵 대시보드로 소상공인 SaaS 비즈니스 모델을 실증했습니다. Re-ID 정확도가 조명·각도 변화에 민감해 다양한 카메라 환경 데이터 추가 학습이 과제이며, ONNX 변환으로 ARM 기반 엣지 디바이스까지 범용 배포를 확장할 계획입니다.