제조업 데이터 라벨링, 분류 및 시각화
2025. 4. 27.

1. 프로젝트 목적
목적: 제조 생산품 공정 데이터를 Embedding 기반으로 시각화하고 자동 라벨링을 통해 품질 문제 유형 분석
배경: 데이터는 많지만 패턴이 유사하여 수작업 라벨링 어려움, 문제 데이터가 흐릿하게 분포됨
2. 사용한 데이터 정의
포맷: 센서 로그 (CSV), 시각화 이미지 (PNG), 임베딩 벡터 (JSON)
개수: 총 200,000건 이상 (다양한 공정 라벨 포함)
수집 방법: MES 시스템에서 추출된 제조 생산품 검사 및 제조 로그
가공 방법: AutoEncoder 기반 임베딩 생성, TSNE/UMAP으로 시각화 및 군집화
학습 방법: 군집 라벨링 후 Transformer + Triplet Loss 기반 fine-tuning
데이터 이미지: Embedding Viewer를 통한 군집별 대표 데이터 시각화