Search

OCR 정확성 이슈

Created
2021/04/21 14:06

l OCR 정말 정확한가요?

요약 OCR의 정확성에 따라 세부 기획이 크게 바뀌므로, 이를 확인하기 위해 개발팀에게 테스트 요청
기획팀에서 고민하는 부분
'OCR의 정확성이 믿을 만하다'라고 생각하고 기획을 했는데, 뒤늦게 정확성이 매우 낮음이 밝혀지면 기획을 아예 갈아엎어야 함
기획팀 요청사항
OCR의 정확성을 신뢰하기 위해, 간단한 OCR 테스트를 해달라
간이 테스트 제안
1.
'분석할 MTS의 스크린샷' + '해당 스크린샷에서 추출하고 싶은 데이터 리스트' 전달
2.
이를 바탕으로 간단히 OCR 코드를 짜고 실행해서, 정확성을 판단해달라

l OCR 정확성은 신뢰 가능합니다

요약 1. OCR의 정확성은 매우 높을 것 → 기획팀에서 'OCR 정확성은 신뢰 가능하다'라 생각하고 기획 진행 + 별도 간이 테스트 X 2. 모든 MTS에 OCR이 대응하기 어려우므로, 일부 MTS만 대응
개발팀의 입장
1.
OCR의 정확성은 충분히 수용 가능할 만큼 높다
OCR은 100% 정확성을 보이긴 불가능하다. 하지만, 95%의 정확도 보일 것이다
윤지님은 원래 이미지 분석 쪽을 공부했으며, 따라서 OCR도 잘 소화할 수 있다
MTS의 스크린샷을 업로드 하는 거라, 정확성이 더 크다
스크린샷 업로드가 왜 더 정확성이 높은지는, 카드사와 비교를 통해 설명
1.
카드사
카드를 사진으로 찍어서, 주민번호, 월/년도 등의 텍스트를 추출함
이 때, 오류가 발생하는 데 가장 큰 이유는 직접 화면을 촬영하기 때문임
(ex) 카드를 찍었는데 조명이 어둡다 or 너무 밝다 → 오류 발생!
2.
SOSA
촬영이 아니라, 스크린샷을 업로드 → 조명 등의 영향 없음 → 오류가 발생할 확률이 적음
2.
OCR 간이 테스트도 리소스가 너무 많이 든다.
실제 OCR 코드를 짜려면 딥러닝 등 많은 리소스가 듬
간단한 테스트를 위해 최소한의 리소스로 만든 OCR은, 실제 OCR과 차이가 클 것
→ 따라서, 간이 테스토로 OCR의 정확성을 검증하기 어려움
OCR 개발 공수 관련
물론 OCR의 정확성이 높지만, 모든 MTS에 대응하기는 어려움
따라서, 일부 MTS만 대응