BIM 칼럼니스트 강태욱의 이슈 & 토크
딥러닝 기술은 이미 우리 생활 속에 다양한 방식으로 응용되고 있다. 특히 비전 분야는 딥러닝 기술로 인해 눈부시게 발전하고 있어 많은 놀라운 응용 사례가 나올 것이라 예상하고 있다. 비전이 지능화되고 정확한 정보를 자동으로 추출할 수 있다면 수많은 수작업 데이터 입력과 확인 작업이 간소화될 수 있다. BIM(Building Information Modeling)과 같이 정보 모델링을 위해 많은 수작업이 필요한 분야도 예외가 아니다.
이번 호에서는 딥러닝 중 YOLO(You only Look Once) 기술을 이용한 이용한 도로 표지판 객체 훈련 및 인식 방법을 소개한다.
■ 강태욱 | 공학박사, 한국건설기술연구원 수석연구원, 한국BIM학회 교육위원회 간사로 활동 중이다. 건설 공학과 소프트웨어 공학을 전공하였으며, 세상을 연구하고 근본 원리를 성찰하기를 좋아하며, 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 최근에는 VDC, BIM, GIS 및 O&M, 3D 역설계 등 관련 연구를 하고 있다.
이메일 | laputa99999@gmail.com
이 글은 아래 참고문헌을 참고하였다.
■ YOLO : Real-Time Object Detection
■ Start Training YOLO with Our Own Data
비전과 관련된 영상인식 딥러닝 방법은 SSD(Single Shot Detector) 등 다양한 종류가 있다. 이 중 YOLO는 매우 빠른 속도로 객체를 인식하는 것에 특화된 딥러닝 모델이다.
그림 1. YOLO의 빠른 객체 인식 성능(YOLO : Real-Time Object Detection)
참고로 다크넷(Darknet) 플랫폼에서 실행되는 YOLO는 웹캠(Webcam)의 실시간 영상에서 객체를 인식할 만큼 매우 빠르다.
그림 2. 웹캠을 이용한 YOLO 실시간 영상 객체 추출 예
YOLO는 신속한 객체 인식을 위해 이미지를 한번에 스캔하는 방식으로 객체들을 인식한다. YOLO는 뉴럴네트워크 프레임워크인 다크넷을 기반으로 동작한다. 다크넷과 YOLO는 오픈소스이기 때문에 웹캠과 GPU가 장착된 컴퓨터만 있으면 누구나 공개된 소스를 다운로드 받아 컴파일해서 실행할 수 있고, 우리 주변 사물을 실시간으로 인식할 수 있다.
YOLO를 이용해 표지판 데이터를 훈련하고 실시간 영상을 통해 표지판 객체를 추출하기 위해 다양한 색상, 재질, 모양의 양보 및 멈춤 표지 이미지와 라벨 데이터를 준비해야 한다. 그리고 이 데이터를 다크넷 포맷으로 변환하고 학습해야 한다.
딥러닝 학습을 위해서는 학습 모델뿐 아니라 학습이 되는 컴퓨터 성능도 중요하다. 학습 시 수많은 수학 행렬 및 해 탐색 알고리즘이 수행된다. 수학적 계산을 위해 보통 GPU(Graphics Process Unit)을 지원하는 엔비디아(NVIDIA) 그래픽 카드를 이용하거나 딥러닝 전용으로 개발된 보드를 이용한다. 엔비디아의 젯슨 TX(Jetson TX) 시리즈는 이런 목적에서 개발된 것이다.