메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

위성민 (세종대학교, 세종대학교 대학원)

지도교수
서재규
발행연도
2022
저작권
세종대학교 논문은 저작권에 의해 보호받습니다.

이용수25

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
Deep Neural Network(DNN) 기반 물체 검출은 다양한 분야에서 널리 사용되고 있는 중요한 연구 주제이다. 딥러닝 기반 물체 검출 방법은 우수한 검출 성능을 보인다는 장점을 가지는 반면, 막대한 많은 컴퓨팅 리소스를 필요로 하기 때문에 에지 컴퓨팅을 위한 임베디드 시스템에서 실시간으로 동작되기 어렵다는 한계를 갖는다. 이러한 한계를 극복하기 위해 DNN에 사용되는 네트워크를 간소화하고 고속화하는 많은 연구들이 진행되고 있다. 채널 가지치기는 Convolutional Neural Network(CNN)에서 사용되는 필터의 수를 감소시켜 네트워크를 간소화하고 고속화하는 방법이다. 채널 가지치기를 할 때 CNN에 포함된 잔차 구조를 중요하게 고려해야 하지만 이에 대한 연구가 많지 않은 상황이다. 더불어 대부분의 연구들이 PC에 장착된 GPU에서 수행되었기 때문에 실시간 에지 컴퓨팅을 위한 임베디드 시스템에서의 효과를 확인하기 어려운 상황이다. 따라서 본 논문은 실시간 에지 컴퓨팅을 위한 임베디드 시스템 상황에서 잔차 구조를 고려하여 효과적으로 채널 가지치기를 수행하는 방법을 제안한다. 잔차 구조를 고려한 5가지 채널 가지치기 방법을 임베디드 시스템에 적용하였으며, 이들 중 가장 효율적인 방법을 선택하는 과정을 수행하였다. 추가적으로 물체 검출기를 임베디드 시스템에서 효율적으로 동작 시키기 위해 post-training quantization(PTQ)과 quantization-aware training(QAT)를 통해 네트워크 양자화를 수행하였다. 마지막으로 입력 영상의 크기와 가지치기 비율의 적절한 조합을 검색하여 제한된 연산 조건에서 최적의 검출 성능을 보이도록 네트워크 최적화를 수행하였다. 제안된 물체 검출기 최적화 방법은 대표적인 1단계 물체 검출기인 YOLOv4에 적용되었으며, 최적화 결과는 Qualcomm QCS605 SoC의 DSP에 임베딩 되었다. 실험 결과, 제안된 방법을 통해 최적화 전과 유사한 검출 성능을 보이면서도 임베디드 시스템에서 영상 당 100ms 이하로 동작하는 실시간 에지 컴퓨팅에 사용 가능한 물체 검출기를 확보할 수 있음을 확인하였다.

목차

제 1장. 서론 1
제 2장. 관련 연구 4
2.1 물체 검출 4
2.2 네트워크 간소화 6
제 3장. 검출기 8
제 4장. 가지치기 11
4.1 배치 정규화 계층과 희소성 학습 11
4.2 잔차 구조를 고려한 채널 가지치기 13
4.2.1 SKIP 방법 16
4.2.2 Head-First 방법 17
4.2.3 OR 방법 19
4.2.4 Slice and Concatenation 방법 20
4.2.5 Gather 방법 21
4.2.6 Concatenaton-Convolution 방법 23
4.3 미세조정 학습 25
제 5장. 배치 정규화 접힘 26
제 6장. 양자화 28
6.1 Post-Training Quantization 28
6.2 Quantization-Aware Training 28
제 7장. 입력 영상 크기와 가지치기 비율 30
제 8장. 임베딩 31
제 9장. 실험 34
9.1 실험 환경 34
9.2 데이터셋 35
9.2.1 Visdrone2019-Det 35
9.2.2 Surveillance Camera Object Detection 37
9.3 검출 성능 평가지표 39
9.4 양자화 실험 41
9.5 가지치기 실험 42
9.5.1 희소성 학습 실험 42
9.5.2 잔차 구조를 고려한 채널 가지치기 45
9.6 입력 영상 크기와 가지치기 비율에 따른 검출 성능 50
제 10장. 결론 52
참고문헌 53
Abstract 60

최근 본 자료

전체보기

댓글(0)

0