메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

윤기무 (인천대학교, 인천대학교 대학원)

지도교수
김우일
발행연도
2020
저작권
인천대학교 논문은 저작권에 의해 보호받습니다.

이용수6

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
최근 인공지능 분야가 주목받으면서 컴퓨터와 보다 자연스러운 대화를 원하는 사용자들이 늘고 있으며, 그에 따라 음성 인식과 관련한 다양한 연구가 진행되고 있다. 활발한 연구가 진행되면서 다양한 기법들이 음성 인식 분야에 적용되었는데 그 중에서도 인공지능 분야의 선두를 맡고 있는 심층 신경망 기반의 기법들이 음성 인식 분야에 적용되면서 음성 인식 성능을 크게 향상시켰다. 그럼에도 불구하고 아직 사용자들이 기대하는 성능에는 미치지 못하고 있는데, 이는 실제 사용 환경에서 발생하는 잡음이 음성 인식기의 성능을 저하시키기 때문이다. 그렇기 때문에 잡음 환경에 강인한 음성 인식기가 필수적으로 필요하다. 본 논문에서는 이러한 문제에 초점을 맞춰 잡음 환경에서의 음성 인식을 주제로한 연구를 소개하고자 한다.
높은 성능을 가진 음성 인식기를 구현하기 위해서 심층 신경망 기반의 음성 인식 모델이 많이 사용된다. 그런데 심층 신경망 기반의 모델을 사용하면 요구되는 연산량이 많아 그래픽 처리 장치(Graphic Process Unit, GPU)를 사용하게 된다. 많은 경우에 서버에 GPU를 설치하고 단말기에서 음성 파일만을 서버로 전송하는 방식으로 음성 인식기를 구현한다. 실시간으로 발생하는 모든 음성 데이터를 입력으로 받아 명령어를 판단하기에는 서버에 걸리는 부하가 너무 커지게 된다. 따라서, 현재 상용화된 음성 인식기들은 사용자가 입력을 필요로 할 때에만 음성 인식기를 대기모드에서 동작모드로 전환하여 사용하는 방식으로 되어있다. 이 때 대기모드에서 동작모드로 전환시키기 위해 발화하는 짧은 길이의 단어를 키워드 (keyword) 혹은 기동어라고 한다. 본 논문에서는 다양한 종류의 음성 중에서도 키워드 음성을 인식하는 것에 초점을 맞춰 연구 내용을 소개한다.
본 논문에서는 음성 인식을 위해 사용되는 다양한 기법들을 소개하고 키워드 인식 시스템 구성 방법을 제안한다. 또한, 잡음 환경에서 성능 저하를 막기 위해 적용 가능한 기법들 중 데이터 증강 기법을 중심으로 소개하며, 잡음 환경에서의 키워드 음성 인식 성능을 평가한다. 최종적으로 실시간으로 잡음 환경에서 키워드 음성을 인식하기 위한 시스템을 구현하고 제작 방법을 소개한다.

목차

목 차
국문초록……………………………………………………………………………………i
목 차…………………………………………………………………………………… iii
표 목 차…………………………………………………………………………………… v
그림목차……………………………………………………………………………………vi
제 1 장 서 론
1.1연구배경 1
1.2 관련 연구동향 3
1.3 연구목적 4
1.4 논문의 구성 5
제 2 장 음성 인식 개요
2.1 음성 특징 추출 6
2.2 음향 모델 11
2.3 GMM-HMM 기반의 음향 모델의 인식 과정 15
2.4 심층 신경망 기반의 음향 모델 19
제 3 장 잡음 환경에서의 성능 향상을 위한 데이터 증강
3.1 데이터 증강 기법 26
3.2잡음 합성을 이용한 잡음 환경 데이터 증강 27
3.3 Room Impulse Response 필터를 활용한 원거리 환경 데이터 증강 29
3.4심층 신경망 기반의 데이터 증강 기법 30
제 4 장 음성 키워드 인식
4.1 HMM score를 활용한 특징 벡터 44
4.2 인식 성능 향상을 위한 선형 판별 분석법 47
4.3실시간 키워드 인식 시스템 50
4.4 사용자 정의 키워드 인식 58
제 5 장 실험 과정 및 실험 결과
5.1 키워드 인식 성능 평가 실험 60
5.2 사용자 정의 키워드 인식 실험 67
5.3 심층 신경망 기반의 데이터 증강 기법 성능 평가 실험 72
제 6 장 결론 80
참고문헌 81
ABSTRACT 84

최근 본 자료

전체보기

댓글(0)

0