메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
김혜미 (한국전자통신연구원) 김정현 (한국전자통신연구원) 박지현 (한국전자통신연구원)
저널정보
한국HCI학회 한국HCI학회 학술대회 PROCEEDINGS OF HCI KOREA 2019 학술대회 발표 논문집
발행연도
2019.2
수록면
1,158 - 1,161 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
음악 식별을 위해 사용되는 기존의 음악 핑거프린팅 기술은 잡음이 거의 없는 전경음 식별을 목적으로 개발되었기 때문에, 드라마에서 배우가 대사를 하는 장면에 삽입된 배경 음악을 식별함에 있어서는 그 성능이 매우 낮다. 본 연구는 음악과 대사가 혼재한 상황에서 영역 분할 기법인 U-Net 방법을 적용하여 대사와 음악을 분리함으로써 드라마나 예능 등 방송물에 삽입된 배경 음악의 식별 성능을 높이고자 한다. 학습데이터셋을 생성하기 위하여 한국에서 방송되는 다양한 장르의 방송물로부터 배경 음악이 포함되지 않는 순수대사 구간 정보를 태깅하고 해당 오디오를 추출하여 방송 대사 데이터셋을 생성하였다. 대사와 혼합할 음악데이터셋으로 다양한 장르가 포함된 9100 여 곡의 대중가요를 선별하였고, 이 중 약 40%의 곡을 학습과 검증에 사용하였다. 식별을 위한 데이터베이스 생성시에는 음악 데이터셋 내 9100 여 곡을 모두 사용하였다. 학습 데이터셋을 생성하기 위하여 음악과 대사를 혼합할 때, 방송물과 유사하도록 음악 소리의 크기를 대사보다 작게 혼합하였다. 음원 분리 네트워크의 입력 스펙트로그램 크기를 변화시키면서 식별 성능을 비교한 결과 음원 분리를 적용한 음원의 음악 식별 성능이 향상되었다.

목차

요약문
1. 서론
2. 음원 분리 기반 음악 식별
3. 실험
4. 결론
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0