Music Genre Classification Using CDBN

Spectrogram Feature (linguistics)
DOI: 10.5391/jkiis.2017.27.3.187 Publication Date: 2017-08-21T06:43:55Z
ABSTRACT
본 논문에서는 속성 학습(Feature Learning) 모델 중 CDBN(Convolutional Deep Belief) 모델을 사용하여 음악 장르를 분류하는 방법을 제안한다. 제안하는 방법은 크게 전처리와 CDBN 훈련, 분류기 훈련 및 다수결 투표로 구성된다. 전처리 과정에서는 가공되지 않은 데이터에서 멜 스펙트로그램(mel-spectrogram)을 추출한 뒤, ZCA 백색화(whitening)을 적용하여 멜스펙트로그램의 주파수 상호간 연관성을 제거한 저 수준 속성을 얻는다. 다음으로 해당 입력으로 계층적으로 고 수준의 추출할 수 있도록 커널을 훈련시킨다. 마지막으로 일정 시간 단위로 샘플링 한 훈련된 CDBN에 주어 얻을 있는 인공신경망 분류기를 학습시키고, 분류 결과의 투표를 통해 데이터의 최종 결정한다. 제안된 GTZAN 데이터 셋을 장르 분류를 시도한 결과 평균적으로 78.88%의 분류율을 보였다.
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (0)
CITATIONS (1)
EXTERNAL LINKS
PlumX Metrics
RECOMMENDATIONS
FAIR ASSESSMENT
Coming soon ....
JUPYTER LAB
Coming soon ....