문제 정의 : 입력된 음성이 코골이인지 아닌지 판별
사용 데이터 : 관련 음성 크롤링
사용 기술 : Python, Keras
사용 방법론 : Mfcc, MobileNet
Python
복사
맡은 역할 : 데이터 Labelling, 모델링
개요
딥러닝을 이용한 코골이 감지 Protype 개발을 외주 받았던 프로젝트입니다.
목표
1. 들어오는 음성에서 코골이를 탐지하자
2. 모바일 환경에 이식하자
Python
복사
해결 과정
1.
데이터 수집
•
구글링을 통해 직접 코골이 음성 수집
2.
구조
•
초기 시도 :
Overlay를 이용해 데이터를 만들고 코골이를 탐지 (Segmentation) → 성능이 낮음
•
이후 시도 :
단순한 Image Classification 문제로 전환 → 성능 상승
3.
음성 전처리
•
모바일 환경에서 Mel-spectrogram 사용이 어려움 → mfcc로 대체
(데모 언어가 Kotlin이었는데 마땅한 구현체가 없었음)
4.
모델 용량 문제
•
모바일 환경에 이식해야함 → 성능과 무게 모두 고려
◦
모바일 환경에서 사용 가능한 여러 모델 실험
▪
최적의 모델 모바일로 임베딩 ! (TensorFlow - Lite)