음성복원 2

Beamforming(빔포밍)

음성 인식을 할 때 중요한 요소가 뭐가 있을까요? 맞습니다. 듣고 싶은 음성을 더 정확하고 깨끗하게 듣고, 소음 등 노이즈는 최소화하는 것이 성능을 향상 시키기 위해 중요합니다. 오늘 설명해드릴 주제는 Beamforming(빔포밍)입니다. 🤔 : 빔포머란? 빔포머는 여러개의 마이크로폰 또는 안테나 배열을 이용하여 "특정" 방향에서 오는 신호를 집중적으로 수신하고,다른 방향에서 오는 신호(주로 잡음 또는 간섭)를 억제하는 기술로 특정 방향의 소리를 강화하고 원하지 않는 방향의 소리를 줄이는 데 효과적이다. 🤔 : 빔포밍 방식에는 어떤 것이 있나요?지연-합 빔포밍과 적응형 빔포밍 등 여러 방식이 있습니다. 첫 번째로 살펴 볼 방식은 지연-합 방식입니다.1. 지연-합 빔포밍(Delay-and-Sum Bea..

Masking-based Deep Enhancement Methods(마스킹 기반 딥 향상 기법)

Masking-based Deeep Enhancement Methods(마스킹 기반 딥 향상 기법)은 음성 신호 처리 중잡음이 섞여있는 신호에서 깨끗한 목표 음성을 추출하기 위해 고안된 기법입니다. 이 기법은 신경망을 사용하여 잡음이 있는 음성 신호에서 깨끗한 신호를 걸러내는 과정을 돕습니다. 그럼 여기서 궁금하실 부분이 있을 겁니다.  🤔 : "마스킹이 뭔데?" 마스킹(Masking)마스킹이란, 잡음이 있는 신호에서 특정 부분을 선택적으로 강조하거나 또는 약화시키는 방법을 의미합니다. 쉽게 설명해보면,마스크! 우리가 쓰는 마스크를 통해서 얼굴의 특정 부분을 가리고 또 특정 부분을 남겨두죠?같은 원리로,필요없는 부분(=잡음)을 가리고, 필요한 부분(=목표 음성)은 남겨두는 작업이라고 할 수 있습니다.마..