분류 전체보기 16

[운영체제] Operating System Introduction(1)

컴퓨터 시스템의 계층적 구성도 1. User Layer(사용자 계층)우선 첫번째 사진을 보면 맨위에 user 1부터 시작해서 user n까지 사용자 계층이 정의되어있다.이는 여러명의 사용자가 시스템에 접근할 수 있다는 것을 의미한다.(사용자들은 OS를 직접 다루는 것이 아닌 프로그램을 통해 사용하게 되는 것이다.) 2. System and Application Programs(시스템 및 응용프로그램 계층)이 계층은 사용자가 작업을 수행하는 응용 프로그램들이 위치하는 계층이다.응용 프로그램의 예시 : compiler, assembler, text editior, database system 등이 프로그램들은 OS를 통해 Hardware에 접근하게 되어있다. 3. Operating System(운영체제)지금..

카테고리 없음 2025.04.13

<스마트 캠핑카>임베디드시스템 프로젝트- 실행 결과

코드에 대한 소개 및 설명은 별도의 글에 작성하였으니 참고 바랍니다.https://wannagola.tistory.com/15 이번 글에서는 임베디드시스템을 활용한 프로젝트인 스마트 캠핑카 제작 결과를 보여주고자 한다. 시작에 앞서 우리가 처음 기획 당시 작성하였던 구상도를 보여주겠다. 1. 비밀번호 입력 2. 시동 ON시동이 켜지면 모든 동작이 가능하다.이때 시동이 켜져있는 것을 알려주기 위해 캠핑카 전면 코에 불이 들어온다. 3. 모션센서 감지 시, 운전석 문 열림자동차의 운전석 쪽 문은 인체감지 센서가 모션을 감지하면 문이 열리고 3초 후 에 자동으로 다시 닫긴다.이때 문을 열어주는건 서보모터를 사용했다. 3. 모션센서 미감지 3초 후, 운전석 문 닫힘인체 감지 센서에 모션이 감지 되지 않는다면 3..

개인 프로젝트 2025.01.09

<스마트 캠핑카> 임베디드시스템 프로젝트 - 코드 소개 및 설명

본 프로젝트 진행을 위한 코드에 대한 소개 및 설명을 하고자 한다.  - PB0(조도센서) MODE: Input mode, CNF: Analog Mode - PC13(조도 LED) MODE: Output mode, CNF: General purpose push-pull - PC12(인체감지센서) MODE: Input mode, CNF: Input with push-up/pull-down - PC11(엔진 LED) MODE: Output mode, CNF: General purpose push-pull - PC10(DC 모터, 선풍기) MODE: Output mode, CNF: General purpose push-pull - PC9(히터 LED) MODE: Output mode, CNF: General ..

개인 프로젝트 2025.01.09

제5회 인공지능인문학 대학생 학술논문 경연대회 장려상

기술 블로그를 시작한 지 얼마 되지 않아, 이전에 유의미했던 활동들을 복기하여 업로드하려고 합니다. 그 첫 번째 게시글은 바로... "제5회 인공지능인문학 대학생 학술논문 경연대회" 입니다. 코로나가 한창 기승을 부리던 시기에 입대를 앞두고, 유의미한 활동을 해보자 하다가 발견한 대회였습니다. 당시 전공에 대한 지식도 많이 부족했고, 인공지능 기술에 대해서는 더더욱 문외한이었던 저는"인공지능 기술에 대해 알아보고, 논문을 쓰는 방법을 익히자!"라는 마음가짐으로 참여하였던 것 같습니다. 주제의 경우, 함께 참가한 정치외교학과 친구와 수차례 회의를 거듭한 끝에주제 1 : 인공지능이 인간과 사회에 미치는 영향(자유 주제)파트로 지원하기로 하였고, 자료 조사 과정을 거치면서인공지능 기술이 날이 갈수록 빠르게 발..

개인 프로젝트 2024.11.17

MVDR Beamformer(Minimum Variance Distortionless Response Beamformer)

이번 게시글에서 다룰 내용은 MVDR Beamformer입니다. MVDR Beamformer 내용을 시작하기에 앞서 빔포밍에 대해 이해가 부족하시다면...빔포밍에 관한 이야기 : https://wannagola.tistory.com/12 이 글을 먼저 읽어보시는 것을 추천드립니다! 🤔 : MVDR 빔포머가 뭐예요?MVDR 빔포머는 특정 방향에서 오는 신호를 그대로 유지하면서, 다른 방향에서 들어오는 잡음이나 간섭 신호의 영향을 최소화 하기 위해 설계된 빔포머입니다. 음성 인식과 같은 응용 단계에서, 특정한 사용자의 음성을 증폭하고 주변 잡음을 줄여주는 역할을 한다고 이해하시면 될 것 같습니다.🤔 : 주요 개념에 대해 설명해주세요1. 목표 신호의 무왜곡 유지 :이전 글에서도 언급했듯이, 빔포밍은 특정 ..

Beamforming(빔포밍)

음성 인식을 할 때 중요한 요소가 뭐가 있을까요? 맞습니다. 듣고 싶은 음성을 더 정확하고 깨끗하게 듣고, 소음 등 노이즈는 최소화하는 것이 성능을 향상 시키기 위해 중요합니다. 오늘 설명해드릴 주제는 Beamforming(빔포밍)입니다. 🤔 : 빔포머란? 빔포머는 여러개의 마이크로폰 또는 안테나 배열을 이용하여 "특정" 방향에서 오는 신호를 집중적으로 수신하고,다른 방향에서 오는 신호(주로 잡음 또는 간섭)를 억제하는 기술로 특정 방향의 소리를 강화하고 원하지 않는 방향의 소리를 줄이는 데 효과적이다. 🤔 : 빔포밍 방식에는 어떤 것이 있나요?지연-합 빔포밍과 적응형 빔포밍 등 여러 방식이 있습니다. 첫 번째로 살펴 볼 방식은 지연-합 방식입니다.1. 지연-합 빔포밍(Delay-and-Sum Bea..

Joint Training(조인트 트레이닝)

이번에 설명해드릴 음성 인식 시스템에서 자주 사용되는 방식은 Joint Training입니다. 🤔  : Joint Training이란?두 개 이상의 모델을 함께 학습하여, 서로의 정보를 공유하고 최적화 하는 방법입니다.보통 잡음 제거와 음성 인식을 동시에 수행할 때 사용됩니다. - 병렬 학습 : 프론트엔드 모델과 백엔드 모델을 병렬로 학습합니다. 프론트엔드는 음성 신호를 정제하거나 잡음을 잡아주는 역할을 하고, 백엔드는 정제된 음성을 바탕으로 텍스트로 변환하는 음성 인식 작업을 수행합니다.- 상호 정보 공유 : 두 모델이 학습 과정에서 서로 정보를 주고받아 더 좋은 결과를 내는 것입니다. 프론트엔드에서 정제해주면 백엔드가 정제된 걸 쓰고, 백엔드에서 인식된 정보를 다시 프론트엔드가 피드백하고.- 공동 ..

Multi-Task Learning(DNN & LSTM-RNN)

Deep Learning for Environmentally Robust Speech Recognition: An Overview of Recent Developments( Z. Zhang, J. Geiger, A. E. Moussa, B. Schuller) 내용 중 Multi-Task Learning의 개념이 나옵니다. 오늘은 이 기법에 대해서 설명해드리고자 합니다. 우선 Multi-Task Learning 즉, 멀티태스크 학습은 DNN(Deep Neural Network)과 LSTM-RNN(Long Short-Term Memory - Recurrent Neural Network)을 결합하여 두 가지 작업을 동시에 수행하도록 신경망을 설계하는 방식입니다.Multi-Task Learning에서의 작업 1..

세논 분류(Senone Classification)

지금까지 제가 작성한 글을 보면 음소(Phoneme) 단위라는 말이 나왔습니다.🤔: 그럼 세논(Senone)은 무엇일까요?세논은 음소를 더 작은 단위로 세분화한 개념입니다!* 음소 → 언어에서 의미를 구별해주는 최소의 소리 단위 음성 인식 시스템에서 단어를 인식하기위해 각 음소가 구체적으로 어떤 발음을 갖는지세밀하게 더 자세하게 구분할 필요가 있습니다. 이를 위해 음소를 HMM의 상태(state)로 표현할 때, 각 상태의 구체적인 분포를 세논이라고 합니다!예를 들면,"cat" 이라는 단어의 발음은 세 개의 음소 "k" , "ae" , "t" 로 구성됩니다.근데 여기서 더 나아가서각 음소는 또 다른 세부적인 소리 패턴을 가지고 있습니다.이 소리 패턴을 구체적으로 표현한 것이! 바로 ~ 세논입니다.🤔 :..

NAT / i-vector와 동적 NAT (백엔드 음성인식 처리 기법)

NAT는 Noise-Aware Training의 약자로 잡음 인식 학습을 의미합니다. NAT는 모델이 학습하는 과정에서 잡음 정보를 함께 학습합니다. 즉, 모델이 단순히 음성 신호만 모델이 보는 것이 아니라 해당 음성에 포함된 잡음 정보까지 고려하여 학습하는 것입니다.NAT의 작동 원리음성 데이터 외에 잡음 데이터(혹은 잡음 추정치)를 추가 입력으로 제공합니다.모델은 음성 신호와 잡음 신호 간의 관계를 학습하게 됩니다.그 결과 잡음 속에서도 잡음과 타겟 음성을 구별하여 더 정확한 음성을 인식할 수 있게 됩니다. 예를 들어, 저희가 학습한 음성 인식 모델이 조용한 연구실 환경에서 학습 시켰다고 가정해봅시다.그렇다면 시끄러운 카페에서 또는 거리에서 정확한 음성 인식이 어려울 수 있습니다. 🪴 온실 속 화초..