Noise Meter - Uvod u suzbijanje buke
Nakon što smo shvatili osnovne razlike između suzbijanja buke (suzbijanje buke iz okoline zvučnika da bi daljinski slušaoci jasno čuli) i aktivne redukcije buke (nadoknađivanje vlastite buke iz okoline slušatelja), hajde da se fokusiramo na to kako postići potiskivanje buke.
Jedna metoda je korištenje više mikrofona za potiskivanje podataka. Prikupljanje podataka sa više lokacija dovest će do toga da uređaji primaju slične (ali ipak različite) signale. Glasovni signal koji mikrofon prima u blizini govorne populacije znatno je jači od signala sekundarnog mikrofona. Dva mikrofona će primati neglasovni pozadinski zvuk sa sličnom jačinom signala. Oduzmite informacije o zvuku prikupljene snažnim glasovnim mikrofonom i sekundarnim mikrofonom, a preostala većina su glasovne informacije. Što je veća udaljenost između mikrofona, veća je razlika u signalu između bližih i daljih mikrofona, što olakšava korištenje ovog jednostavnog algoritma za suzbijanje šuma. Međutim, kada ne govorite, ili kada očekujete da će se glasovni podaci promijeniti tokom vremena (kao što je kada hodate ili trčite, a telefon se stalno trese), efikasnost ove metode će se smanjiti. Prigušivanje šuma sa više mikrofona je svakako pouzdano, ali postoje nedostaci dodatnog hardvera i obrade.
Pa, šta ako postoji samo jedan mikrofon? Ako se dodatni izvori zvuka ne koriste za verifikaciju/poređenje, rješenje za jedan mikrofon će se oslanjati na razumijevanje primljenih karakteristika buke i njihovo filtriranje. Ovo se odnosi na prethodno navedene definicije stabilnog i nestacionarnog šuma. Šum u stabilnom stanju može se efikasno filtrirati pomoću DSP algoritama, dok nestacionarni šum predstavlja izazov, duboke neuronske mreže (DNN) mogu pomoći u rješavanju problema.
Ova metoda zahtijeva skup podataka za obuku mreže. Ovaj skup podataka sastoji se od različite (stabilne i nestacionarne) buke i jasnog govora, stvarajući sintetizirani bučni govorni obrazac. Ubacite skup podataka kao ulaz u DNN i iznesite ga jasnim glasom. Ovo će stvoriti model neuronske mreže koji će eliminisati šum i samo proizvesti jasan govor.
Čak i sa obučenim DNN-ovima, još uvijek postoje neki izazovi i pokazatelji koje treba razmotriti. Ako želite raditi u realnom vremenu s malim kašnjenjem, potrebna vam je jaka procesorska snaga ili manji DNN. Što je više parametara u DNN-u, to je sporija njegova brzina rada. Brzina uzorkovanja zvuka ima sličan učinak na potiskivanje zvuka. Veća stopa uzorkovanja znači da DNN treba da obrađuje više parametara, ali će zauzvrat postići veći kvalitet izlaza. Uskopojasna glasovna komunikacija je idealan izbor za suzbijanje buke u realnom vremenu.
