Maskeringströskel

Maskeringströskel inom akustik (en gren av fysiken som behandlar ämnen som vibration , ljud , ultraljud och infraljud ), hänvisar till en process där om det finns två samtidiga ljud och det ena ljudet är högre än det andra, kan en person vara oförmögen för att höra det mjuka ljudet eftersom det maskeras av det starkare ljudet.

Maskeringströskeln är alltså ljudtrycksnivån för ett ljud som behövs för att göra ljudet hörbart i närvaro av ett annat ljud som kallas "masker". Denna tröskel beror på frekvensen , typen av maskering och typen av ljud som maskeras. Effekten är starkast mellan två ljud nära i frekvens.

I samband med ljudöverföring finns det vissa fördelar med att inte kunna uppfatta ett ljud. I ljudkodning , till exempel, kan bättre komprimering uppnås genom att utelämna de ohörbara tonerna. Detta kräver färre bitar för att koda ljudet och minskar storleken på den slutliga filen.

Applikationer inom ljudkomprimering

Det är ovanligt att arbeta med endast en ton . De flesta ljud är sammansatta av flera toner. Det kan finnas många möjliga maskerare vid samma frekvens. I denna situation skulle det vara nödvändigt att beräkna den globala maskeringströskeln med hjälp av en högupplöst snabb Fourier-transform via 512 eller 1024 punkter för att bestämma frekvenserna som utgör ljudet. Eftersom det finns bandbredder som människor inte kan höra, är det nödvändigt att känna till signalnivån, maskeringstypen och frekvensbandet innan de individuella tröskelvärdena beräknas. För att undvika att ha maskeringströskeln under tröskeln i tysthet, lägger man till den sista till beräkningen av partiella trösklar. ^{[ förtydligande behövs ]} Detta möjliggör beräkning av signal-till-mask-förhållandet (SMR).

Spektrum för en 1 kHz-ton . Ett ljud kommer inte att höras om det är under tröskeln i tysthet. Denna gräns ändras runt maskeringsfrekvensen, vilket gör det svårare att höra en närliggande ton. Maskeringströskelns lutning är brantare mot lägre frekvenser än mot högre frekvenser, vilket innebär att det är lättare att maskera med högre frekvenstoner.

Den psykoakustiska modellen

MPEG - ljudkodningsprocessen utnyttjar maskeringströskeln. I denna process finns det ett block som kallas "Psykoakustisk modell". Detta kommuniceras med bandfiltret och kvantifieringsblocket. Den psykoakustiska modellen analyserar de sampel som skickas till den av filterbandet och beräknar maskeringströskeln i varje frekvensband med hjälp av en Fast Fourier-transform. Antalet punkter som används beror på MPEG-lagret. Med användning av dessa tröskelvärden bestäms signal-till-mask-förhållandet och skickas till kvantifieraren. Kvantifieraren tilldelar fler eller färre bitar i varje block baserat på SMR. Blocket med högsta SMR kommer att koda med maximalt antal bitar .