Jämförelse av analog och digital inspelning
Ljud kan spelas in och lagras och spelas upp med antingen digitala eller analoga tekniker. Båda teknikerna introducerar fel och förvrängningar i ljudet, och dessa metoder kan systematiskt jämföras. Musiker och lyssnare har bråkat om överlägsenheten hos digitala kontra analoga ljudinspelningar. Argument för analoga system inkluderar frånvaron av grundläggande felmekanismer som finns i digitala ljudsystem, inklusive aliasing och kvantiseringsbrus . Digitala förespråkare pekar på de höga prestandanivåer som är möjliga med digitalt ljud, inklusive utmärkt linjäritet i det hörbara bandet och låga nivåer av brus och distorsion.
Två framträdande skillnader i prestanda mellan de två metoderna är bandbredden och signal-brusförhållandet ( S/N-förhållande). Bandbredden för det digitala systemet bestäms, enligt Nyquist-frekvensen , av den samplingshastighet som används. Bandbredden för ett analogt system är beroende av de analoga kretsarnas fysiska och elektroniska kapacitet. S/N-förhållandet för ett digitalt system kan begränsas av digitaliseringsprocessens bitdjup , men den elektroniska implementeringen av konverteringskretsar introducerar ytterligare brus. I ett analogt system finns andra naturliga analoga bruskällor, såsom flimmerbrus och ofullkomligheter i inspelningsmediet. Andra prestandaskillnader är specifika för systemen som jämförs, såsom förmågan till mer transparenta filtreringsalgoritmer i digitala system och övertonsmättnaden och hastighetsvariationerna hos analoga system.
Dynamiskt omfång
Ett ljudsystems dynamiska omfång är ett mått på skillnaden mellan de minsta och största amplitudvärdena som kan representeras i ett medium. Digitala och analoga skiljer sig åt i både metoderna för överföring och lagring, såväl som det beteende som systemen uppvisar på grund av dessa metoder.
Det dynamiska omfånget för digitala ljudsystem kan överstiga det för analoga ljudsystem. Analoga kassettband för konsumenter har ett dynamiskt omfång på 60 till 70 dB. Analoga FM-sändningar har sällan ett dynamiskt omfång som överstiger 50 dB. Det dynamiska omfånget för en direktklippt vinylskiva kan överstiga 70 dB. Analoga studiomasterband kan ha ett dynamiskt omfång på upp till 77 dB. En LP gjord av perfekt diamant har en atomär egenskapsstorlek på cirka 0,5 nanometer , vilket, med en spårstorlek på 8 mikron , ger ett teoretiskt dynamiskt område på 110 dB. En LP gjord av perfekt vinyl LP skulle ha ett teoretiskt dynamiskt omfång på 70 dB. Mätningar indikerar maximal faktisk prestanda i intervallet 60 till 70 dB. Vanligtvis kan en 16-bitars analog-till-digital-omvandlare ha ett dynamiskt omfång på mellan 90 och 95 dB, medan signal-brusförhållandet (ungefär ekvivalent med dynamiskt omfång, noterar frånvaron av kvantiseringsbrus men närvaron av band hiss) för en professionell tums bandspelare skulle vara mellan 60 och 70 dB vid inspelarens nominella utgång.
Fördelarna med att använda digitala inspelare med mer än 16-bitars noggrannhet kan tillämpas på 16-bitars ljud-CD. Meridian Audios grundare John Robert Stuart betonar att med rätt dither är upplösningen i ett digitalt system teoretiskt oändlig, och att det till exempel är möjligt att lösa upp ljud vid −110 dB (under digital fullskala) i en väl- designad 16-bitars kanal.
Överbelastningsförhållanden
Det finns vissa skillnader i beteendet hos analoga och digitala system när högnivåsignaler finns, där det finns möjlighet att sådana signaler kan pressa systemet till överbelastning. Med högnivåsignaler närmar sig analogt magnetband mättnad , och högfrekvensresponsen sjunker i proportion till lågfrekvensresponsen. Även om det är oönskat kan den hörbara effekten av detta vara rimligt obestridlig. Däremot visar digitala PCM-inspelare icke-godartat beteende vid överbelastning; Sampler som överskrider toppkvantiseringsnivån trunkeras helt enkelt, vilket klipper vågformen rakt, vilket introducerar distorsion i form av stora mängder högrefrekventa övertoner. I princip har PCM digitala system den lägsta nivån av olinjär distorsion vid full signalamplitud. Det motsatta är vanligtvis sant för analoga system, där distorsion tenderar att öka vid höga signalnivåer. En studie av Manson (1980) övervägde kraven på ett digitalt ljudsystem för högkvalitativ sändning. Den drog slutsatsen att ett 16-bitarssystem skulle räcka, men noterade den lilla reserv som systemet gav under vanliga driftsförhållanden. Av denna anledning föreslogs att en snabbverkande signalbegränsare eller " soft clipper " skulle användas för att förhindra att systemet överbelastas.
Med många inspelningar kan högnivåförvrängningar vid signaltoppar vara hörbart maskerade av originalsignalen, sålunda kan stora mängder distorsion vara acceptabla vid toppsignalnivåer. Skillnaden mellan analoga och digitala system är formen av signalfel på hög nivå. Vissa tidiga analog-till-digital-omvandlare visade icke-godartat beteende vid överbelastning, där överbelastningssignalerna "lindades" från positiv till negativ fullskala. Moderna omvandlarkonstruktioner baserade på sigma-deltamodulering kan bli instabila under överbelastningsförhållanden. Det är vanligtvis ett designmål för digitala system att begränsa högnivåsignaler för att förhindra överbelastning. För att förhindra överbelastning kan ett modernt digitalt system komprimera insignaler så att digital fullskala inte kan nås
Fysisk nedbrytning
i princip kan dupliceras på obestämd tid och utan generationsförlust . Felkorrigering tillåter digitala format att tolerera betydande mediaförsämringar även om digitala medier inte är immuna mot dataförlust. Konsument CD-R CD- skivor har en begränsad och varierande livslängd på grund av både inneboende och tillverkningskvalitetsproblem.
Med vinylskivor kommer det att bli en viss förlust i trohet vid varje uppspelning av skivan. Detta beror på slitaget av pennan i kontakt med skivans yta. Magnetband, både analoga och digitala, slits av friktion mellan tejpen och huvuden, styrningarna och andra delar av bandtransporten när tejpen glider över dem. Den bruna återstoden som avsätts på svabbar under rengöring av en tejpmaskins tejpbana är faktiskt partiklar av magnetisk beläggning som tappas från tejper. Sticky-shed-syndrom är ett vanligt problem med äldre band. Tejper kan också drabbas av veck, töjning och rysningar av kanterna på plasttejpbasen, särskilt från tejpdäck av låg kvalitet eller ur linje.
När en CD spelas är det ingen fysisk kontakt inblandad eftersom data läses optiskt med hjälp av en laserstråle. Därför sker ingen sådan mediaförsämring, och CD-skivan kommer, med lämplig försiktighet, att låta exakt likadant varje gång den spelas (rabatterar åldrande av spelaren och CD-skivan själv); detta är dock en fördel med det optiska systemet, inte för digital inspelning, och Laserdisc-formatet åtnjuter samma beröringsfria fördelar med analoga optiska signaler. CD-skivor lider av skivröta och försämras långsamt med tiden, även om de förvaras på rätt sätt och inte spelas. M-DISC , en inspelningsbar optisk teknik som marknadsför sig som läsbar i 1 000 år, är tillgänglig på vissa marknader, men har sedan slutet av 2020 aldrig sålts i CD- R- format. (Ljud kan dock lagras på en M-DISC DVD-R med DVD-Audio- formatet.)
Ljud
För elektroniska ljudsignaler inkluderar bruskällor mekaniskt, elektriskt och termiskt brus i inspelnings- och uppspelningscykeln. Mängden brus som en ljudutrustning lägger till den ursprungliga signalen kan kvantifieras. Matematiskt kan detta uttryckas med hjälp av signal-brusförhållandet (SNR eller S/N-förhållande). Ibland anges det maximala möjliga dynamiska omfånget för systemet istället.
Med digitala system beror kvaliteten på återgivningen av omvandlingsstegen från analog-till-digital och digital-till-analog och beror inte på kvaliteten på inspelningsmediet, förutsatt att det är tillräckligt för att behålla de digitala värdena utan fel. Digitala medier som kan bit-perfekt lagring och hämtning har varit vanliga under en tid, eftersom de i allmänhet utvecklades för mjukvarulagring som inte har någon tolerans för fel.
Processen med analog-till-digital konvertering kommer enligt teorin alltid att introducera kvantiseringsförvrängning. Denna distorsion kan återges som okorrelerat kvantiseringsbrus genom användning av dither . Storleken på detta brus eller distorsion bestäms av antalet kvantiseringsnivåer. I binära system bestäms detta av och anges vanligtvis i termer av antalet bitar . Varje ytterligare bit lägger till ungefär 6 dB i möjlig SNR, t.ex. 24 x 6 = 144 dB för 24-bitars kvantisering, 126 dB för 21-bitar och 120 dB för 20-bitar. Det digitala 16-bitarssystemet för Red Book ljud-CD har 2 16 = 65 536 möjliga signalamplituder, vilket teoretiskt tillåter en SNR på 98 dB .
Rumble
Rumble är en form av bruskarakteristik som orsakas av brister i lager på skivspelare. Tallriken tenderar att ha en liten rörelse förutom den önskade rotationen och skivspelarens yta rör sig också något upp, ner och från sida till sida. Denna extra rörelse läggs till den önskade signalen som brus, vanligtvis av mycket låga frekvenser, vilket skapar ett mullrande ljud under tysta passager. Mycket billiga skivspelare använde ibland kullager , som med stor sannolikhet genererar hörbara mängder mullrande. Dyrare skivspelare tenderar att använda massiva hylslager , som är mycket mindre benägna att generera stötande mängder mullrande. Ökad skivspelares massa tenderar också att leda till minskat mullret. En bra skivspelare bör ha mullret minst 60 dB under den angivna utgångsnivån från pickupen. Eftersom de inte har några rörliga delar i signalvägen utsätts inte digitala system för muller.
Wow och fladdra
Wow och fladder är en förändring i frekvensen för en analog enhet och är resultatet av mekaniska brister. Wow är en form av fladder som sker i en långsammare takt. Wow och fladder märks mest på signaler som innehåller rena toner. För LP-skivor kommer skivspelarens kvalitet att ha stor inverkan på nivån på wow och fladder. En bra skivspelare kommer att ha wow- och fladdervärden på mindre än 0,05 %, vilket är hastighetsvariationen från medelvärdet. Wow och fladder kan också förekomma i inspelningen, som ett resultat av inspelarens ofullkomliga funktion. På grund av deras användning av precisionskristalloscillatorer för sin tidsbas är digitala system inte föremål för wow och fladder.
Frekvenssvar
För digitala system bestäms den övre gränsen för frekvenssvaret av samplingsfrekvensen . Valet av samplingsfrekvens i ett digitalt system baseras på Nyquist–Shannons samplingssats . Detta anger att en samplade signal kan reproduceras exakt så länge som den samplas vid en frekvens som är större än dubbelt så mycket som signalens bandbredd , Nyquist-frekvensen . Därför är en samplingsfrekvens på 40 kHz matematiskt tillräcklig för att fånga all information som finns i en signal med frekvenskomponenter mindre än eller lika med 20 kHz. Samplingssatsen kräver också att frekvensinnehåll över Nyquist-frekvensen tas bort från signalen innan den samplas. Detta åstadkoms med hjälp av anti-aliasing-filter som kräver ett övergångsband för att tillräckligt reducera aliasing. Bandbredden som tillhandahålls av samplingsfrekvensen på 44 100 Hz som används av standarden för ljud-CD-skivor är tillräckligt bred för att täcka hela den mänskliga hörselomfånget , som grovt sett sträcker sig från 20 Hz till 20 kHz. Professionella digitala inspelare kan spela in högre frekvenser, medan vissa konsument- och telekommunikationssystem spelar in ett mer begränsat frekvensområde.
Vissa analoga bandtillverkare anger frekvenssvar upp till 20 kHz, men dessa mätningar kan ha gjorts vid lägre signalnivåer. Kompaktkassetter kan ha en respons som sträcker sig upp till 15 kHz vid full (0 dB) inspelningsnivå. På lägre nivåer (−10 dB) är kassetter vanligtvis begränsade till 20 kHz på grund av självradering av bandmediet.
Frekvenssvaret för en konventionell LP-spelare kan vara 20 Hz till 20 kHz, ±3 dB. Lågfrekvensresponsen hos vinylskivor begränsas av mullrande brus (beskrivs ovan), såväl som de fysiska och elektriska egenskaperna hos hela pickuparmen och givaren. Vinylens högfrekvensrespons beror på kassetten. CD4- skivor innehöll frekvenser upp till 50 kHz. Frekvenser på upp till 122 kHz har klippts experimentellt på LP-skivor.
Aliasing
Digitala system kräver att allt högfrekvent signalinnehåll ovanför Nyquist-frekvensen måste tas bort före sampling, vilket, om det inte görs, kommer att resultera i att dessa ultraljudsfrekvenser "viks över" till frekvenser i det hörbara området, vilket ger en sorts distorsion som kallas aliasing . Aliasing förhindras i digitala system av ett anti-aliasing-filter . Att designa ett analogt filter som exakt tar bort allt frekvensinnehåll exakt över eller under en viss gränsfrekvens är dock opraktiskt. Istället brukar man välja en samplingsfrekvens som ligger över Nyquists krav. Denna lösning kallas översampling och gör att ett mindre aggressivt och billigare kantutjämningsfilter kan användas.
Tidiga digitala system kan ha drabbats av ett antal signalförsämringar relaterade till användningen av analoga kantutjämningsfilter, t.ex. tidsdispersion, olinjär distorsion , rippel , temperaturberoende hos filter etc. Genom att använda en översamplingsdesign och delta-sigmamodulering , mindre aggressiva analoga kantutjämningsfilter kan kompletteras med ett digitalt filter. Detta tillvägagångssätt har flera fördelar. Det digitala filtret kan göras för att ha en nästan idealisk överföringsfunktion, med låg rippel i bandet och ingen åldrande eller termisk drift.
Analoga system är inte föremål för en Nyquist-gräns eller aliasing och kräver därför inte anti-aliasing-filter eller någon av de designöverväganden som är förknippade med dem. Istället bestäms gränserna för analoga lagringsformat av de fysiska egenskaperna hos deras konstruktion.
Samplingsfrekvenser
Ljud av CD-kvalitet samplas vid 44 100 Hz ( Nyquist-frekvens = 22,05 kHz) och vid 16 bitar. Sampling av vågformen vid högre frekvenser och tillåter ett större antal bitar per sampel gör att brus och distorsion kan reduceras ytterligare. DAT kan sampla ljud i upp till 48 kHz, medan DVD-Audio kan vara 96 eller 192 kHz och upp till 24 bitars upplösning. Med någon av dessa samplingsfrekvenser fångas signalinformation över vad som allmänt anses vara det mänskliga hörselområdet .
Arbete utfört 1981 av Muraoka et al. visade att musiksignaler med frekvenskomponenter över 20 kHz endast särskiljdes från de utan av ett fåtal av de 176 testpersonerna. En perceptuell studie av Nishiguchi et al. (2004) drog slutsatsen att "ingen signifikant skillnad hittades mellan ljud med och utan mycket högfrekventa komponenter bland ljudstimuli och försökspersoner... men [Nishiguchi et al] kan fortfarande varken bekräfta eller förneka möjligheten att vissa försökspersoner kunde diskriminera mellan musikaliska ljud med och utan mycket högfrekventa komponenter."
I blindlyssningstest utförda av Bob Katz 1996, som berättas i hans bok Mastering Audio: The Art and the Science, kunde försökspersoner som använde samma reproduktionsutrustning med hög samplingsfrekvens inte urskilja någon hörbar skillnad mellan programmaterial som filtrerats identiskt för att ta bort frekvenser ovanför 20 kHz mot 40 kHz. Detta visar att närvaro eller frånvaro av ultraljudsinnehåll inte förklarar ljudvariation mellan samplingshastigheter. Han hävdar att variationen till stor del beror på prestanda hos de bandbegränsande filtren i omvandlare. Dessa resultat tyder på att den främsta fördelen med att använda högre samplingshastigheter är att det pressar följdfasdistorsion från de bandbegränsande filtren utanför det hörbara området och att högre samplingshastigheter kanske inte är nödvändiga under idealiska förhållanden. Dunn (1998) undersökte prestandan hos digitalomvandlare för att se om dessa skillnader i prestanda kunde förklaras av de bandbegränsande filtren som används i omvandlare och letade efter artefakterna de introducerar.
Kvantisering
En signal spelas in digitalt av en analog-till-digital-omvandlare , som mäter amplituden för en analog signal med regelbundna intervall som specificeras av samplingshastigheten, och sedan lagrar dessa samplade siffror i datorhårdvara. Siffror på datorer representerar en ändlig uppsättning diskreta värden, vilket innebär att om en analog signal samplas digitalt med hjälp av inhemska metoder (utan dither), kommer ljudsignalens amplitud helt enkelt att avrundas till närmaste representation. Denna process kallas kvantisering, och dessa små fel i mätningarna visar sig hörselmässigt som lågnivåbrus eller distorsion. Denna form av distorsion, ibland kallad granulär eller kvantiseringsdistorsion, har pekats ut som ett fel hos vissa digitala system och inspelningar, särskilt vissa tidiga digitala inspelningar, där den digitala utgåvan sades vara sämre än den analoga versionen. Men "om kvantiseringen utförs med hjälp av rätt dither, så är den enda konsekvensen av digitaliseringen i praktiken tillägget av ett vitt, okorrelerat, godartat, slumpmässigt brusgolv. Nivån på bruset beror på antalet bitar i kanal."
Omfånget av möjliga värden som kan representeras numeriskt av ett sampel bestäms av antalet binära siffror som används. Detta kallas upplösningen och brukar kallas bitdjupet i PCM-ljudsammanhang. Kvantiseringsbrusnivån bestäms direkt av detta tal, och minskar exponentiellt (linjärt i dB-enheter) när upplösningen ökar. Med ett adekvat bitdjup kommer slumpmässigt brus från andra källor att dominera och helt maskera kvantiseringsbruset. Redbook CD-standarden använder 16 bitar, vilket håller kvantiseringsbruset 96 dB under maximal amplitud, långt under en urskiljbar nivå med nästan vilket källmaterial som helst. Tillägget av effektiv dither innebär att "i praktiska termer begränsas upplösningen av vår förmåga att lösa ljud i brus... Vi har inga problem med att mäta (och höra) signaler på –110dB i en väldesignad 16-bitars kanal." DVD-Audio och den modernaste professionella inspelningsutrustningen tillåter samplingar på 24 bitar.
Analoga system har inte nödvändigtvis diskreta digitala nivåer där signalen är kodad. Följaktligen begränsas den noggrannhet till vilken den ursprungliga signalen kan bevaras istället av det inneboende brusgolvet och maximala signalnivån för media och uppspelningsutrustning.
Kvantisering i analoga medier
Eftersom analoga medier är sammansatta av molekyler representerar den minsta mikroskopiska strukturen den minsta kvantiseringsenheten av den registrerade signalen. Naturliga vibrerande processer, som slumpmässiga termiska rörelser av molekyler, läsinstrumentets storlek som inte är noll och andra medelvärdeseffekter, gör den praktiska gränsen större än den för den minsta molekylära strukturen. En teoretisk LP som består av perfekt diamant, med en spårstorlek på 8 mikron och en funktionsstorlek på 0,5 nanometer, har en kvantisering som liknar ett 16-bitars digitalt sampel.
Dither som en lösning
Det är möjligt att göra kvantiseringsbrus hörbart godartat genom att applicera dither . För att göra detta läggs brus till den ursprungliga signalen före kvantisering. Optimal användning av vibrering har effekten att göra kvantiseringsfel oberoende av signalen och tillåter att signalinformationen bibehålls under den minst signifikanta biten i det digitala systemet.
Dither-algoritmer har också vanligtvis ett alternativ att använda någon form av brusformning , som skjuter upp frekvensen av mycket av vibrerande brus till områden som är mindre hörbara för mänskliga öron, vilket sänker nivån på brusgolvet som är uppenbart för lyssnaren.
Dither tillämpas vanligen under mastering före slutlig bitdjupsreduktion, och även vid olika stadier av DSP .
Timing jitter
En aspekt som kan försämra prestandan hos ett digitalt system är jitter . Detta är fenomenet med variationer i tid från vad som borde vara det korrekta avståndet mellan diskreta sampel enligt samplingshastigheten. Detta kan bero på tidsfel i den digitala klockan. Helst bör en digital klocka producera en tidspuls med exakt regelbundna intervall. Andra källor till jitter i digitala elektroniska kretsar är datainducerat jitter, där en del av den digitala strömmen påverkar en efterföljande del när den strömmar genom systemet, och strömförsörjningsinducerat jitter, där brus från strömförsörjningen orsakar oregelbundenheter i tidpunkten för signaler i kretsarna den driver.
Noggrannheten hos ett digitalt system är beroende av de samplade amplitudvärdena, men den är också beroende av dessa värdens tidsmässiga regelbundenhet. De analoga versionerna av detta tidsmässiga beroende är kända som tonhöjdsfel och wow-and-fladder.
Periodiskt jitter producerar moduleringsbrus och kan ses som motsvarigheten till analogt fladder. Slumpmässigt jitter ändrar brusgolvet i det digitala systemet. Omvandlarens känslighet för jitter beror på omvandlarens design. Det har visats att ett slumpmässigt jitter på 5 ns kan vara signifikant för 16-bitars digitala system.
1998 undersökte Benjamin och Gannon hörbarheten av jitter med hjälp av lyssningstester. De fann att den lägsta nivån av jitter som kunde höras var runt 10 ns ( rms ). Detta var på en 17 kHz sinusvågstestsignal . Med musik fann inga lyssnare jitter hörbart vid nivåer lägre än 20 ns. En artikel av Ashihara et al. (2005) försökte fastställa detektionströskelvärdena för slumpmässigt jitter i musiksignaler. Deras metod involverade ABX-lyssningstester . När författarna diskuterade sina resultat kommenterade författarna att:
Hittills verkar det faktiska jitter i konsumentprodukter vara för litet för att åtminstone upptäckas för återgivning av musiksignaler. Det är dock inte klart om detektionströskelvärden som erhållits i denna studie verkligen skulle representera gränsen för auditiv upplösning eller om den skulle begränsas av upplösning av utrustning. Förvrängningar på grund av mycket litet jitter kan vara mindre än förvrängningar på grund av icke-linjära egenskaper hos högtalarna. Ashihara och Kiryu [8] utvärderade linjäriteten hos högtalare och hörlurar. Enligt deras observation verkar hörlurar vara mer att föredra för att producera tillräckligt ljudtryck vid trumhinnorna med mindre förvrängningar än högtalare.
Signalbehandling
Efter den första inspelningen är det vanligt att ljudsignalen ändras på något sätt, till exempel med användning av komprimering , utjämning , fördröjningar och reverb . Med analog kommer detta i form av utombordares hårdvarukomponenter , och med digitala åstadkommes detsamma vanligtvis med plug-ins i en digital ljudarbetsstation (DAW).
En jämförelse av analog och digital filtrering visar tekniska fördelar med båda metoderna. Digitala filter är mer exakta och flexibla. Analoga filter är enklare, kan vara effektivare och introducerar inte latens.
Analog hårdvara
När du ändrar en signal med ett filter kan den utgående signalen skilja sig i tid från signalen på ingången, vilket mäts som dess fassvar . Alla analoga utjämnare uppvisar detta beteende, med mängden fasförskjutning som skiljer sig åt i något mönster, och centrerat runt bandet som justeras. Även om denna effekt förändrar signalen på ett annat sätt än en strikt förändring av frekvenssvaret, är den vanligtvis inte stötande för lyssnare.
Digitala filter
Eftersom de involverade variablerna kan specificeras exakt i beräkningarna, kan digitala filter fås att objektivt prestera bättre än analoga komponenter. Annan bearbetning som fördröjning och blandning kan göras exakt.
Digitala filter är också mer flexibla. Till exempel introducerar den linjära fasutjämnaren inte frekvensberoende fasförskjutning. Detta filter kan implementeras digitalt med användning av ett ändligt impulssvarsfilter men har ingen praktisk implementering med användning av analoga komponenter.
En praktisk fördel med digital bearbetning är den bekvämare återkallningen av inställningar. Plug-in parametrar kan lagras på datorn, medan parameterdetaljer på en analog enhet måste skrivas ner eller på annat sätt registreras om enheten behöver återanvändas. Detta kan vara besvärligt när hela mixar måste återkallas manuellt med en analog konsol och utombordare. När du arbetar digitalt kan alla parametrar enkelt lagras i en DAW-projektfil och återkallas direkt. De flesta moderna professionella DAW:er bearbetar även plugin-program i realtid, vilket innebär att bearbetningen i stort sett kan vara oförstörande fram till den slutliga mixningen.
Analog modellering
Många plug-ins finns nu som innehåller analog modellering. Det finns ljudtekniker som stöder dem och känner att de jämför lika mycket i ljud med de analoga processer som de imiterar. Analog modellering har vissa fördelar jämfört med sina analoga motsvarigheter, såsom förmågan att ta bort brus från algoritmerna och modifieringar för att göra parametrarna mer flexibla. Å andra sidan upplever andra ingenjörer också att modelleringen fortfarande är sämre än de äkta utombordskomponenterna och föredrar fortfarande att blanda "utanför boxen".
Ljudkvalitet
Subjektiv utvärdering
Subjektiv utvärdering försöker mäta hur väl en ljudkomponent presterar enligt det mänskliga örat. Den vanligaste formen av subjektivt test är ett lyssningstest, där ljudkomponenten helt enkelt används i det sammanhang som den är designad för. Detta test är populärt bland hi-fi-recensenter, där komponenten används under en längre tid av granskaren som sedan kommer att beskriva prestandan i subjektiva termer. Vanliga beskrivningar inkluderar om komponenten har ett ljust eller varmt ljud, eller hur väl komponenten lyckas presentera en rumslig bild .
En annan typ av subjektivt test görs under mer kontrollerade förhållanden och försöker ta bort eventuell fördom från lyssningstest. Dessa typer av tester görs med komponenten gömd för lyssnaren och kallas blindtester . För att förhindra eventuell bias från den som kör testet kan blindtestet göras så att denna person inte heller är medveten om komponenten som testas. Denna typ av test kallas ett dubbelblindtest. Denna typ av test används ofta för att utvärdera prestandan för ljudkomprimering med förlust .
Kritiker av dubbelblinda tester ser att de inte låter lyssnaren känna sig helt avslappnad när de utvärderar systemkomponenten och kan därför inte bedöma skillnader mellan olika komponenter såväl som i seende (icke-blinda) test. De som använder den dubbelblinda testmetoden kan försöka minska lyssnarens stress genom att tillåta en viss tid för lyssnarträning.
Tidiga digitala inspelningar
Tidiga digitala ljudmaskiner hade nedslående resultat, med digitala omvandlare som introducerade fel som örat kunde upptäcka. Skivbolagen släppte sina första LP-skivor baserade på digitala ljudmästare i slutet av 1970-talet. CD-skivor blev tillgängliga i början av 1980-talet. Vid den här tiden var analog ljudåtergivning en mogen teknologi .
Det var en blandad kritisk respons på tidiga digitala inspelningar som släpptes på CD. Jämfört med vinylskivor märktes det att CD var mycket mer avslöjande för akustiken och omgivande bakgrundsljud i inspelningsmiljön. Av denna anledning behövde inspelningstekniker utvecklade för analoga skivor, t.ex. placering av mikrofoner, anpassas för att passa det nya digitala formatet.
Vissa analoga inspelningar remastrades för digitala format. Analoga inspelningar gjorda i naturlig konsertsalsakustik tenderade att dra nytta av remastering. Remastringsprocessen kritiserades ibland för att vara dåligt hanterad. När den ursprungliga analoga inspelningen var ganska ljus, resulterade remastering ibland i en onaturlig diskantbetoning.
Super Audio CD och DVD-Audio
Super Audio CD- formatet (SACD) skapades av Sony och Philips , som också var utvecklarna av det tidigare standardformatet för ljud-CD. SACD använder Direct Stream Digital (DSD) baserat på delta-sigmamodulering . Med denna teknik lagras ljuddata som en sekvens av värden med fast amplitud (dvs 1-bitars) med en samplingshastighet på 2,884 MHz, vilket är 64 gånger samplingshastigheten på 44,1 kHz som används av CD. Vid vilken tidpunkt som helst representeras amplituden för den ursprungliga analoga signalen av densiteten av ettor eller nollor i dataströmmen. Denna digitala dataström kan därför omvandlas till analog genom att passera den genom ett analogt lågpassfilter.
DVD -Audio- formatet använder standard, linjär PCM med varierande samplingshastigheter och bitdjup, som åtminstone matchar och vanligtvis avsevärt överträffar standard CD-ljud (16 bitar, 44,1 kHz).
I den populära Hi-Fi-pressen hade det föreslagits att linjär PCM "skapar [en] stressreaktion hos människor", och att DSD "är det enda digitala inspelningssystemet som inte [...] har dessa effekter". Detta påstående verkar härröra från en artikel från 1980 av Dr John Diamond . Kärnan i påståendet att PCM-inspelningar (den enda digitala inspelningstekniken som fanns tillgänglig vid den tiden) skapade en stressreaktion vilade på att använda den pseudovetenskapliga tekniken för tillämpad kinesiologi , till exempel av Dr Diamond vid en AES 66th Convention (1980) presentation med samma titel. Diamond hade tidigare använt en liknande teknik för att visa att rockmusik (i motsats till klassisk) var dåligt för din hälsa på grund av närvaron av det "stoppade anapestiska slaget". Diamonds påståenden om digitalt ljud togs upp av Mark Levinson , som hävdade att medan PCM-inspelningar resulterade i en stressreaktion, gjorde inte DSD-inspelningar det. Ett dubbelblindt subjektivt test mellan högupplöst linjär PCM (DVD-Audio) och DSD avslöjade dock ingen statistiskt signifikant skillnad. Lyssnare som var inblandade i detta test noterade deras stora svårighet att höra någon skillnad mellan de två formaten.
Analog preferens
Vinylupplivandet beror delvis på det analoga ljudets ofullkomlighet, vilket tillför "värme" . Vissa lyssnare föredrar sådant ljud framför det på en CD. Grundaren och redaktören Harry Pearson på The Absolute Sound säger att "LP-skivor är betydligt mer musikaliska. CD-skivor dränerar själen från musik. Det känslomässiga engagemanget försvinner". Dubproducenten Adrian Sherwood har liknande känslor för det analoga kassettbandet, som han föredrar på grund av dess "varmare" ljud.
De som föredrar det digitala formatet pekar på resultaten av blindtester, som visar den höga prestanda som är möjlig med digitala inspelare. Påståendet är att det "analoga ljudet" mer är en produkt av felaktigheter i analoga format än något annat. En av de första och största anhängarna av digitalt ljud var den klassiska dirigenten Herbert von Karajan , som sa att digital inspelning var "definitivt överlägsen alla andra former av inspelning vi känner till". Han var också banbrytande för den misslyckade Digital Compact Cassette och dirigerade den första inspelningen någonsin som släpptes kommersiellt på CD: Richard Strauss Eine Alpensinfonie . Uppfattningen om att analogt ljud är bevisligen överlägset ifrågasattes också av musikanalytiker efter avslöjanden att audiofiletiketten Mobile Fidelity Sound Lab i hemlighet hade använt Direct Stream Digital- filer för att producera vinylsläpp som marknadsförts som att de kommer från analoga masterband, med advokaten och audiofilen Randy Braun säger att "De här människorna som hävdar att de har gyllene öron och kan höra skillnaden mellan analogt och digitalt, ja, det visar sig att du inte kunde."
Hybridsystem
Medan orden analogt ljud vanligtvis antyder att ljudet beskrivs med en kontinuerlig signalstrategi, och orden digitalt ljud antyder ett diskret tillvägagångssätt, finns det metoder för att koda ljud som hamnar någonstans mellan de två. Alla analoga system visar faktiskt diskret (kvantiserat) beteende i mikroskopisk skala. Medan vinylskivor och vanliga kompakta kassetter är analoga medier och använder kvasilinjära fysiska kodningsmetoder (t.ex. spiralspårdjup, bandets magnetiska fältstyrka ) utan märkbar kvantisering eller aliasing, så finns det analoga icke-linjära system som uppvisar effekter som liknar de som påträffas på digitala sådana, såsom aliasing och "hårda" dynamiska golv (t.ex. frekvensmodulerat hi-fi-ljud på videoband, PWM- kodade signaler).
Se även
Bibliografi
- Libbey, Ted (februari 1995). "Digital kontra analog: digital musik på CD regerar som branschstandard" . Omni . Vol. 17, nr. 5.
- Pohlmann, K. (2005). Principles of Digital Audio 5th edn, McGraw-Hill Comp.