Utau

UTAU
Originalförfattare Ameya/Ayame
Utvecklare Ameya/Ayame
Initial release mars 2008 ; 15 år sedan ( 2008-03 )
Stabil frisättning
0.4.18(e) (Windows); 1.0.0 b18 (Mac) / 5 september 2013 ; 9 år sedan ( 2013-09-05 )
Skrivet i VB6
Operativ system
Windows 2000 / XP / Vista / 7 / 8 / 10 Mac OS X
Plattform Windows, Mac OS X
Tillgänglig i Japanska och engelska (och andra språk via patchfiler)
Typ
Applikation för musiksynthesizer (musiksequencer)
Licens Shareware (genom donationer)
Hemsida http://utau2008.xrea.jp/

UTAU är en japansk sjungande synthesizer -applikation skapad av Ameya/Ayame ( 飴屋/菖蒲) . Detta program liknar VOCALOID- programvaran, med skillnaden att det är shareware istället för under en tredje parts licensiering.

Översikt

I mars 2008 släppte Ameya/Ayame UTAU, ett gratis, avancerat supportverktyg för shareware- programvara som var gratis att ladda ner från dess huvudwebbplats. UTAU ( 歌う ), som betyder "att sjunga" på japanska, har sitt ursprung i aktiviteten "Jinriki Bōkaroido" ( 人力 ボーカロイド, Manual Vocaloid) , där människor redigerar ett befintligt sångspår, extraherar fonem, justerar tonhöjden och sätter ihop dem igen skapa en Vocaloid -lik sångröst. UTAU skapades ursprungligen för att hjälpa denna process med hjälp av konkatenativ syntes . UTAU kan använda WAV-filer som tillhandahålls av användaren, så att en sångröst kan syntetiseras genom att introducera sångtext och melodi. Den levereras med AQUESTs röstsyntes "AquesTalk" för att syntetisera röstsamplen från standardröstbanken, Utane Uta (även kallad Defoko ( Defoko betyder 'Default Girl' på japanska)) vid UTAU:s första lansering, varefter generatorn raderar sig själv. Röster gjorda för UTAU-programmet kallas också officiellt "UTAU", även om de i dagligt tal är kända som "UTAUloids", en referens till VOCALOID. De kallas också "röstbanker" (vanligare i engelsktalande områden) och "(röst)bibliotek" i Japan. Ett otaligt antal röstbanker har utvecklats av oberoende användare. Dessa röstbanker distribueras normalt direkt från deras skapare via internetnedladdning, men vissa säljs som en del av kommersiella projekt.

UTAU är mestadels ett japanskt program och därför är många av dess röster skapade specifikt för det japanska språket. Antalet tillgängliga språk har dock utökats av användarna. Engelska är ett vanligt språk för UTAU att sjunga på. Även om det finns ett stort antal tvåspråkiga UTAU, finns det också flerspråkiga UTAU som kan sjunga på tre eller fler språk. Ofta används X-SAMPA- format för engelska röstbanker. Men andra format baserade på X-SAMPA används också, såsom Cz Phonemes (eller C-ZAMPA) för vissa engelska VCCV-röstbanker. Oavsett röstens språk måste en användares dator vara i den japanska lokalen eller använda AppLocale för att kunna köra programvaran. Det mesta av dess dokumentation är på japanska, men användarhandboken har översatts till engelska. Programmets gränssnitt översattes till engelska av Ameya, och andra översättningar väntar fortfarande. Programmet kräver dock fortfarande stöd för japansk text.

UTAU:s projektfiler sparas under tillägget ".ust" (Utau Sequence Text). Dessa filer kan distribueras fritt, vilket gör att olika UTAU kan sjunga samma stycke. Det är viktigt att notera de riktlinjer som UST-skaparen har tillhandahållit när det gäller .ust:s distribution och användning. Producenterna har utvecklat flera metoder för att producera sina ljudbanker och resultatet för röstbankerna varierar på grund av detta. UTAU stöder även MIDI- format och .vsq-format.

Ameya/Ayame lade till stöd för Unicode i en outgiven nyare version av UTAU enligt skärmdumparna som publicerades på Twitter. Motsvarande backend support tail fix region såväl som flera andra ljudkodningar har redan släppts, medan frontend support ännu inte har släppts från och med september 2020. Ameya uppdaterade också UTAU för att vara kompatibel med 64-bitarssystem.

Konfiguration

Redaktören kan placera toner, mata in fonem och ändra tonhöjd och volym på pianorullen . Endast ett spår kan skapas i UTAU, och anteckningar kan inte placeras ovanpå varandra. Som standard visas endast toner på pianorullen, men displayinställningarna kan ändras för att visa tonhöjdskurvan, volymintensitet, envelope och flaggor. UTAU använder flaggor för att ändra aspekter av rösten, till exempel med lågpass- och högpassfilter, och för att minska eller lägga till andningsförmåga. Dessa flaggor skiljer sig beroende på vilken resampler som används. Poänginformation och data i röstbanken bearbetas med en resampler och wavtool baserat på poängen som skapats med editorn. Endast en resampler kan användas i en enda .ust-fil. Ett formantfilter används för att styra ändringar i röstkvalitet, som kan stängas av.

Ljudfilen som ska laddas i hittas genom att symbolerna på lappen matchas med ljudfilens namn i röstbiblioteket. Däremot kan en prefix.map-fil ändra vilken undermapp provet tas från. Tonhöjden för den syntetiserade rösten justeras efter skillnaden mellan den ursprungliga ljudfilen och tonhöjden i editorn. UTAU använder formantfilter för att förhindra extrema förändringar i röstkvalitet, som kan inaktiveras. Batchbearbetning används för att generera flera anteckningar samtidigt. Cachefiler skapas under denna process. Beroende på resamplern kan mängden cachefiler öka. Det finns inställningar i menyn för att radera cachefiler när programmet stängs, eller efter en viss tid.

Det finns inbyggda plugins som automatiskt kan slå samman vokaler, och "Omakase/A la carte"-inställningarna som kan lägga till automatisk tonhöjd och vibrato till en hel fil. Andra plugins skapade av användare kan läggas till i programvaran, som utför olika funktioner. Färgerna på redigeraren kan också ändras i filen setting.ini.

Röster

Som nämnts ovan kan WAV-filer portas till UTAU. Det kan finnas hundratals, eller i vissa fall tusentals, av dessa filer i en enda röstbank. Röster installeras genom att antingen placera dem i mappen "röst" eller genom att dra och släppa dem på UTAU-ikonen. Dessa bibliotek kommer också med en oto.ini-fil som bestämmer tidpunkten och konfigurationen för varje prov. När du matar ut ljud från partiturdata i editorn använder programmet oto.ini för att ställa in timing och uttal. Oto.ini-filer kan skapas med hjälp av UTAU:s grafiska användargränssnitt, eller i tredjepartsprogram som skapats av användare, det mest anmärkningsvärda av dessa tredjepartsprogram är SetParam. Frekvenstabeller (.frq-filer) används för att bearbeta vågformen när tonhöjden ändras i editorn. Vissa resamplers använder andra filtyper istället för .frq. Rösterna kan också komma med bildfiler som oftast är .bmp-formatet och fristående röstdialoger som vissa Vocaloids gör. De innehåller också ofta readme-filer som innehåller programvaruinformation och användarvillkor. Karaktärsinformationsfiler, vanligen ses som character.txt, ingår också ofta, som innehåller information som kan ses i avsnittet "Voice Preview" i det grafiska användargränssnittet som etiketterar röstbankens författare, namnet, en exempelfil som ska spelas upp på klick. av "sample"-knappen och Voicebank-bilden. Den kan också innehålla andra parametrar som anges av skaparen, såsom "genre".

Vissa röstbanker är monosyllabiska , kollektivt kallade "CV" (konsonant-vokal), medan andra använder trifoner för att producera ett mjukare ljud. Dessa trifoniska röstbanker kallas kollektivt för "VCV" (vokal-konsonant-vokal). Dessa tar betydligt mer tid och ansträngning att göra (är ungefär sju gånger så stor som en CV-röstbank, i termer av rader i filen oto.ini), men ger ett mer naturligt resultat.

Senare UTAU röster skulle inkludera fonem sammansatta av vokaler + konsonanter (VC) för att rymma andra språk än japanska. Metoder som använder detta inkluderar "CVVC" (där ett VC-fonem placeras mellan två CV-fonem), eller en systermetod "VCCV", som är baserad på CVVC, men innehåller några skillnader (differentiering mellan aspirerade och icke-aspirerade VC:er, konsonant klusterstöd etc.). "VCCV" heter hur det är för att skilja sig från skaparens tidigare CVVC-listor. Två mer ovanliga röstinspelningsmetoder är CVC, där ett fonem består av en konsonant-vokal-konsonant och delas upp i programmet genom att använda oto.ini, och en metod som kallas rentan-jutsu (れんたんじゅつ ) , där en serier av CV-stavelser spelas in i flera wav-filer för att skapa ett jämnare resultat utan att tillgripa full VCV.

Eftersom ljudfilerna är oberoende filer kan de användas i annan programvara som till exempel en DAW.

Utveckling

Utvecklingen av UTAU började när Ameya började använda Audacity för att kombinera samplingar av andra sångare, och Melodyne för att pitcha korrigera samplen och sätta dem till musik. Handlingen att göra detta kallades "mänsklig-driven VOCALOID". LOLI.COM, en musiker som postade sin egen rapmusik till Nico Nico Douga, använde sin egen röst för människodrivna Vocaloid och släppte ett ljudredigeringsprogram som kunde hjälpa användare att göra detsamma. Eftersom processen att göra "mänsklig driven VOCALOID" för hand tog en betydande mängd tid och ansträngning började Ameya utveckla ett nytt verktyg som skulle hjälpa processen.

Verktyget tillkännagavs på Nico Nico Douga den 11 januari 2008. Då var det möjligt att justera timingen för ljudet, ändra kuvertet på en anteckning och generera batchfiler. Den 5 februari 2008 släpptes en video som visar GUI. Här var det möjligt att tajma stretchprover, skapa oto.ini-filer och justera tonhöjdsböjningarna på tonerna. Den 5 mars 2008 släpptes en video som förklarar programmets specifikationer på Nico Nico Douga, och den 15 mars 2008 döptes verktyget om till UTAU.

Skaparen var programmerare till yrket och inte specialist på röstsyntes, men använde tidigare kunskaper för att skapa UTAU. Efter lanseringen fortsatte Ameya att förbättra UTAU och började utveckla den i samarbete med andra text-till-tal-utvecklare.

I juni 2008 avvisade Ameya etiketten "Jinriki Bōkaroido" ( 人力ボーカロイド , Manual Vocaloid) för UTAU, och kallade det istället mjukvara för sångröstsyntes.

Ljudfiler och upphovsrätt

Eftersom UTAU kan skapa en sångröst med hjälp av vilka WAV-filer som helst, är det möjligt att ta rösten från en befintlig person och använda den som data. Ofta kommer skådespelare, sångare och kändisar att få klipp av sina röster omändamål för användning i UTAU. Skaparen, Ameya, skapade en gång en röst med hjälp av data från en röstskådespelares CD.

I maj 2008 beslutade Ameya att sluta använda ljuddata utan tillåtelse tills vidare, om inte röstskådespelaren tillät det.

Kulturell påverkan

Kasane Teto
Teto Kasane illustration.png
Första framträdande UTAU
Designad av Sen (線)
Uttryckt av Nobuyo Oyama
Information i universum
Fullständiga namn 重音テト ( Kasane Teto )

Även om programvaran är mycket populär i Japan, beror dess ursprung och kulturella inverkan på Vocaloids redan etablerade popularitet. UTAU själv blev först berömd när skaparen av Kasane Teto släppte karaktären som poserade som en Vocaloid-karaktär som en del av ett aprilskämt 2008. Inflytandet från Vocaloid-mjukvaran ledde också till att båda programmen ofta användes sida vid sida. Ofta dyker populära UTAU-maskoter som Kasane Teto upp i VOCALOID-baserade medier som Maker Hikōshiki Hatsune Mix eller Hatsune Miku: Project DIVA .

Senare skulle UTAU-mjukvaran ha sin egen inverkan på Vocaloid och andra sångsyntar, med ett antal sång som antingen refererar till UTAU eller produceras för motorn till att börja med. Till exempel Megurine Luka V4x influerad av UTAU-sången Gahata Meiji. Wat från Crypton Future Media pratade också med någon som är mycket bekant med UTAU och sa att samtalet var "mycket intressant". Macne Nana från Macne-serien skulle senare bli både en UTAU-röst och en Vocaloid-röst. Röstleverantören för engelska Vocaloid Ruby , Misha, hade tidigare producerat en japanskspråkig UTAU vid namn Makune Hachi ( MAKU音ハチ) . Dessutom skapade sångaren för Dex, Kenji-B, Kenji Baionoto ( 倍音音ケンジ ) för UTAU, och AkiGlancy, vokalisten bakom Dex partner Daina, gav sin röst till UTAU Namida ( ナミダ ) . Kikuko Inoue , röstskådespelerskan i Macne Coco White and Black ( Mac音ココ白・黒 ) (se Macne-serien ) fortsatte med att rösta en Vocaloid5-produkt vid namn Haruno Sora ( 桜乃そら ). Produkten kom med två röstbanker, Natural och Cool. Efter släppet av Vocaloid 3- sången Tohoku Zunko fick hennes två systrar Tohoku Itako och Tohoku Kiritan UTAU-sång. Kiritan skulle senare hålla en crowdfunding- kampanj för att hon skulle bli en Voiceroid . Förutom dess inflytande på Vocaloid, har UTAU fungerat som en utvecklingsstartplatta för andra kommersiella sångröstsyntar. Den mest anmärkningsvärda av dessa är Dreamtonics' Synthesizer V, som sprungit från utvecklingen av UTAU resampler känd som Moresampler, som båda utvecklades av Kanru Hua.

Dess främsta attraktion är inte bara baserad på att den distribueras fritt på internet, utan för att den gjorde det möjligt för en användare att infoga sin egen röst i databasen för användning för musik, vilket öppnade dörrarna för användare att vidareutveckla sin egen musik. UTAU tackar sin växande popularitet till sin förmåga att tillhandahålla en gratis metod för att skapa röster för musikanvändning och har etablerat många musikproducenter som arbetar med programvaran på sajter som Nico Nico Douga och YouTube . Användare ser det också som ett alternativ till Vocaloid-mjukvaran, som bara erbjuder ett mer begränsat utbud av röster till ett högt pris och kanske inte erbjuder de rösttyper de söker för musik, eftersom den stora databasen med röster ofta har en mycket större chans. att erbjuda den röst de söker. Men trots antalet röstbanker som erbjuds har programvaran totalt sett mycket färre producenter som arbetar med den än Vocaloid.

En radiostation satte upp ett 1-timmesprogram som inte innehåller något annat än Vocaloid och UTAU-baserad musik.

Dessutom hölls ett evenemang kallat The UTAU M@STER regelbundet från och med den 19 juli 2012. Evenemanget var den huvudsakliga sammankomsten av grupper eller cirklar och hölls på ett liknande sätt som det Vocaloid-relaterade evenemanget, THE VOC@LOID M@STER, som hade funnits sedan 2007.

Relaterad programvara

Till skillnad från Vocaloid är UTAU-filer inte begränsande eftersom det inte är en proprietär baserad licens. Därför är det möjligt att använda open source-licensprodukter med UTAU-mjukvaran, såsom de som producerats för Macne-serien ( Mac音シリーズ ) , släppta för programmen Reason 4 och GarageBand . Dessa produkter såldes av Act2 och genom att konvertera deras filformat kunde de även fungera med UTAU-programmet. Senare kom Macne-paketen Whisper☆Angel Sasayaki, Macne Nana 2S och Macne Petit 2S med förbyggda UTAU-röstbanker.

Standardröstbanken "Defoko" (Utane Uta) lånar hennes röst från programvaran AquesTalk, närmare bestämt rösten "AquesTalk Female-1" producerad av A-quest. Tillstånd hade beviljats ​​för hennes distribution gratis med programvaran. Utane Koe, Utas "syster", lånar också sin röst från programvaran AquesTalk. Namine Ritsu ( 波音リツ ), en sång som ursprungligen byggdes för UTAU, lades också senare till en annan mjukvara kallad Sinsy som Namine Ritsu S. En annan sång som ursprungligen utvecklades för UTAU-programvaran, Yamine Renri ( 闇音レンリ ), kom också senare lagt till i Synthesizer V.

På grund av programvarans eget upphovsrättsavtal är icke-öppna licensprogram som VOCALOID inte tillåtna att importeras till UTAU-programvaran. Ett antal plug-ins för programvaran har också utvecklats av användare av programvaran som lägger till och förbättrar sång i programvaran. Programvaran Sugarcape, baserat på samma freeware-intention som UTAU, har redan gått in i betastadiet. Det fanns en officiell Mac-version av UTAU släppt den 27 maj 2011, med namnet UTAU-Synth. Den har ungefär samma funktioner som Windows-versionen. UTAU-Synth-versionen kan importera både röster och låtar gjorda med Windows-versionen, men dess projektfiler och röstbankskonfigurationer är inte helt kompatibla med Windows-versionen. I slutet av 2017 nämndes det att Plogue Art et Technologie, Inc. hade en fungerande omdirigeringsanpassning som skulle få UTAU-sång att dyka upp i dess motor Alter/Ego .

OpenUTAU är en inofficiell efterföljare med öppen källkod till UTAU utvecklad av Vocaloid-producenten StAkira, med en betaversion som släpptes i november 2021. Mjukvaran designades för att vara kompatibel med UTAU men med en modern användarupplevelse. Till skillnad från UTAU kräver det inte en japansk systemlokal för att fungera korrekt.

Användning i musik

De licensierade låtarna från albumet Graduation from Lie , med Kasane Teto, släpptes för nedladdning av musik från Karen-T, under Crypton Future Media , som en specialutgåva. Detta är den första licensierade utgåvan av någon UTAU.

Röstbiblioteket Momo Momone används i den virala YouTube-videon " Nyan Cat ". Det är en cover på "Nyanyanyanyanyanya!", en låt som ursprungligen komponerades av daniwellP och använder VOCALOID Hatsune Miku . [ citat behövs ]

Se även

externa länkar