Kaldi (mjukvara)

Kaldi
Utvecklare	Daniel Povey och andra
Stabil frisättning	Revision 3122 / oktober 2013 ; 9 år sedan
Förvar	https://github.com/kaldi-asr/kaldi
Skrivet i	C++
Operativ system	Unix- system ( Linux , BSD , OSX 10.{8,9} etc.), Windows (via Cygwin )
Typ	Taligenkänning
Licens	Apache-licens v.2.0
Hemsida	kaldi-asr .org

Kaldi är en öppen källkodsverktyg för taligenkänning skriven i C++ för taligenkänning och signalbehandling , fritt tillgänglig under Apache-licensen v2.0.

Kaldi strävar efter att tillhandahålla mjukvara som är flexibel och utbyggbar och är avsedd att användas av forskare med automatisk taligenkänning (ASR) för att bygga ett igenkänningssystem.

Den stöder linjära transformationer, MMI , boostad MMI och MCE diskriminerande träning , funktion-space diskriminerande träning och djupa neurala nätverk .

Kaldi kan generera funktioner som mfcc , fbank , fMLLR , etc. I den senaste forskningen om djupa neurala nätverk är en populär användning av Kaldi därför att förbearbeta rå vågform till akustiska funktioner för end-to-end neurala modeller.

Kaldi har införlivats som en del av CHiME Speech Separation and Recognition Challenge under flera på varandra följande evenemang. Mjukvaran utvecklades ursprungligen som en del av en workshop 2009 vid Johns Hopkins University .

Kaldi är uppkallad efter den legendariske etiopiske getskötaren Kaldi som sades ha upptäckt kaffeplantan .

Se även

externa länkar

Officiell hemsida
Kaldi – Det officiella GitHub- projektet
Så här börjar du med Kaldi och Taligenkänning - En guide angående de olika delarna av systemet
Kaldi paper - Kaldi Speech Recognition Toolkit
VOSK – öppen källkod och kommersiella modeller från Alpha Cephei på Kaldi-stiftelser