Kaldi (mjukvara)
Utvecklare | Daniel Povey och andra |
---|---|
Stabil frisättning | Revision 3122 / oktober 2013
|
Förvar | https://github.com/kaldi-asr/kaldi |
Skrivet i | C++ |
Operativ system | Unix- system ( Linux , BSD , OSX 10.{8,9} etc.), Windows (via Cygwin ) |
Typ | Taligenkänning |
Licens | Apache-licens v.2.0 |
Hemsida |
Kaldi är en öppen källkodsverktyg för taligenkänning skriven i C++ för taligenkänning och signalbehandling , fritt tillgänglig under Apache-licensen v2.0.
Kaldi strävar efter att tillhandahålla mjukvara som är flexibel och utbyggbar och är avsedd att användas av forskare med automatisk taligenkänning (ASR) för att bygga ett igenkänningssystem.
Den stöder linjära transformationer, MMI , boostad MMI och MCE diskriminerande träning , funktion-space diskriminerande träning och djupa neurala nätverk .
Kaldi kan generera funktioner som mfcc , fbank , fMLLR , etc. I den senaste forskningen om djupa neurala nätverk är en populär användning av Kaldi därför att förbearbeta rå vågform till akustiska funktioner för end-to-end neurala modeller.
Kaldi har införlivats som en del av CHiME Speech Separation and Recognition Challenge under flera på varandra följande evenemang. Mjukvaran utvecklades ursprungligen som en del av en workshop 2009 vid Johns Hopkins University .
Kaldi är uppkallad efter den legendariske etiopiske getskötaren Kaldi som sades ha upptäckt kaffeplantan .
Se även
externa länkar
- Officiell hemsida
- Kaldi – Det officiella GitHub- projektet
- Så här börjar du med Kaldi och Taligenkänning - En guide angående de olika delarna av systemet
- Kaldi paper - Kaldi Speech Recognition Toolkit
- VOSK – öppen källkod och kommersiella modeller från Alpha Cephei på Kaldi-stiftelser