Direkt röstinmatning

Direkt röstinmatning ( DVI ), ibland kallad röstinmatningskontroll ( VIC ), är en typ av interaktion mellan människa och maskin där användaren gör röstkommandon för att ge instruktioner till maskinen genom taligenkänning .

Inom militärflyget har DVI introducerats i cockpits på flera moderna militärflygplan, såsom Eurofighter Typhoon , Lockheed Martin F-35 Lightning II , Dassault Rafale , KF-21 Boramae och Saab JAS 39 Gripen . Sådana system har också använts för olika andra ändamål, inklusive industrikontrollsystem och taligenkänningshjälp för funktionshindrade individer.

Översikt

DVI-system kan delas in i två huvudkategorier av funktionalitet: "användarberoende" eller "användaroberoende". Ett användarberoende system kräver att en personlig röstmall genereras för en specifik person; mallen för denna person måste laddas på den tilldelade maskinen innan DVI-systemet används för att det ska fungera korrekt. Däremot kräver ett användaroberoende system ingen personlig röstmall, eftersom den är avsedd att svara korrekt på någon användares röst. De kan också kategoriseras mellan "diskret igenkänning" och "kontinuerlig igenkänning". Användare av ett diskret igenkänningssystem måste pausa mellan varje ord så att DVI-systemet kan identifiera separationerna mellan varje ord, medan ett kontinuerligt taligenkänningssystem är kapabelt att förstå en normal talhastighet.

Under mitten av 2000-talet undersökte forskare vid National Aerospace Laboratory i Nederländerna användningen av DVI i "GRACE"-simulatorn; totalt tolv piloter deltog i det efterföljande experimentet. Testerna som utfördes avslöjade enligt uppgift att även om hårdvaran i sig fungerade bra, var flera förbättringar önskvärda innan den verkliga utbyggnaden på flygplan eftersom DVI-operationer faktiskt tog mer tid i jämförelse med traditionella befintliga metoder. Rekommendationer för förbättringar inkluderade antagandet av enklare syntax , uppnåendet av en högre igenkänningsfrekvens och en minskning av svarstider; alla de problem som uppstod ansågs vara av teknisk natur och ansågs möjliga att lösa. Forskarna drog slutsatsen att i cockpits, särskilt under nödsituationer där piloter måste operera helt på egen hand, kunde ett DVI-system vara högst relevant, men att det inte var av avgörande betydelse under de flesta andra tänkbara scenarier.

Ungefär samtidigt genomfördes utvärderingar av DVI-system för civila luftfartsändamål inom ramen för Project SafeSound, koordinerat av Europeiska Unionen . Det involverade observation av pilotens arbetsbelastning i verkliga cockpits och kontrasterande dem mot pilotaktivitet i flygsimulatorer som använder både konventionella system och DVI-assistans. Projektet syftade till att förbättra flygsäkerheten och minska arbetsbelastningen i både mark- och flygverksamhet genom tillämpning av förbättrade ljudfunktioner.

Ansökningar

Flyg

Före dess utbredda utplacering konverterades en handfull konventionella militärflygplan till test-DVI-system; exempel inkluderar Harrier AV-8B och F-16 VISTA . I ett annat fall modifierades en General Dynamics F-16 Fighting Falcon- simulator med DVI för en röststyrningsstudie som genomfördes av Royal Netherlands Air Force . DVI-försök har också utförts på helikoptrar , inklusive Boeing AH-64 Apache , som visar potentialen att förbättra flygsäkerheten och uppdragets effektivitet.

Många moderna stridsflygplan har utrustats med DVI-system, ofta i kombination med olika andra gränssnitt mellan människa och maskin, såsom HOTAS -kompatibla kontroller och andra avancerade kontrolltekniker. Kombinationen av röst- och HOTAS-kontrollscheman har ibland kallats "V-TAS"-konceptet. Ett framstående stridsflygplan som ska förses med en V-TAS-cockpit är Eurofighter Typhoon . Lockheed Martin F-35 Lightning II har också ett DVI-system, som utvecklats av Adacel . Andra exempel är Dassault Rafale och Saab JAS 39 Gripen .

Många flygplan har planerats att använda DVI. Vid ett skede United States Air Force försökt integrera DVI på Lockheed Martin F-22 Raptor ; dock bedömdes tekniken så småningom utgöra för många tekniska risker vid den tidpunkten, och därför övergavs sådana ansträngningar.

Personlig

År 1990 demonstrerades fungerande prototyper av taligenkänningssystem ; dessa marknadsfördes i syfte att tillhandahålla ett effektivt gränssnitt mellan människa och maskin för personer med nedsatt tal . Tekniker som användes var tidskodat digitalt tal och automatiskt val av tokenset . Undersökningar av dessa tidiga DVI-system inkluderade enligt uppgift användningen av automatiska diagnostiska rutiner och försök i begränsad skala med frivilliga.

Under 2010-talet erbjöd olika företag röstigenkänningssystem till allmänheten i form av personliga digitala assistenter . Ett exempel är Google Voice , som låter användare ställa frågor via ett DVI-paket installerat på antingen en persondator , surfplatta eller mobiltelefon . Många digitala assistenter har utvecklats, som Amazon Echo , Siri och Cortana , som använder DVI för att interagera med användare.

Kommersiell

DVI-tekniken har gjort det möjligt för automatiserade telefonsystem att användas i stor utsträckning. Många företag använder vanligtvis centraliserade telefonsystem som dirigerar uppringare till rätt avdelning via sådana metoder. Olika biltillverkare har också försett sina vägfordon med DVI-system; dessa tillåter vanligtvis förare att kontrollera infotainmentsystem och interagera med mobiltelefoner med mer bekvämlighet än äldre metoder.

Under slutet av 1980-talet pågick undersökningar av användningen av DVI-system för att styra CNC-maskiner och andra tillverkningsapparater. Under 2010-talet användes sådana system för logistik- och lagerhanteringsändamål.

  1. ^   Jarrett, DN (2005), Cockpit Engineering. Aldershot, Ashgate Publishing Limited ISBN 978-0-7546-1751-8 .
  2. ^ a b c d e "Röstigenkänning" . computerhope.com. 16 maj 2020.
  3. ^ Zon, DDR och Roerdink, MI, (2007), Using Voice to Control the Civil Flightdeck , Rapport NLR-TP-2006-720, (Denna rapport är baserad på en presentation som hölls på HCI Aero, Seattle, USA, 20– 22 september 2006). [1] Arkiverad 2016-03-04 på Wayback Machine
  4. ^ Steen, Weber; Jette, Lundtang Paulsen (8–10 maj 2006). "Workshop om framtida kontrollstationskonstruktioner och mänskliga prestandafrågor i kärnkraftverk" . Internationella atomenergiorganet (IAEA). s. 296–320.
  5. ^ a b   Gibbon, D,, Mertins, I. och Moore, RK (2000) "Handbok för multimodala och talade dialogsystemresurser, terminologi och produktutvärdering" (Springer International Series in Engineering and Computer Science, Vol. 565), Massachusetts, Kluwer Academic Publishers ISBN 978-0-7923-7904-1
  6. ^ Hunter, Donald James (december 2003). "Identifiering av flygbesättningens uppgifter för att använda direkt röstinmatning (DVI) för att minska pilotens arbetsbelastning i AH-64D Apache Longbow" . Magisteruppsatser . spåra.tennessee.edu.
  7. ^ Herdman, Chris., Johannsdottir, Kamilla., Lessard, Lynda., Jarmasz, Jerzy., Churchill, Laura och Farrell, Philip (januari 2001). "Uppmärksamma fördelar och kostnader förknippade med att integrera ett DVI-system (Direct Voice Input) i en helikoptermiljö med flera besättningar. " {{ citera webben }} : CS1 underhåll: använder författarens parameter ( länk )
  8. ^ Owen, Paul S. "Eurofighter cockpit." Eurofighter-typhoon.co.uk 7 december 1997. Hämtad: 28 november 2009. Arkiverad 28 augusti 2008 på Wayback Machine
  9. ^ Schutte, John (10 oktober 2007). "Forskare finjusterar F-35 pilot-flygplans talsystem" . af.mil . amerikanska flygvapnet. Arkiverad från originalet den 23 april 2016.
  10. ^ Goebel, Greg. "Lockheed Martin F-22 Raptor." airvectors.net, 1 juli 2011. Hämtad: 10 november 2012.
  11. ^ a b A.G. Warner, RD Hughes och RA King (1990). "En direkt röstinmatningsstrategi för gränssnitt mellan människa och maskin för att ge röståtkomst för starkt funktionshindrade högtalare" . UK IT 1990-konferens. s. 279–285. {{ citera webben }} : CS1 underhåll: använder författarens parameter ( länk )
  12. ^ JY Zhu och CG Xu (7 januari 1988). "En undersökning av röstinmatningssystem för CNC-verktygsmaskiner" . Cirp Annals . Nanjing Aeronautical Institute. 37 : 477-480. doi : 10.1016/S0007-8506(07)61681-3 . {{ citera journal }} : CS1 underhåll: använder författarens parameter ( länk )
  13. ^ "Röststyrda applikationer" . lucasware.com . Hämtad 9 augusti 2020 .

externa länkar