Speechbot
SpeechBot var en webbsökmotor för strömmande mediainnehåll utvecklad vid Compaqs (senare HP ) forskningslaboratorier i Cambridge, MA och Australien . Compaq lanserade webbplatsen på Streaming Media West 1999 i San Jose, CA. Internetradioprogrammen indexerade av SpeechBot inkluderade The Motley Fool , Fresh Air , Talk of the Nation , The Dr. Laura Program och Dreamland with Art Bell . I juni 2003 hade tjänsten indexerat över 17 000 timmar multimediainnehåll. Webbplatsen togs offline 2005, efter att HP stängde sitt forskningslabb i Cambridge.
SpeechBot-indexeringsarbetsflödet involverade en farm med Windows -arbetsstationer som hämtade strömmande innehållet; och ett Linux- kluster som kör taligenkänning för att transkribera det talade ljudet. Webbservern , sökindexet och metadatabiblioteket var värd på AlphaServers som körde Tru64 UNIX .
Om transkriptioner redan var tillgängliga, var dessa anpassade till ljudströmmen; annars producerades en ungefärlig transkription med hjälp av taligenkänning. Calista-igenkännaren som användes härleddes från Sphinx-3 . På grund av den låga kvaliteten på strömmande ljud vid den tiden ordfelfrekvensen ganska hög, men de flesta sökningar kunde fortfarande hämta relevanta träffar. Sökresultaten länkade till den offset i strömmen som motsvarade sökfrasen, så att användarna inte behövde lyssna på hela programmet för att hitta avsnittet av intresse.
Vidare läsning
-
Swain, Michael J. (mars 1999). "Söka efter multimedia på World Wide Web" (PDF) . Compaq teknisk rapport . CRL 99/1. Arkiverad från originalet den 31 oktober 2005.
{{ citera journal }}
: CS1 underhåll: unfit URL ( länk ) -
Eberman, B.; Fidler, B.; Iannucci, RA; Joerg, C.; Kontothanassis, L.; Kovalcin, DE; Moreno, P.; Swain, MJ; Van Thong, JM (mars 1999). "Indexering av multimedia för Internet" . Compaq teknisk rapport . CRL 99/2. Arkiverad från originalet den 20 mars 2006.
{{ citera journal }}
: CS1 underhåll: unfit URL ( länk ) - Dufaux, F.; Eberman, B.; Kontothanassis, L.; Moreno, P.; Swain, M.; Weikart, C. (mars 1999). "Ett system för indexering av webbmultimedia". Compaq teknisk rapport . CRL 99/3.
-
Kontothanassis, Leonidas; Joerg, Chris; Swain, Michael J.; Eberman, Brian; Iannucci, Robert A. (augusti 1999). "Designimplementering och analys av en multimediaindexerings- och leveransserver" . Compaq teknisk rapport . CRL 99/5. Arkiverad från originalet den 20 mars 2006.
{{ citera journal }}
: CS1 underhåll: unfit URL ( länk ) - Moreno, PJ; Van Thong, J.-M.; Logan, B.; Jones, GJF (1 januari 2002). "Från multimediahämtning till kunskapshantering". Dator . 35 (4): 58–66. doi : 10.1109/MC.2002.993772 .
- Van Thong, J.-M.; Moreno, PJ; Logan, B.; Fidler, B.; Maffey, K.; Moores, M. (mars 2002). "Speechbot: en experimentell talbaserad sökmotor för multimediainnehåll på webben" ( PDF) . IEEE-transaktioner på multimedia . 4 (1): 88–96. doi : 10.1109/6046.985557 .
- Logan, Beth; Goddeau, Dave; Van Thong, Jean-Manuel (mars 2005). "Verkliga ljudindexeringssystem". Proc. ICASSP'05 . 5 : 1001–1004. doi : 10.1109/ICASSP.2005.1416475 . ISBN 0-7803-8874-7 .
- Olsen, Stefanie (27 maj 2004). "Sökmotorer försöker hitta sitt ljud" . CNET Nyheter . Hämtad 18 juni 2012 .