Medicinsk intelligens och språkteknisk lab
Medical Intelligence and Language Engineering Laboratory , även känt som MILE lab , är ett forskningslaboratorium vid Indian Institute of Science, Bangalore under Department of Electrical Engineering. Labbet är känt för sitt arbete med bildbehandling , handskriftsigenkänning online , text-till-tal och optiska teckenigenkänningssystem , som alla är fokuserade främst på dokument och tal på indiska språk . Labbet leds av AG Ramakrishnan .
Forskningsfokus
Ett av åtagandena för MILE lab är utvecklingen av teknik för personer med synnedsättning för att utnyttja kunskap från tillgängligt tryckt material på indiska språk. Labbet arbetar för att nå detta mål. Dess arbete hittills omfattade: dokumentmosaik av färgade, kamerafångade bilder; textextraktion från komplexa färgbilder, inklusive kamerafångade bilder; analys av dokumentlayout ; upptäckt av trasiga och sammanslagna tecken; OCR-teknik för Tamil och Kannada; text-till-tal-konvertering på tamil och kannada ; tonhöjdsmodifiering med användning av diskret cosinustransform i källdomänen; automatiserad del av talet taggning; frasprediktion och prosodimodellering.
Mozhi Vallan, den tamilska OCR- produkten utvecklad av MILE Lab, används av Worth Trust och Karna Vidya Technology Centre, Chennai för konvertering av tryckta skol- och högskoleböcker till punktskriftsformat . Sri Ramakrishna Math, Chennai använder det för att konvertera sina tryckta filosofiska böcker på tamil till datorläsbar text. Lipi Gnani, Kannada OCR som utvecklats av MILE Lab används av Braille Transcription Centers i Mitrajyothi och Canara Bank Relief & Welfare Society, Bangalore för liknande ändamål. Thirukkural, det tamilska TTS -systemet som utvecklats av MILE Lab, används också av vissa skollärare i Singapore för uppgifter. Madhura, Kannada TTS som utvecklats av labbet, används av två blinda studenter, integrerade med en skärmläsare , för att läsa högt text OCR'ad med Lipi Gnani från Kannada-böcker. För närvarande forskar labbet om maskinlyssning och en ny tidsfunktion som kallas plosionsindex har föreslagits, som har visat sig vara extremt effektiv för att upptäcka closure-burst-övergångar av stoppkonsonanter och affrikater från kontinuerligt tal, även i brus . En annan föreslagen funktion är DCTILPR, som är en röstkällabaserad funktionsvektor som förbättrar igenkänningsprestandan hos ett högtalaridentifieringssystem .
I början utfördes ett betydande arbete inom medicinsk signal- och bildbehandling. En unik algoritm föreslogs för EKG- kompression genom att behandla varje hjärtcykel som en vektor och tillämpa linjär förutsägelse på den diskreta wavelet-transformen av denna vektor, efter att ha normaliserat dess period med hjälp av multirate-behandlingsbaserad interpolation . Mognad av fosterlungan förutspåddes med hjälp av bildtexturegenskaper erhållna från lever- och lungregionerna på ultraljudsbilderna från gravida kvinnor . En effektiv teknik föreslogs för förlustfri komprimering av 3D -magnetresonansbilder av hjärnan . Varje MRI- skiva representerades av enhetligt eller adaptivt nät; affin transformation applicerades mellan motsvarande mesh-element av intilliggande skivor och kontextbaserad entropikodning , på resterna.