Shelia Guberman
Shelia Guberman | |
---|---|
Född |
|
25 februari 1930
Medborgarskap | USSR , USA |
Vetenskaplig karriär | |
Fält | Kärnfysik , datavetenskap , geologi , geofysik , artificiell intelligens , perceptionspsykologi _ |
Shelia Guberman (född 25 februari 1930, Ukraina , USSR) är en vetenskapsman inom datavetenskap , kärnfysik , geologi , geofysik , medicin , artificiell intelligens och perception . Han föreslog D-vågsteorin om jordseismicitet , algoritmer för gestalt-perception (1980) och bildsegmentering , och program för teknologin för utforskning av olje- och gasfält (1985).
Liv och karriär
Han är son till Aizik Guberman (författare, poet) och hans fru Etya (lärare). Från 1947 till 1952 studerade Guberman vid Institute of Electrical Communications, Odessa, USSR, och tog examen i radioteknik. Från 1952 till 1958 arbetade han som fältgeofysiker i den sovjetiska oljeindustrin. Från 1958 till 1961 studerade han som doktorand vid Olje- och gasinstitutet i Moskva. 1962 disputerade han. i kärnfysik , följt av en doktorsexamen. i tillämpad matematik 1971. 1971 utsågs han till full professur i datavetenskap . Efter att ha skrivit det första tillämpade mönsterigenkänningsprogrammet 1962, specialiserade Guberman sig på artificiell intelligens som implementerade principer för gestaltuppfattning i datorprogram för geologisk dataanalys. 1966 blev han inbjuden av den enastående matematikern från XX-talet Prof. I. Gelfand att leda gruppen för artificiell intelligens vid Keldysh Institute of Applied Mathematics vid den ryska vetenskapsakademin. Han tillämpade mönsterigenkänningstekniken på jordbävningsförutsägelse , olje- och gasutforskning , handskriftsigenkänning , talkompression och medicinsk bildbehandling . Från 1989 till 1992 innehade Guberman professuren vid Moscow Open University (Geografiska institutionen). Sedan 1992 bor han i USA. Guberman är uppfinnaren av tekniken för handskriftsigenkänning som implementerats i den kommersiella produkten av företaget "Paragraph International" grundat av S. Pachikov och används idag av Microsoft i Windows CE. Han är författare till kärnteknologier för fem amerikanska företag och äger ett patent på talkompression.
Prestationer
Handskriftsigenkänning
Det vanliga tillvägagångssättet för datorhandskriftsigenkänning var datorinlärning på en uppsättning exempel (tecken eller ord) som presenterades som visuella objekt. Guberman föreslog att det är mer adekvat för den mänskliga perceptionens psykofysiologi att presentera manuset som ett kinematiskt objekt, en gest, dvs synergi av rörelser hos pennan som producerar manuset.
Handstilen består av 7 primitiver. Variationerna, som karaktärerna genomgår under skrivningen, begränsas av regeln: varje element kan endast omvandlas till sin nästa i den ordnade sekvensen av primitiver. Under utvecklingen av latinliknande skrift förvärvade motståndet mot naturliga variationer i karaktärsform: när en av primitiverna ersätts av sin granne ändras inte tolkningen av karaktären till en annan.
Baserat på detta tillvägagångssätt utvecklade två amerikanska företag Paragraph och Parascript de första kommersiella produkterna för online och offline gratis handskriftsigenkänning, som licensierades av Apple, Microsoft, Boeing, Siemens och andra. "De flesta kommersiellt tillgängliga programvara för naturlig handskrift är baserad på ParaGraph- eller Parascript-teknologi".
Hypotesen att människor uppfattar handstilen såväl som andra linjära ritningar (i allmänhet – kommunikationssignalerna) inte i visuell modalitet utan i motorisk modalitet bekräftades senare av upptäckten av spegelneuroner . Skillnaden är att i de klassiska speglingsfenomenen uppträder den motoriska responsen parallellt med den observerade rörelsen (”omedelbar handlingsuppfattning”), och under handskriftsigenkänningen omvandlas den statiska stimulansen till en tidsprocess genom att spåra pennans väg på papper. I båda fallen försöker observatören förstå korrespondentens avsikt: "förståelsen av vad personen gör och varför han gör det, förvärvas genom en mekanism som direkt omvandlar visuell information till ett motoriskt format".
Tal parallell kodning
Talet presenteras traditionellt som en tidssekvens av fonem - vokaler och konsonanter . Varje vokal bestäms huvudsakligen av förhållandet mellan volymstorlekarna på fram- och baksidan av röstkanalen. Förhållandet definieras av 1) tungans horisontella position (bakåt–bakåt), 2) läpparnas position (bakåt) och 3) storleken på svalget som kan förlänga röstkanalens hålighet långt bakåt. De flesta konsonanter kan beskrivas med 3 parametrar: 1) artikulationsställe (läppar, tänder och så vidare), 2) tidsmönster för interaktion med röstkanalen (explosiv eller inte) och 3) tonande eller ej tonande ljud. På grund av trögheten hos artikulationsorganen (tungan, läpparna, käken) stör alla fonem grannarna och ändrar dess ljud (samartikulation). Som ett resultat låter varje fonem olika i olika sammanhang. Guberman presenterar den parallella modellen för talproduktion. Den säger att vokaler och konsonanter genereras inte i sekvens utan parallellt . De två kanalerna hanterar två olika famlar av muskler, som tillsammans definierar röstkanalens geometri och röstsignalen. Separationen är möjlig eftersom genereringen av vokaler och konsonanter involverar olika muskler . För vokalerna [o], [u] styrs läpparna av musklerna Mentalis och Orbicularis Oris för utskjutande och rundning, och för [i], [e] av Buccinator och Risorius för att dra tillbaka läpparna. Tungan deltar i att skapa vokalerna genom att innervera Superior Longitudinell och Vertikal för att lyfta och för att flytta hela tungan fram och tillbaka, och Genioglossus för alla konsonanter artikulerade framtill i munnen )när käken är fixerad). För läppkonsonanten [p], [b], [v], [f] hanteras läpparna av Labii Inferioris och Orbicularis Oris muskler för att flytta läpparna och käken upp och ner och Zygomaticus Minor för att flytta underläppen bakåt för [v], [f]. Från hypotesen om parallell fonetisk kodning följer: 1. Eftersom vokalerna definieras som ett särskilt förhållande mellan främre och bakre volymer i röstkanalen, är vokalerna närvarande när som helst av talet (även under tystnad – den neutrala vokalen [ə] när ingen muskel i röstkanalen är innerverad).
2. Varje konsonant i tal visas på bakgrunden av en vokal. Den sista konsonanten i ordet, uttalas på bakgrunden av den neutrala vokalen [ə]. I kluster produceras konsonanterna parallellt med [ə] förutom den sista. Förr i rysk skrift måste efter konsonant i slutet av ordet skrivas ett specialtecken som betecknar den neutrala vokalen – Ъ (regeln upphävdes 1918).
3. Den korrekta skrivna koden för orden läsk och ord visas i (N) där antalet vokaler i stavelsen speglar vokalens relativa varaktighet. Sådan kodning används på hebreiska: i ordet יצֵירֵ (fred) betecknar två punkter under tecken vokal [e]). På arabiska har de två kanalerna olika funktioner: konsonantströmmen behåller betydelsen (roten), och vokalströmmen ändrar antingen rotens betydelse eller uttrycker en grammatisk kategori: kitab betyder "bok"; katib "författare"; ia-ktub-u "han skriver"; ma-ktab "skola".
Prospektering av gigantiska olje-/gasfält
På 70- och 80-talen utvecklade Guberman en programvara för artificiell intelligens och lämplig teknologi för geologiska tillämpningar, och använde den för att förutsäga platser för gigantiska olje-/gasfyndigheter.
År 1986 publicerade teamet en prognoskarta för att upptäcka gigantiska olje- och gasfält vid Anderna i Sydamerika baserad på teori om abiogent petroleumursprung. Den modell som föreslagits av Prof. Yury Pikovsky ( Moskva State University ) antar att petroleum rör sig från manteln till ytan genom permeabla kanaler som skapas i skärningspunkten mellan djupa förkastningar. Tekniken använder 1) kartor över morfostrukturell zonindelning (metod föreslagen och utvecklad av Prof. E.Rantsman), som beskriver de morfostrukturella noderna (korsningar av förkastningar), och 2) mönsterigenkänningsprogram som identifierar noder som innehåller gigantiska olje-/gasfält. Man förutspådde att elva noder, som inte hade utvecklats vid den tiden, innehåller gigantiska olje- eller gasfält. Dessa 11 platser täckte endast 8 % av den totala ytan av alla Anderna. 30 år senare (2018) publicerades resultatet av att jämföra prognosen och verkligheten. Sedan prognoskartan publicerades 1986 har endast sex gigantiska olje-/gasfält upptäckts i Anderna: Cano-Limon, Cusiana, Capiagua och Volcanera (Llanos-bassängen, Colombia), Camisea (Ukayali-bassängen, Peru) och Incahuasi (Chaco bassängen, Bolivia). Alla upptäckter gjordes på platser som visades på 1986 års prognoskarta som lovande områden.
Resultatet är övertygande positivt, och detta är ett starkt bidrag till stöd för abiogen teori om oljeursprung.
D-vågsteori
I mitten av 1900-talet lockades seismologernas uppmärksamhet av fenomenet med jordbävningskedjor som konsekvent uppstod längs stora förkastningar. Senare tolkades det som vågor av tektoniska spänningar. 1975 föreslog Guberman teorin om D-vågor som skiljer de lokala processerna av stressackumulering och utlösandet av jordbävningar. De grundläggande postulaten för denna teori är: a) en kraftig jordbävning förändrar fördelningen av massan i jordens kärna och följaktligen dess rotationshastighet ω; b) vid tidpunkter då ω når ett lokalt minimum inträffar störningarna vid båda polerna, vilka utbreder sig längs meridianerna med en konstant hastighet av 0,15°/år (D-vågor); c) En kraftig jordbävning inträffar på den plats där tektoniska spänningar har ackumulerats, och vid en tidpunkt då två D-vågor (från polerna N och S) har träffats vid den punkten. (Fig ).
Denna hypotes och dess konsekvenser stöddes av seismologiska data.
1. Postulatet c) presenteras vid diagrammet ( ) där φ är en latitud för en kraftig jordbävning och T är tidpunkten för dess inträffande. Varje linje presenterar en D-våg som reser jorden med konstant hastighet 0,15°/år och utlöser starka jordbävningar längs vägen. Prickarna visar den kraftiga jordbävningen på Aleuterna och Alaska (magnitut M ≥ 7,0). Liknande resultat visades för Kalifornien, sydöstra Europa, Mindre Asien, södra Chile, södra Sandwichön, Nya Zeeland, Frankrike och Italien. Sannolikheten att detta kan hända av en slump är < 0,025 i varje fall.
2. Källan till oregelbundenhet i jordens rotation kan vara en kraftig jordbävning, som förflyttade enorma massor av stenar, och
för att hålla jordens rotationsmoment konstant måste rotationshastigheten ω ändras. På grund av D-vågornas låga hastighet (0,15°/år) tar det mer än 200 år efter det att jordbävningen inträffade att nå de områden där jordbävningar inträffade. med magnitud M >8 förekomma. För att testa postulatet behövs b) mycket långa tidsintervall av seismologiska registreringar. I Kina har den seismiska historien dokumenterats under en mycket lång tid (från 180 e.Kr.). Tid-rymdrelationerna mellan de 6 starkaste dokumenterade jordbävningarna i Kina presenteras vid handlingen. Jordbävningen #1 skapade två D-vågor vid polerna. Den ena rör sig från Nordpolen och på 332 år utlöste jordbävningen #2; den andra vågen flyttar sig från sydpolen och på 858 år uppnådde platsen för jordbävningen #4, och så vidare (se grafen). Totalt är den genomsnittliga avvikelsen för positionen för D-vågen vid tidpunkten för händelsen och platsen för den utlösta jordbävningen 0,4°, vilket är mindre än felet vid bestämning av positionen för epicentrum för de historiska jordbävningarna. 3. Av hypotesen om D-vågor följer att epicentra för de starkaste jordbävningarna övervägande kan inträffa på de diskreta D-latituderna (90/2n)·i (i = 0, 1, 2, …), med n ≤ 5. För att testa detta påstående delades områdena med hög seismicitet på jorden i ränder parallella med D-latituder av storleksordningen <= 4 vardera 5,625° bredd (se kartan).
I 43 regioner inträffade jordbävningar med M ≥ 8,0, i varje region valdes den starkaste jordbävningen, och i 31 regioner är epicentrum för den starkaste jordbävningen belägen nära D-latituden, dvs belägen i randen runt D-latituden 1° bred. Randen är 1° bred och upptar 0,36 del av området för varje region, vilket är 5,625° bred. Om epicentra är slumpmässigt utspridda över var och en av de 43 regionerna, skulle det förväntade antalet epicentra, som kommer att inträffa nära D-latituden, vara 43 x 0,36 = 15, och sannolikheten för att 31 epicentrum kommer att vara belägen inuti remsan är mindre än 0,005.
Jordbävningarna är en väsentlig del av tektoniska rörelser på jorden. Det visades att starka jordbävningar inträffar i skärningspunkten mellan förkastningar - morfostrukturella noder. Det betyder att inte bara jordbävningarna är belägna nära D-breddgraderna, utan även de stora morfostrukturknutarna gör det. Genom att kombinera det med Prof Pikovskys hypotes att de morfostrukturella knutarna är rör som levererar oljan från manteln till jordskorpan, följer att stora olje-/gasfält också till övervägande del ligger på de diskreta D-latituderna. Det bevisades i, och lämplig parameter (avstånd till D-latitud) användes i sökandet efter gigantiska olje-/gasfält (se ovan). Det faktum att de kraftiga jordbävningarna inträffar på diskreta D-breddgrader påverkar den tektoniska konfigurationen av nätet av tektoniska förkastningar. Det visade sig också att i de morfostrukturella knutarna inträffar de flesta olyckor på olje-, gas- och vattenledningar och järnvägsräls.
Datormedicinsk diagnos
Två typer av behandling finns för patienter med hemorragiska stroke: passiv (medicinsk) och aktiv (kirurgisk). Prof. E. Kandel (en av pionjärerna inom kirurgisk behandling av hemorragiska stroke) vände sig till den framstående matematikern Prof. I. Gelfand för att få hjälp med att jämföra effektiviteten av dessa två behandlingar. Guberman valdes som huvudarkitekt för projektet. Först bestämde man sig för att ändra målet: istället för att välja den bästa behandlingen i allmänhet hitta den bästa behandlingen för en viss patient – konservativ eller operativ ("behandla patienten inte sjukdomen"). För detta beslutades att använda mönsterigenkänningstekniken som utvecklats tidigare för geologi (se ovan). Två beslutsregler måste utvecklas: 1) för att förutsäga resultatet (liv eller död) av den konservativa behandlingen av den specifika patienten, 2) för att förutsäga resultatet (liv eller död) av operationen av samma patient. Besluten baseras på neurologiska och allmänna symtom som samlats in under de första 12 timmarna efter att patienten anlänt till sjukhuset. De erhållna beslutsreglerna preliminärt testades under två år: de insamlade uppgifterna skickades till datorn och de två prognoserna (prognostiserade utfall av operationen och den konservativa behandlingen) placerades i patientjournalen. En månad senare jämfördes datorförutsägelserna med utfallen. Det övergripande resultatet – 90% korrekta förutsägelser. Sedan följde det kliniska genomförandet: datorbesluten skickades omedelbart till vakthavande kirurg som fattar det slutgiltiga beslutet. På fem år fick 90 patienter datorprognoser. I 16 fall rekommenderade datorn starkt operationen. 11 av dem opererades och överlevde. För 5 patienter försummades datorvarningen (av olika anledningar), och alla 5 dog . I 5 fall rekommenderades starkt att undvika operation. 3 av dem behandlades därefter och överlever, 2 av dem opererades i strid med dataråden och dog.
Positioner
- 1966–1991 chefsforskare, Keldysh Institute of Applied Mathematics , Moskva (Ryssland)
- 1989–1992: Ordförande professur, Russian Open University (Moskva), Institutionen för geografi.
- 1989–1997 chefsforskare, ParaGraph International, Campbell, CA, USA
- 1995–1996 gästforskare, Lawrence Berkeley National Laboratory , CA, USA
- 1998–2007 Grundare och VD, Digital Oil Technologies, Cupertino, CA, USA
Publikationer
Mer än 180 artiklar publicerade i vetenskapliga tidskrifter i Ryssland, USA, Frankrike, Tyskland, Italien och Österrike.
Utvalda nya artiklar om datavetenskap och psykologi :
- 2017: [1] , "Gestalt Theory Rearranged: Back to Wertheimer", i "Frontiers in Psychology", https://www.frontiersin.org
- 2015: "On Gestalt Theory Principles" , Gestalt Theory, 37 (1), 25 - 44.
- 2012 (med Vadim V. Maximov och Alex Pashintsev): "Gestalt and Image Understanding" , Gestalt Theory, 34 (2), 143 - 166.
- 2013: Kritisk granskning av Desolneux, Moisan & Morel (2008): From Gestalt Theory to Image Analysis. I: Gestalt Theory 35 (2), 183-206.
- 2008: Vad är «självorganisering»? Ett litet barns resa. 7:e kongressen för UES Systems Science European Union Lissabon, 17-19 december 2008.
- 2004: "Reflektioner över Ludwig Bertalanffys "General System Theory: Foundations, Development, Applications". Gestalt Theory, 26(1), 45 – 57.
- 2002: "Klusteranalys som ett gestaltproblem." Gestalt Theory, 24 (2), 143 – 158.
- 2001: "Reflections on M. Wertheimers "Productive Thinking": Lesson to Artificial Intelligence. Gestalt Theory, 23 (2).
Valt papper om tektonofysik :
- 1972: Guberman, Sh. (1972), "Criteria of high seismicity determined by pattern recognition.", Tectonophysics , 13 (1–4): 415–422 v.13, Bibcode : 1972Tectp..13..415G , doi : 10.1016-19510( 72)90031-5
Böcker:
- 1987: "Icke-formell dataanalys i geologi och geofysik", Nedra, Moskva.
- 1962: "Teori om likhet och tolkning av nukleär brunnsloggdatum", Nedra, Moskva.
- 2007: med Gianfranco Minati "Dialogue about Systems", Polimetrica, Italien. ISBN 978-8876990618
- 2009: "Oortodox geologi och geofysik. Olja, malmer och jordbävningar", Polimetrica, Italien. ISBN 978-8876991356
Källor om hans arbete
- Zueva E. (2009), "The history of computer vision in the Keldysh Institute of Applied Mathematics of the Russian Academy of Sciences", Mathematical Machines and Systems (4) http://www.immsp.kiev.ua/publications/articles /2009/2009_4/04_2009_Zueva.pdf
-
EMKudryavtsev, EFMaklyaev, SDZotov och AALebedev (2009), "Comparison of Hypotetical D-Waves of Planetary Scale, Causing Earthquakes in Sh.A.Guberman's Model, with Slow Solitary Elastic Waves (SSEWs) Discovered Experimentally", Lebedev Bullet Institute of the Physics . , 36 (9): 277–281, Bibcode : 2009BLPI...36..277K , doi : 10.3103/S106833560909005X , S2CID 121955600
{{ citat 1 namn }}
: s lista huvudlänk 1 CS : s - Joel N. Shurkin (1994), "Thoroughly Electronic Russian", San Jose Mercury News West Magazine , s. 8–12