Indexering av latent semantisk struktur

Latent semantisk strukturindexering ( LaSSI ) är en teknik för att beräkna kemisk likhet härledd från latent semantisk analys ( LSA).

LaSSI utvecklades på Merck & Co. och patenterades 2007 av Richard Hull, Eugene Fluder, Suresh Singh, Robert Sheridan, Robert Nachbar och Simon Kearsley.

Översikt

LaSSI liknar LSA genom att det involverar konstruktionen av en förekomstmatris från en korpus av objekt och tillämpningen av singulärvärdesuppdelning på den matrisen för att härleda latenta egenskaper. Det som skiljer sig är att förekomstmatrisen representerar frekvensen av två- och tredimensionella kemiska deskriptorer (snarare än naturliga språktermer) som finns i en kemisk databas med kemiska strukturer. Denna process härleder latenta kemiska strukturkoncept som kan användas för att beräkna kemiska likheter och struktur-aktivitetssamband för läkemedelsupptäckt .

  • Hull, RD, Fluder, EM, Singh, SB, Nachbar, RB, Sheridan, RP och Kearsley, SK (2001) "Latent semantisk strukturindexering (LaSSI) för att definiera kemisk likhet." J Med Chem, 2001 apr 12;44(8):1177–84. doi : 10.1021/jm000393c
  • Hull, RD, Singh, SB, Nachbar, RB, Sheridan, RP, Kearsley, SK och Fluder, EM (2001) "Kemiska likhetssökningar med hjälp av latent semantisk strukturindexering (LaSSI) och jämförelse med TOPOSIM." J Med Chem, 2001 apr 12;44(8):1185-91.
  • Singh, SB, Sheridan, RP, Fluder, EM och Hull, RD (2001) "Utvinning av kemisk stenbrott med gemensamma kemiska sonder: en tillämpning av latent semantisk strukturindexering (LaSSI) och TOPOSIM (Tärning) till kemisk databasbrytning." J Med Chem, 2001 maj 10;44(10):1564–75.