Skrapplats

En scraper-sajt är en webbplats som kopierar innehåll från andra webbplatser med hjälp av webbskrapning . Innehållet speglas sedan med målet att skapa intäkter, vanligtvis genom annonsering och ibland genom att sälja användardata. Skrapplatser finns i olika former. Vissa tillhandahåller lite, om inget material eller information, och är avsedda att få användarinformation såsom e-postadresser, för att riktas mot spam-e-post. Prissammanställning och shoppingsajter får tillgång till flera listor över en produkt och låter en användare snabbt jämföra priserna.

Exempel på skraparwebbplatser

Sökmotorer som Google kan betraktas som en typ av skraparwebbplats. Sökmotorer samlar in innehåll från andra webbplatser, sparar det i sina egna databaser, indexerar det och presenterar det skrapade innehållet för sin sökmotors egna användare. Majoriteten av innehållet som skrapas av sökmotorer är upphovsrättsskyddat.

Skrapningstekniken har använts på olika dejtingsajter också. Dessa platser kombinerar ofta sina skrapaktiviteter med ansiktsigenkänning .

Skrapning används också på webbplatser för allmän bildigenkänning och webbplatser som är speciellt gjorda för att identifiera bilder av grödor med skadedjur och sjukdomar

Gjord för reklam

Vissa skrapsidor skapas för att tjäna pengar genom att använda reklamprogram. I sådana fall kallas de Made for AdSense- webbplatser eller MFA. Denna nedsättande term hänvisar till webbplatser som inte har något lösenvärde förutom för att locka besökare till webbplatsen i det enda syftet att klicka på annonser.

som är gjorda för AdSense betraktas som sökmotorskräp som späder ut sökresultaten med mindre tillfredsställande sökresultat. Det skrapade innehållet är överflödigt i förhållande till det som sökmotorn skulle visa under normala omständigheter om ingen MFA-webbplats hade hittats i listorna.

Vissa skrapsidor länkar till andra webbplatser för att förbättra sin sökmotorrankning genom ett privat bloggnätverk . Före Googles uppdatering av sin sökalgoritm, känd som Panda , var en typ av skraparwebbplats känd som en bilblogg ganska vanlig bland marknadsförare med svart hatt som använde en metod som kallas spamdexing .

Laglighet

Scraper-webbplatser kan bryta mot upphovsrättslagen . Även att ta innehåll från en öppen innehållswebbplats kan vara ett brott mot upphovsrätten , om det görs på ett sätt som inte respekterar licensen. Till exempel GNU Free Documentation License (GFDL) och Creative Commons ShareAlike (CC-BY-SA) licenser som används på Wikipedia att en återutgivare av Wikipedia informerar sina läsare om villkoren för dessa licenser och ger kredit till den ursprungliga författaren. [ originalforskning? ]

Tekniker

Beroende på syftet med en skrapa skiljer sig metoderna för inriktning på webbplatser. Till exempel kan webbplatser med stora mängder innehåll som flygbolag, hemelektronik, varuhus etc. rutinmässigt bli inriktade på sina konkurrenter bara för att hålla sig à jour med prisinformation.

En annan typ av skrapa hämtar utdrag och text från webbplatser som rankas högt för sökord som de har riktat in sig på. På så sätt hoppas de att rankas högt på sökmotorernas resultatsidor (SERPs), piggybacking på den ursprungliga sidans sidrankning . RSS- flöden är sårbara för skrapor.

Andra skrapsidor består av annonser och stycken av ord som valts slumpmässigt från en ordbok. Ofta klickar en besökare på en betala-per-klick- annons på en sådan webbplats eftersom det är den enda begripliga texten på sidan. Operatörer av dessa skrapplatser tjänar ekonomiskt på dessa klick. Annonsnätverk hävdar att de ständigt arbetar för att ta bort dessa webbplatser från sina program, även om dessa nätverk drar direkt nytta av de klick som genereras på den här typen av webbplatser. Ur annonsörernas synvinkel verkar nätverken inte anstränga sig tillräckligt för att stoppa detta problem.

Skrapare tenderar att förknippas med länkfarmar och uppfattas ibland som samma sak, när flera skrapor länkar till samma målwebbplats. En frekvent offerwebbplats kan anklagas för länkgårdsdeltagande, på grund av det konstgjorda mönstret av inkommande länkar till en offerwebbplats, länkad från flera skraparwebbplatser.

Domänkapning

Vissa programmerare som skapar skraparwebbplatser kan köpa ett nyligen utgått domännamn för att återanvända dess SEO-kraft i Google. Hela företag fokuserar på att förstå alla [ citat behövs ] förfallna domäner och använda dem för deras historiska rankningsförmåga. Om du gör det kommer SEO:are att kunna använda de redan etablerade bakåtlänkarna till domännamnet. Vissa spammare kan försöka matcha ämnet för den utgångna webbplatsen eller kopiera det befintliga innehållet från Internet Archive för att behålla webbplatsens äkthet så att bakåtlänkarna inte tappas. Till exempel kan en utgången webbplats om en fotograf omregistreras för att skapa en webbplats om fotograferingstips eller använda domännamnet i deras privata bloggnätverk för att driva sin egen fotosajt.

Tjänster hos vissa utgångna domännamnsregistreringsagenter ger både möjlighet att hitta dessa utgångna domäner och att samla HTML som domännamnet brukade ha på sin webbplats. [ citat behövs ]

Se även

  1. ^ Google "tog olagligt innehåll från Amazon, Yelp, TripAdvisor", visar rapporten
  2. ^ Denna app låter dig hitta personer på Tinder som ser ut som kändisar
  3. ^ Dejtingappschefen ser "inga problem" med ansiktsmatchning utan samtycke
  4. ^ Dating.ai-appen matchar dig med kändisliknande
  5. ^ Appen för ansiktsigenkänning matchar främlingar med onlineprofiler
  6. ^ NameTag: App för ansiktsigenkänning kritiseras som läskig och invasiv
  7. ^ Svep Buster
  8. ^ Stalkervänlig app, NameTag, använder ansiktsigenkänning för att leta upp dig online
  9. ^ Den här smarta (men oroande) appen låter dig rikta din telefon mot människor för att ta reda på vilka de är
  10. ^ Truly.am använder ansiktsigenkänning för att hjälpa dig att verifiera dina onlinedatum
  11. ^ 3 fascinerande sökmotorer som söker efter ansikten
  12. ^ Wolfram har skapat en webbplats som identifierar alla bilder du kastar på den
  13. ^ Maskininlärning hjälper småbönder att identifiera växtskadedjur och sjukdomar
  14. ^ Tillverkad för AdSense
  15. ^ "Text till GNU Free Documentation License" .
  16. ^ "Creative Commons Attribution-ShareAlike 3.0 Unported License" .
  17. ^ "Wikipedia: Återanvända Wikipedia-innehåll" .