spam w wyszukiwarce

Podobnie jak spam pocztowy, spamowanie wyników wyszukiwania jest równie uciążliwe dla użytkowników Internetu.
Efektem spamu jest zaśmiecanie wyników wyszukiwania bezwartościowymi stronami, a często nawet nie związanymi poszukiwaną frazą.
Spamowanie wyszukiwarek ma na celu głównie podniesienie pozycji własnej strony przez spamera. Obecność strony na pierwszych pozycjach w wyniku wyszukiwania popularnych fraz zapewnia dużą oglądalność serwisu co się zwykle przekłada na ilość sprzedawanych produktów lub usług.
Wyszukiwarki bronią się przed spamem, doskonaląc algorytm pozycjonujący, jest to w ich interesie, gdyż jeśli użytkownik nie znajdzie u nich czego szukał to może zmienić wyszukiwarkę na inną.
Praktycznie wszystkie wyszukiwarki oprócz własnego algorytmu korzystają z informacji otrzymanych od użytkowników. Każdy internauta, gdy zamiast oczekiwanych stron napotyka na bezsensowny spam, powinien to zgłaszać przez specjalne formularze. W przypadku stron specjalnie spreparowanych przez spamera jak doorway czy cloaking, reakcja jest natychmiastowa - strona jest usuwana z wyników wyszukiwania. W przypadku innych technik spamu raporty są rejestrowane, przy większej ilości zgłoszeń strona jest weryfikowana przez pracownika. Raporty o innych formach spamu są głównie wykorzystywane do statystyk i poprawy algorytmu wyszukiwarki.

Czym jest spam w wyszukiwarkach?

Według poradnika Google i innych wyszukiwarek, spamem jest wszystko co jest robione z myślą o wyszukiwarce, a nie o użytkowniku oglądającym stronę. Chodzi tu o wszelkie sztuczne techniki wprowadzenia robota w błąd, aby skuteczniej wypozycjonować swoją stronę.

Typowe formy spamowania:

  • Podstępne uzyskiwanie dużej ilości linków do swojej strony.
    Jest to najpopularniejsza technika, bo przynosi największe korzyści w pozycjonowaniu serwisów WWW. Wykorzystuje się tu fakt, że ranking w Google i wielu innych wyszukiwarkach obliczany jest na podstawie ilości linków prowadzących do strony i ich wartości. Teoretycznie taka zasada oceny strony powinna być wiarygodna, bo do ciekawych stron inni chętnie sami umieszczają odnośniki.

    Ten algorytm można jednak łatwo oszukać, samemu wstawiając linki do własnej strony na innych serwisach. Spamer linki uzyskuje podstępnie, np. wpisując bezsensowne odpowiedzi na forach dyskusyjnych, wpisy w cudzych księgach gości, blogach lub przez dodawanie ich na specjalnie tworzonych w tym celu stronach, które nie mają żadnej wartości, służą jedynie spamowaniu.

    Wyszukiwarki bronią się przed celowym podnoszeniem pozycji stron przez bezwartościowe linki, poprzez stosowanie dodatkowych parserów, wykrywających sztuczne linkowanie. Popularne dawniej farmy linków lub zasypane spamem katalogi, są banowane lub ich ranking jest tak obniżany, że linki z ich strony nie mają wartości, a czasami nawet szkodzą. Trzeba o tym pamiętać gdy dodaje się własną stronę do wielu katalogów, czasem efekt naszej pracy będzie znikomy lub nawet zaszkodzi stronie. Niedawno wprowadzono nowy atrybut nofallow opisujący link, jest to forma zabezpieczenia własnego forum, bloga lub księgi gości przed spemerskimi wpisami. Link z takim atrybutem nie podnosi wartości pozycjonowanej strony.
  • Brak wartościowej unikalnej treści.
    Szukając informacji w wyszukiwarce często na pierwszych pozycjach znajdujemy strony, które nie maja żadnej wartości. Jest to często bezsensowny bełkot nasycony słowami kluczowymi. Otwierając takie strony tylko tracimy czas. Ich autorzy wcale nie zamierzają pisać to nic ciekawego dla użytkowników tylko tworzą takie strony jako zaplecze dla pozycjonowania innych serwisów. Tworzenie setek stron zajęłoby wiele czasu, więc są to zwykle teksty generowane automatycznie z przypadkowych słów kluczowych lub kopiowane z innych stron z niewielką modyfikacją. Popularny dawniej spam w postaci dokładnie skopiowanych artykułów z innych serwisów jest już skutecznie usuwany z Googli i innych wyszukiwarek. Nowoczesny algorytm wykrywa nie tylko dokładne kopie ale i takie które są tylko nieznacznie zmienione. Kopiowane strony są usuwane z indeksu lub są dostępne tylko jako wynik uzupełniający wyszukiwania. Wiele stron jest tak dobrze spreparowanych, że robot nie jest w stanie rozpoznać spamu. Jedynym sposobem jest sprawdzanie przez człowieka stron zgłaszanych jako spam przez użytkowników.
  • Nieuczciwa optymalizacja strony.
    Każda strona oprócz treści widocznej dla użytkowników, ma też dodatkowe meta tagi czytane tylko przez roboty indeksujące. Ta część kodu strony była dawniej powszechnie wykorzystywana do umieszczania dodatkowych słów kluczowych. Obecnie niektóre tagi są ignorowane całkowicie, a inne są tylko częściowo czytane przez robota. Mimo to nadal spam ukrywany jest w źródle strony, np. w alternatywnym opisie obrazków, komentarzach i innych. Odmienną formą spamu jest umieszczanie niewidocznego tekstu w kolorze tła, na ukrytych warstwach lub pod obrazkami. Taka technika podstępnej optymalizacji jest nieopłacalna, bo wcześniej czy później konkurencja zgłosi naszą stronę jako spam lub jego obecność będzie powodem usunięcia z katalogu DMOZ, który ma istotny wpływ dla rankingu strony.
  • Cloaking
    Dawniej bardzo popularna forma oszukiwania robota indeksującego. Jest to druga wersja strony specjalnie przygotowana pod algorytm wyszukiwarki, oprócz robotów inni użytkownicy jej nie widzą. Efektem stosowania cloakingu jest lepsza pozycja w wyszukiwarce, jednak jest to bardzo ryzykowne, większość spamu jest wykrywana przez inteligentny algorytm lub usuwane po zgłoszeniach w raporcie spamu. Jest też pozytywna forma cloakingu, np. rozpoznanie wersji przeglądarki użytkownika i podstawienie właściwej wersji strony. Często ta forma przekierowania jest błędnie oceniana jako spam i strona może niesłusznie dostać ban.
  • Doorway
    Spam w postaci bezwartościowej strony, wypozycjonowanej na wybrane słowo kluczowe, który automatycznie przekierowuje na właściwa stronę. To bardzo nieuczciwa forma pozycjonowania, bo takich stron łatwo można dużo wygenerować i zaśmiecić nimi wyszukiwarki. Zgłoszenia tej formy spamu są szybko banowane, często usuwane są również domeny które maja wiele linków z takich doorweyów.

Zgłaszanie spamu

Raportowanie spamu jest w interesie użytkowników Internetu. Wprawdzie nie zawsze spotykamy się z reakcją na nasze zgłoszenie ale przy większej ilości raportów od wielu internautów, strona w końcu zostanie usunięta z indeksu lub otrzyma filtr na wybrane słowa kluczowe.
Każda wyszukiwarka udostępnia specjalny formularz w którym można opisać rodzaj spamu i podac adres strony.
W przypadku Google zgłaszać można tu: http://www.google.com/contact/spamreport.html