Menu Content/Inhalt
Start
Patent PR PDF Drukuj
Oceny: / 0
KiepskiBardzo dobry 
13.08.2007.

We wrześniu 2001 roku PageRank został opatentowany – jednak nie przez Google Inc, ale przez Stanford University. Jednakże w związku z możliwością ‘oszukania’ algorytmu poprzez systemy wymiany linków oraz kupowanie linków, 31 marca 2005 został zatwierdzony patent na „system identyfikujący dokument oraz zbierający informacje powiązane z dokumentem, który może generować czynnik wartościujący dokument przynajmniej w części na podstawie jednego lub kilku typów informacji o dokumencie.”1

Podstawowym założeniem tego systemu jest klasyfikacja stron internetowych według ich wartości, obliczanej na podstawie informacji takich jak:

  • wiek strony

  • czas na jaki domena została zarejestrowana

  • wiek treści

  • częstość dodawania nowej treści

  • unikalność treści

  • wiek linków do strony i ‘reputacja’ stron linkujących

  • częstość pojawiania się nowych linków do strony

  • częstość usuwania linków do strony

  • standardowe elementy ‘on – site’

  • treść linków zewnętrznych

  • negatywne punkty za ‘złe linki do strony’

  • negatywne punkty za nadmierną ilość słów kluczowych

  • dane zebrane z Google Toolbar i innych źródeł

  • IP serwera – porównianie z innymi stronami na tym serwerze (jakość stron)

  • Jakość serwera (uptime, szybkość ładowania stron)

  • linki z innych stron – czy z tego samego IP (klasy IP)

  • poprawność kodu HTML

  • ilość kliknięć w dany link pośród wyników wyszukiwania


Nie można jednoznacznie stwierdzić, w jakim stopniu wymienione czynniki wpływają na pozycję strony w wynikach wyszukiwania – Google nie podają tego wprost, jednakże daje to już duże rozeznanie w sytuacji. Jak widać Google ‘lubią’ to co dobre dla zwykłego internauty – starsze strony najczęściej mają wartościową zawartość, jeśli ciągle istnieją, aczkolwiek liczy się też to, czy są one w jakiś sposób odświeżane. Ponadto, jeśli domena zarejestrowana jest na dłuży okres, świadczy to o poważnym podejściu właściciela domeny do strony. Stała częstotliwość pojawiania się linków do strony z kolei mówi, iż te linki pojawiają się w sposób naturalny (nikt ich nie kupuje), a jeśli strony na których te linki się pojawiają mają już dużą wartość oraz znajdują się na różnych serwerach, to dana strona musi być również ważna. Kwestie techniczne, takie jak poprawność kodu, czy też szybkość ładowania się strony wpływają na wygodę przeglądania strony przez użytkownika, więc Google zwracają również na to uwagę. W końcu dane zebrane z Google Toolbar czy z częstości kliknięć w dany link pośród wyników wyszukiwania pozwalają na lepsze wartościowanie strony, na podstawie tego co robią sami internauci. Jeśli, na przykład, z 10 wyników wyszukiwania, w jeden link użytkownicy klikają wyjątkowo często, znaczy to, że ta strona musi być lepsza od pozostałych, przynajmniej jeśli chodzi o jej opis w wynikach. Człowiek potrafi lepiej przefiltrować potrzebne informacje niż maszyna, którą można łatwiej oszukać.

1 United States Patent Application: 0050071741, March 31, 2005

Zmieniony ( 13.08.2007. )
 
następny artykuł »