Archiwum dla luty, 2010

Wanted: Superman

08 lutego 2010 Opublikowany przez Niyaz PK w ramach programowania

Jakiś czas z powrotem, nie mogłem się powstrzymać wysyłania następujących odpowiedzi na to osoba w agencji pośrednictwa pracy:

Sandhya Szanowni Państwo,

Czy to żart? Czy ktoś naprawdę przejść przez tzw zleceń przed przekazaniem ich do mnie? Oni do mnie z prośbą do budowy dwóch pełnoprawnym stron internetowych w 12 godzin? Powodzenia znalezienia kandydatów, którzy mogą to zrobić.

BTW, czy można dostać kandydatów do tworzenia takich witryn dla ciebie, dlaczego trzeba ich zatrudnić? Muszę przyznać, że jest to doskonały sposób na uzyskanie prace wykonane za darmo.

Przykro mi. I nie rzeczywiście zainteresowany pracą w takiej spółki głupi.

(Dziękujemy za skontaktowanie mnie z ofertą chociaż. Naprawdę doceniam to. Daj mi znać, czy są otwory w spółkach, które nie szukają superman jako programista).

- Niyaz

Jestem powstrzymanie się od dwóch zadań związanych pytali mnie, aby zakończyć przed rozmową kwalifikacyjną. Nie bo nie chciał narażać rzeczywiste firmy, która próbuje oszukać mnie do budowy stron internetowych za darmo, ale dlatego, że po pojawieniu się wymogów, które będzie się wstydzić Facebook, będzie powodować nudności na resztę dnia .

4 odpowiedzi do tej pory

Przepływu PageRank

02 lutego 2010 Opublikowany przez Niyaz PK pod Internet , Math

Być może znasz z technologią PageRank Google. Google uważa, wiele zmiennych do obliczania PageRank witryny. To jest dyskusja na bardzo uproszczona wersja PageRank.

Załóżmy, że zajmujemy na stronach internetowych przez ilość i jakość linków przychodzących. Jakość przychodzących link jest zdefiniowana jako funkcja PageRank strony, które łączą z innymi.

Weźmy przykład. Poniższy rysunek pokazuje, jak mała grupa stron internetowych link do siebie.

Należy zauważyć, że F stronie nie ma żadnych link przychodzący podczas stronie G nie ma linku.

Teraz z grafu powiązań musimy dowiedzieć się (o) PageRank każdej strony. Wstępnie zakłada się, że wszystkie strony mają ten sam PageRank. Teraz obliczamy liczbę przychodzących linki do każdej witryny i zmienić PageRank według liczby przychodzących linków.

Definiujemy PageRank strony jak:

PR (A) =? PR (x) / L (x)

gdzie L (x) = liczba linków na stronie x

i X oznacza witryn z linkami do A.

Po uruchomieniu tego algorytmu po raz pierwszy, PageRank wszystkich stron aktualizowane. Teraz jest problem, że od PageRank wszystkich stron przychodzących zostały zaktualizowane, mamy do ponownego obliczenia PageRank strony ponownie do podjęcia nowych wartości PageRank pod uwagę. (Można przewidzieć ten problem po prostu zauważyć, że funkcja jest rekurencyjne jeden.) Ten sam problem w każdej powierzchni iteracji algorytmu.

Chodzi o to, że jeśli zmiana PageRanks w każdej iteracji, jak wiemy, kiedy przestać iteracji? Czy kiedykolwiek PageRanks stabilizacji? (Prawidłowe określenie jest konwergencji).

O to skrypt w języku Python do symulacji obliczania PageRank wiele razy w kółko, aby dowiedzieć się, czy są zbieżne wartości, czy nie. Wartości produkcji są przedstawiane jako procenty. (Google uważa tę wartość jako prawdopodobieństwo osobą odwiedzającą konkretnej stronie).

Poniższy wykres pokazuje jak zmienia się po każdej iteracji PageRank:

Jak widać PageRanks zmieniają wysoko w początkowej iteracji, a następnie ich stabilizacja. Oznacza to, że jest zbieżny PageRank funkcji.

Innym myśleć należy przypomnieć, że dodanie więcej węzłów do wykresu nie wydaje się wpływać na konwergencji. Nawet jeśli podwojenie liczby miejsc w kolekcji, liczba powtórzeń celu ujednolicenie pozostaje prawie taka sama. Inni również osiągnąć takie same wyniki (ppt). Funkcję PageRank jest analogiczny do prądu elektrycznego płynącego przez oczka. Nawet jeśli istnieje wiele węzłów i źródeł prądu stabilizuje (i stabilizuje się bardzo szybko).

Również zauważyć, że witryny D posiada najwyższą pozycję w rankingu, który należy się spodziewać, ponieważ ma najwięcej linków przychodzących. Strona F ma najniższy PageRank, ponieważ nie ma linków przychodzących.

Zgodnie z tym algorytmem, łącząc się do innych stron nie ograniczają PageRank witryny. Jest jednak problem. Take przypadku witryny G. Nie ma link do innej strony. Oznacza to, że PageRank nie jest wypływających z serwisu G innym miejscu. Jeżeli strony G związane z innych witryn, to wzrosły PageRank innych witryn o odrobinę. (Ta sprawa dotyczy tylko pierwszy link z jakiegoś serwisu). Aby rozwiązać ten problem, Google PageRank dzieli z takich witryn (pochłaniacze nazywa) do wszystkich innych stron. Można też poczytać o współczynnik amortyzacji .

Przed wyjazdem można wyjaśnić, dlaczego PageRank strony jest większa niż B stronie?

6 odpowiedzi do tej pory