Anda mungkin familiar dengan teknologi PageRank Google. Google mempertimbangkan banyak variabel untuk menghitung PageRank dari website Anda. Ini adalah diskusi pada versi sangat sederhana dari PageRank.
Asumsikan bahwa kita peringkat situs web dengan jumlah dan kualitas link yang masuk. Kualitas sebuah link masuk didefinisikan sebagai fungsi dari PageRank dari situs yang link ke yang lain.
Mari kita ambil contoh. Gambar berikut ini menunjukkan bagaimana kelompok kecil situs Web link ke satu sama lain.

Perhatikan bahwa situs web F tidak mempunyai link masuk website sementara G tidak mempunyai link keluar.
Sekarang dari grafik yang diberikan link kita harus mengetahui (relatif) PageRank dari masing-masing situs. Awalnya kami akan mengasumsikan bahwa semua halaman yang sama memiliki PageRank. Sekarang kita menghitung jumlah link masuk ke situs masing-masing dan mengubah PageRank sesuai dengan jumlah link yang masuk.
Kami mendefinisikan PageRank dari situs A sebagai:
PR (A) =? PR (x) / L (x)
dimana L (x) = jumlah link keluar pada situs x
dan x menunjukkan situs yang terhubung ke A.
Ketika Anda menjalankan algoritma ini untuk pertama kalinya, PageRank dari semua halaman bisa diperbarui. Sekarang masalahnya adalah bahwa sejak PageRank dari semua halaman telah diperbarui masuk, kita harus kembali menghitung PageRank dari halaman lagi untuk mengambil nilai-nilai PageRank baru ke dalam pertimbangan. (Anda dapat memprediksi masalah ini hanya dengan melihat bahwa fungsi adalah satu rekursif) Permukaan masalah yang sama. Di setiap iterasi algoritma.
Pertanyaannya adalah bahwa jika perubahan PageRanks dalam setiap iterasi, bagaimana kita tahu kapan untuk menghentikan iterasi? Apakah PageRanks pernah stabil? (Istilah yang tepat adalah konvergensi).
Berikut ini adalah script python untuk mensimulasikan perhitungan PageRank berkali-kali berulang untuk mengetahui apakah nilai konvergen atau tidak. Nilai output direpresentasikan dalam persentase. (Google menganggap nilai ini sebagai probabilitas seseorang mengunjungi situs web tertentu).
Grafik di bawah ini menunjukkan bagaimana PageRank perubahan setelah setiap iterasi:

Seperti Anda dapat melihat PageRanks sangat berfluktuasi di iterasi awal dan kemudian mereka stabil. Ini berarti bahwa fungsi PageRank menyatu.
Lain berpikir untuk dicatat adalah bahwa node lebih menambah grafik tampaknya tidak mempengaruhi konvergensi. Bahkan jika Anda dua kali lipat jumlah situs dalam koleksi, jumlah iterasi yang diambil untuk berkumpul tetap hampir sama. Lain juga telah mencapai hasil yang sama (ppt). Fungsi PageRank adalah sama dengan arus listrik mengalir melalui sebuah mesh. Bahkan jika ada banyak node dan sumber-sumber itu arus stabil (dan stabil sangat cepat).
Juga mencatat bahwa situs D memiliki PageRank tertinggi, yang akan diharapkan karena memiliki link yang paling masuk. Situs F memiliki PageRank terendah karena tidak memiliki link masuk.
Menurut algoritma ini, menghubungkan ke situs lain tidak mengurangi PageRank dari website Anda. Ada masalah walaupun. Ambil contoh kasus situs G. Itu tidak link ke situs lain. Ini berarti bahwa PageRank tidak mengalir keluar dari situs G ke situs lain. Jika situs G terhubung ke situs lain, itu akan meningkatkan PageRank dari situs lain dengan sedikit. (Kasus ini hanya mempengaruhi link pertama yang keluar dari situs manapun). Untuk mengatasi masalah ini, membagi Google PageRank dari situs seperti ini (sink disebut) untuk semua situs lainnya. Anda juga mungkin ingin membaca tentang faktor redaman .
Sebelum meninggalkan dapat Anda menjelaskan mengapa PageRank dari situs A lebih besar daripada situs B?