تدفق الموقع

2 فبراير 2010

قد تكون على دراية تقنية تصنيف الصفحة جوجل. جوجل ترى الكثير من المتغيرات لحساب الموقع من موقع الويب الخاص بك. هذا هو النقاش حول صيغة مبسطة للغاية من الموقع.

نحن نفترض أن ترتيب المواقع حسب عدد ونوعية الروابط واردة. يتم تعريف الجودة على وجود صلة واردة بوصفها وظيفة من الموقع للموقع الذي ربط إلى أخرى.

ولنأخذ مثالا على ذلك. الشكل التالي يوضح كيف يمكن لمجموعة صغيرة من مواقع الارتباط مع بعضها البعض.

لاحظ أن واو الموقع ليس لديها أي صلة واردة أثناء زاي الموقع ليس لديها أي صلة المنتهية ولايته.

الآن من الرسم البياني نظرا للروابط لدينا لمعرفة (النسبية) الموقع في كل من المواقع. في البداية سوف نفترض أن كل الصفحات لديها نفس الموقع. الآن نحن نعول على عدد من الوافدين وصلات إلى كل موقع وتغيير الموقع وفقا لعدد من وصلات واردة.

نحدد الموقع من موقع وعلى النحو التالي :

العلاقات العامة (أ) =؟ العلاقات العامة (خ) / لتر (خ)

حيث لام (س) = عدد من الروابط المنتهية ولايته في موقع س

و... يدل على المواقع التي تربط لA.

عند تشغيل هذه الخوارزمية لأول مرة ، والحصول على تحديث الموقع من كافة الصفحات. والمشكلة الآن هي أنه منذ الموقع من كافة الصفحات الواردة قد تم تحديثها ، لدينا لإعادة حساب على الموقع من الصفحات مرة أخرى لأخذ قيم الموقع الجديد بعين الاعتبار. (يمكنك التنبؤ هذه المشكلة فقط من خلال ملاحظة أن الوظيفة هي واحدة متكررة.) والسطوح نفس المشكلة في كل التكرار من الخوارزمية.

والسؤال هو أنه إذا كان التغيير في كل PageRanks التكرار ، كيف لنا أن نعرف متى نتوقف عن التكرار؟ هل PageRanks استقرار من أي وقت مضى؟ (هذا المصطلح الصحيح هو التقارب).

وهنا برنامج نصي الثعبان لمحاكاة حساب الموقع عدة مرات وعلى مدى أكثر لمعرفة ما إذا كانت تتلاقى القيم أم لا. وتتمثل قيم الناتج كنسبة مئوية. (جوجل تعتبر هذه القيمة واحتمال وجود شخص زيارة أي موقع معين).

الرسم البياني ادناه يبين كيف أن التغييرات الموقع بعد كل التكرار :

وكما ترون في PageRanks تتقلب بشكل كبير في التكرار الأولية وبعد ذلك تحقيق الاستقرار. وهذا يعني أن يتقاطع الموقع وظيفة.

أعتقد آخر هو أن نلاحظ أن إضافة المزيد من الفروع في الرسم البياني لا يبدو أن يؤثر على التقارب. حتى لو كنت مضاعفة عدد المواقع في المجموعة ، وعدد من التكرارات التي اتخذت لتتلاقى يبقى نفسه تقريبا. كما تم التوصل إليه آخرون لديهم نفس النتائج (جزء لكل تريليون). وظيفة الموقع هو مماثل لتدفق التيار الكهربائي من خلال شبكة. حتى لو كان هناك الكثير من العقد والمصادر ، واستقرار تدفق التيار (واستقرار سريع حقا).

لاحظ أيضا أن مد موقع يحتوي على أعلى تصنيف صفحات ، وهو أمر متوقع لأنه يحتوي على وصلات أكثر واردة. موقع واو لديه أدنى الموقع لأنه ليس لديها روابط واردة.

ووفقا لهذه الخوارزمية ، وربط إلى مواقع أخرى لا تقلل على الموقع من موقع الويب الخاص بك. هناك مشكلة مع ذلك. ولنأخذ حالة موقع غ لا تصل إلى أي موقع آخر. وهذا يعني أن الموقع لم يعد يتدفق من موقع مجموعة إلى أي موقع آخر. إذا موقع مجموعة مرتبطة بمواقع أخرى ، لكان قد زاد على الموقع من المواقع الأخرى من قبل صغيرة قليلا. (وهذه القضية لا تؤثر إلا في أول وصلة من أي موقع). لحل هذه المشكلة ، وجوجل يقسم الموقع من المواقع مثل هذه المصارف (تسمى) لجميع المواقع الأخرى. قد تحتاج أيضا لقراءة التخميد عامل .

وقبل مغادرته يمكنك تفسير سبب الموقع من موقع وأكبر من أن باء الموقع؟

5 ردود حتى الآن

  • كيفن يقول :

    الخوارزمية يدل على مدى عدد من الوافدين وصلات يمكن أن تؤثر على رتبة صفحة من موقع. ولكن ماذا عن نوعية أي عدد الزوار الى المواقع التي بها وصلات إلى الموقع. أين هذا الرقم في هذا؟

  • Niyaz بك وتقول :

    كما قلت من قبل ، وهذا هو شكل مبسط للغاية من الخوارزمية الموقع الأصلي. غوغل (والآخرين الذين يستخدمون خوارزميات مشابهة) اتخاذ العديد من العوامل الأخرى (كثافة الكلمات الرئيسية ، والمرور ، الخ سن المجال) في الاعتبار لحساب الموقع من صفحة ويب.

    أما وقد قلت ذلك ، أود أن أشير إلى أن لدينا نسخة من الخوارزمية في الواقع لا تأخذ نوعية الروابط في الاعتبار! في كل حلقة من التكرار ، وتؤخذ على الموقع (من التكرار السابق) من روابط واردة في الحسبان. الموقع (حسب التعريف الوارد في المادة) يرتبط إلى حركة المرور في الموقع.

  • [...]أوه. الآن أود أن أقول إنني وعلى الصفحة الاولى يسو ، أو ان كنت قد retweeted فيروسي بين عشية وضحاها ، ولكن أنا لست محظوظا بهذا الشكل. سأكون إعادة تنظيم مكتبي ، وتغيير هيكل شبكة بلدي في هذه العملية. لقد نسيت للتحقق من حالة خدمة بلدي الذي هو بعد ذلك خطأ كبيرا وأنا محاولة لزيادة تصنيف الصفحة بلدي. [...]

  • سيمون يقول :

    جدا للاهتمام.

    ويبدو كما لو الخوارزمية يتقاطع مع ألف باء> لأن الجميع لا تصل إلى أي شيء. ونتيجة لذلك ، على كل مرور ، يتم فقدان بعض من تصنيف الصفحة مجموع (أي التي يتم جمعها من قبل الجميع ، ولكن ليس إعادة توزيعها مرة أخرى في الشبكة -- لم يتم حل هذا عن طريق تطبيع... في الواقع ، إذا قمت بإزالة تطبيع سوف لاحظ أنه يتم في الواقع تتلاقى على جميع الأصفار). إذا تمت إزالة مجموعة من وصلات الشبكة أو في مكان آخر ، فإن النظام يتقاطع بشكل صحيح (مع أو بدون التطبيع ، على الرغم من بعض تطبيع ما يبدو الى زيادة كبيرة في معدل التقارب).

    وتنشأ المشاكل أيضا إذا تم توصيل شبكتين في اتجاه واحد فقط (أي جي متصل لحاء بعض العقدة ، وهذا مرتبط فقط العودة الى زاي). كل تصنيف الصفحة التي تذهب الى المحاصرين يحصل الجميع في زاي وحاء وأبدا تدفقات العودة بها الى بقية الشبكة. وربما هذا هو فكرة أن الكثير من الاطر استخدام في محاولة للحصول على الصفحة الخاصة بهم صفوف أعلى. ومن الواضح أن غوغل قد حل هذه المشكلة (ولا أدري كيف!).

اترك رد