2月のアーカイブ、2010年

募集:スーパーマン

2010年2月8日発行ニヤズ主キーの下でのプログラミング

いくつかの時間前、私はこの人に募集代理店で、次の応答を送信レジストできませんでした:

親愛なるサンシャ、

これは冗談ですか? 私か誰に割り当てによって、いわゆる行く本当に転送彼らの前に? 彼らは12時間以内に2つの本格的なウェブサイトを構築してほしいですか? 運が行うことができます候補を見つけるのベスト。

ところで、あなたは候補者があなたのためになぜあなたが採用しているか、これらのサイトを構築することができますか? 私は認めざるを得ない、これは優れた方法あなたの作品を無料で終わらせることです。

私は残念です。 私は本当にこのような愚かな会社で働くことに興味がない。

しかしオファーを私に連絡するため(おかげで。本当に感謝する。そこに彼らのプログラマーとしてスーパーマンを探していない企業の開口部があるなら、私に教えてください。)

- ニヤズ

私は彼らがインタビューの前に完了するために頼ま2つの代入を添付するから控えています。 あなたは自分の恥Facebookになる要件を参照するときので、私は自由のためのウェブサイトを構築するに私を騙してみました、実際の企業を公開したいのですがないため、まだ、それはあなたの日の残りの病気になる。

4反応はこれまで

のPageRankの流れ

2010年2月2日発行ニヤズ主キーの下に、インターネット数学

GoogleのPageRank技術に精通してあります。 GoogleはあなたのウェブサイトのPageRankを計算するための変数の多くを考えている。 これは、ページランクの非常に簡略化についての議論です。

私たちは数と被リンクの質の高いウェブサイトをランク付けすると仮定します。 着信リンクの品質は、PageRank、他へのリンクサイトの関数として定義されます。

私たちの例を見てみましょう。 次の図は、お互いにどのようにウェブサイトの小さなグループがリンク表示されます。

ウェブサイトGは任意の外部リンクを持っていないが、そのウェブサイトFを注意してくださいすべての着信リンクを持っていません。

リンクの与えられたグラフ今から私たちは見つける必要がある(相対)PageRankの各ウェブサイトの。 当初我々はすべてのページが同じランクがあると仮定します。 今は各サイトへのリンクの数をカウントし、着信リンクの数に応じてページランクを変更します。

我々は、PageRankをサイトとして定義する:

広報()=? 広報(x)は/ Lの(x)

ここで、L(x)は、サイト xの発信数=リンク

x Åの意味へのリンクサイトを

ときに初めてこのアルゴリズムを実行すると、ページランクは、すべてのページの更新されます。 今の問題は、PageRankのすべての着信のページ以降に更新されているが、我々は再ページの再検討に新しいPageRankの値を取るPageRankを計算する必要があります。 (あなたはその関数が再帰的に1つのことに気づいてこの問題を予測することができます。)同じ問題が表面をアルゴリズムの各反復します。

質問には、反復処理を停止するすべての繰り返しでページランクの変更は、どのように我々が知っている場合が何ですか? ページランクは、これまで安定ですか? (適切な用語が収束)です。

ここではスクリプトですPythonの上回PageRankの計算を多くのシミュレートして見つけることにするかどうかの値に収束かどうか。 出力値は、パーセンテージとして表されます。 (Googleは人も、特定のウェブサイトを訪問する確率は、この値)と見なします。

下のグラフ、各反復の後のPageRankの変更:

あなたはページランクを見ることができるように初期の反復性の変動と、彼らは安定。 これはつまり、PageRankの関数収束する。

もう1つは注意してくださいと思うのグラフに追加する複数のノードが収束に影響を与えるように見えることはなかった。 ほぼ同じままでも、コレクションのサイト、反復収束に撮影された数の数を倍増します。 他の人が到達も同じ結果(ppt)を。 PageRankの関数は、電流の流れに類似してメッシュを介して。 あるノードとソースが多い場合でも、電流の流れは、(安定、実際に高速安定)。

また、サイトDがPageRankの最も高い、それはほとんどの着信リンクしていると予想されるが注意してください。 サイトFは最低ランクそれは、着信リンクを持っていないためです。

このアルゴリズムは、他のサイトへのPageRankをあなたのウェブサイトの削減しないうちにリンクによると。 問題があるけど。 G.はそれが他のサイトにリンクしていないサイトの場合を取り上げます。 これは、PageRankがサイト外のG他のサイトに流れていないということです。 サイトGは他のサイトにリンクした場合、それがPageRankをほんの少しで、他のサイトの増加していると思います。 (この場合はアウト任意のサイトの)最初のリンクに影響します。 この問題を解決するために、GoogleはPageRankが、これらの(と呼ばれるシンクのようなサイトの)他のすべてのサイトに分割されます。 あなたは読みするもダンピングファクター

あなたは、なぜPageRankが、サイトのより大きいかを説明することができます去る前に、サイトBのか?

6レスポンスこれまでのところ