ランダムサーファーとは? ページランク原理となる計算方法
更新日:
要約:
- PageRankは、ランダムサーファーモデルと密接に関連している。
- ランダムサーファーモデルの考え方は、順位を作為的に上げられる欠陥がある。
- ランダムサーファーモデルは、Googleの基盤ともいえる始祖的な概念。
はじめに
既に過去の遺物となりつつあるランダムサーファーモデルは、近年のGoogleアルゴリズムには強く組み込まれていません。
現在は、リーズナブルサーファーモデルの考え方に置き換わりつつあるため、あくまでも本ページでは”歴史と仕組みを学ぶ”目的でご覧いただければと思います。
しかしながら、PageRankを含め、基本的なロジックは一部で残っている可能性が高く、特に被リンクに関しては、様々な指標と掛け合わせて応用することがSEOには求められます。
ランダムサーファーとは?
ランダムサーファーとは、インターネットを利用しているユーザーは”ウェブページ上のリンクをランダムにクリックするであろう”といった理論です。
ユーザーの行動に関する”確率的アルゴリズム”で、人の流れはリンクをランダムに選択・追跡するため、ページ推移のパターンはランダムにジャンプするといった意味になります。
ランダムサーファーの活用方法は、行動データを分析することにより、ユーザーがウェブサイトでどのような操作をするか、動きを起こすかといった予測を行うのに役立つモデルとなります。
これをランダムサーファーモデルと呼びます。
より優れた検索アルゴリズムの開発、ユーザー行動の予測、ネットワーク内で注目されているコミュニティの特定に利用されています。
ランダムサーファートリックとは
検索結果において上位に表示される確率を高めるために用いられる手法で、これをランダムサーファートリックと呼びます。
PageRankの高いウェブサイトからのバックリンクをランダムに設置して、更にクリックすることによりターゲットサイトへのバックリンクの認識と質を高めるというものです。
この行為により、実際のユーザーが対象ウェブサイトを訪問しているように擬似的にシミュレートすることが出来るので、検索エンジンのランキングを作為的に上げることができると言われています。
ダンピングファクターを理解する
ダンピングファクターとは、ランダムサーファーモデルで使用される確率パラメータで、ユーザーがあるページから別のページにランダムにジャンプする確率を表します。
通常0から1の間の値に設定され、0は減衰なし、1は絶対的な減衰を意味します。
このパラメータは、ウェブサイトにユーザーを誘導する際に”特定の経路だけをたどるわけではない”といった理論をモデル化するために使用されます。
ランダムサーファーモデルは、ユーザーが特定のページを訪問する確率を計算するために使用される手法ですが、前述のようにユーザーがウェブ上をランダムに移動するという考え方から、ユーザーがページからページにランダムに移動する確率を表すために”ダンピングファクター(減衰係数)”が使用されています。
これを用いることでユーザーが任意のページを訪問する確率を計算することができます。
PageRankの計算方法は?
PageRankは、Googleの共同創業者であるラリー・ペイジが開発した計算アルゴリズムです。
このアルゴリズムでは、ページのコンテンツ内容だけでなく、そのページが受ける被リンクの数や質が考慮されます。
各ページに“PageRank”という数値のスコアを割り当て、検索エンジンの掲載位置を決定するために使用されていました。
当時はブラウザのプラグインなどで可視化することが可能でしたが、現在では、”PageRank”を読み取る方法は残っていません。
ランダムサーファーモデルとPageRankに関連性について
ランダムサーファーモデルは、PageRankアルゴリズムの基礎となるものです。
ランダムサーファーモデルをベースとしたリンクの量を計算して、ウェブ上の各ページの重要度を計算します。
PageRankアルゴリズムは、ユーザーによるリンク推移がランダム行われるといった確率に基づいて、各ページに数値的な重み付けをしています。
PageRankの問題点
PageRankの主な問題点は、ウェブサイトの所有者によって作為的に数値の操作が行われてしまうことです。
このため、低品質なコンテンツを持つウェブサイトが、高品質なコンテンツを持つウェブサイトよりも上位にランクされてしまうといった可能性が発生します。
初期のPageRankは、コンテンツとの関連性・文脈・E-A-Tなどといった他の要素を考慮していないリンク評価であったため、不正確なランキングにとなるリスクがあります。
PageRankとマルコフ連鎖
データマイニングの分野では、PageRankとマルコフ連鎖の2つのアルゴリズムが使用されています。
マルコフ連鎖とは、”ある事象が発生する確率を、直前の事象に基づいて予測する”ために使用するといったもので、リンクの量だけで評価を行うPageRankと組み合わせると、質の高いリンクの重み付けが可能となります。
マルコフ連鎖は、自然言語処理、音声認識、画像認識など、さまざまな用途で利用されています。
PageRankを可視化するには
各々のサイトが持つ被リンク数を示すグラフを作成することで、PageRankアルゴリズムを視覚化することが出来ます。
このグラフでは、各ウェブサイトが他のウェブサイトと比較して、どのくらい人気があるかを被リンクをもとに数値化できれば把握することが可能です。
“ノードの色が濃いほどPageRankが高い”といった可視化ができれば、検索順位にどれほど影響を与えるページであるかを視覚的に表現することができるでしょう。
まとめ
ランダムサーファーモデルは、初期のPageRankに強く作用していたことがわかりました。
現在では、リーズナブルサーファーモデルを中心のアルゴリズムが置き換わり、そこから更に多くの指標が複雑に交錯した上で検索順位が決定されています。
過去には、被リンクの数だけで順位操作が可能な時期もありましたが、今となってはGoogleアルゴリズムの進化により、ランダムサーファーの話題が取り上げられることも少なくなりました。
しかしながら、Googleの基盤ともいえる始祖的な概念なので、知識として入れておくことをおすすめします。
意外とランダムサーファーモデルは、完全に消え去っていない可能性もあると考えられます。
よくある質問
📕ランダムサーファートリックとは?
📖インターネットを利用するサーファーが、無作為にリンクをクリックしたり、アドレスバーにURLを直接入力するなどしてサイトにアクセスし、特定のページに到達する確率を予測する仕組みです。
📕リーズナブルサーファーモデルとは?
📖Googleのランダムサーファーモデルを改善したもので、リンクがクリックされる可能性をリンク元のページの主題や特徴からアルゴリズムにて関連性を分析し、供給するリンクジュースの量を決定する概念です。詳しくはリーズナブルサーファーモデルを参照ください。
📕 ページランクとダンピングファクターの関係は?
📖 ページランクとダンピングファクター(通常は0.85と設定)は、ユーザーがリンクをクリックして次のページに移動する確率を調整する重要な要素です。ダンピングファクターは、「リンクをクリックして次のページに移動する」行動と「ランダムにページを選択する」行動をどのように組み合わせるかを決定します。具体的には、ダンピングファクターが高いほどリンク経由の移動が優先され、低いほどランダム移動が増加します。このパラメータを調整することで、アルゴリズムがページ間のリンク構造をどの程度重視するかを制御します。結果として、ダンピングファクターが高い場合、リンクが多いページや重要なリンクを持つページが高いページランクを得やすくなります。