ページランクとGoogle toolbarについて

 picolixホームへ

[home]>[Blog]>[ページランクとGoogle toolbar]



  ■ 2004/3/24 updated!

 1.2004/3 google更新 & Yahoo! Web Rank (2004/3/24)
   ・Yahoo! Web Rank登場

  □ 2003/4/12,/5/24,6/20,8/13 ←この情報はすでに古く過去記録として残しておきます。


 1.[背景] googleってgooの親戚だと信じ込んでいたおバカな私
 2.[Google toolbarについて]
 3.当サイトのバックリンクの怪現象:PR5はまぼろしか?
 4.当サイトのバックリンクの怪現象は収まりました。& 考察 (ステルスバックリンク)
 5.[ページランク Rank_1:1:5] Google toolbarのhttpアクセスについて
    ・Googleページランクウォチャーの作成:ggwatcher.exe
 6.[Google dance]
 7.[おまけ] 検索キーワード”移動”
 8.[このページで紹介したリンク集まとめ]

 9.2003/5月度 google更新 日記へ(2003/5/24)
   ・google toolbarにおけるPR値とGoogleカテゴリーで表示されるPR値について
10.2003/6月度 google更新 日記へ(2003/6/20)
   ・更新前におけるPageRankがグレーにふれる前兆現象について。(地震予知みたい;;笑う。)
11.2003/(7),8月度 google更新 日記へ(2003/8/13)
   ・更新前におけるPageRankのふらつき前兆現象続編。



 ※ここで記載しました内容は、Evaが考察したもので、間違いがあるかもしれません。
   間違いがある場合、その他の情報があれば、お知らせ下さい。



[背景]
自宅サーバを立ち上げる前(2002/12)まで,当サイトは、あるプロバイダーにコンテンツを1995/10ぐらいにアップし、その後1998にYahoo!Japanにカテゴリー登録だけしてそのまま放置状態でした。

また、2002/12まで,googleってgooの親戚だと信じ込んでいたおバカな私でした。
ネットワーク関連SEでもある私ですが、検索エンジンについては、<tMETA>タグにキーワードを書いておけばとりあえずいいだろうという程度の知識でした。

自宅サーバ立ち上げ後、とりあえずアクセスアップのため検索エンジンに登録し、yahooにはカテゴリへの登録申請したりしましたがなしのつぶてでした。
この時まで、自分のプロバイダーに置いてあるサイトがYahoo!Japanにカテゴリーに登録されているなんてすっかり忘れていましたが、yahooで何かのキーワードで、自分のサイトがヒットして、そこから自分のサイトが、yahooのインターネットのカテゴリーに載っているのを見つけました。
(5年もの間放置状態でしたが、削除もされずしっかりとあるではありませんか!)
で、yahooにURL変更依頼を出してすんなり自宅サーバのURLが変更登録されました。
これで、めでたしめでたしでしたが、yahooはgoogleの検索エンジンを利用しているということで、googleのディレクトリーにも登録しようと思ったところdmozとかいうところに登録すればいいということで、早速登録申請して、登録されました。
ここまでの作業の仮定で、Googleがページランク(PR)とういうしくみを付加した判定指標があり検索結果の順位に影響されることを知りました。
ここでやっと検索エンジンの世間の情勢に少し追いついたわけです。
[Google toolbarについて]
とういうことは、この時のプロバーダーに置いていたサイトと、この自宅サーバサイトはいったいPRはいくつなのか。。Google Toolbarをインストールすればわかります。
但し、日本語サイトからこのGoogle Toolbarをインストールすると、PageRankメータにフォーカスを当てても具体的な数値は表示されません。(なれればPageRankメータの長さで判断できますが。)
英語サイト:http://toolbar.google.com/からインストールすれば、PageRankメータにマウスを持っていくと、具体的に3/10とか表示されます。灰色の場合は、まだGoogleの
インデックスに登録されていないことを意味します。灰色,0/10〜10/10まであります。
ちなみに、Googleにまだインデックス登録されていないのに、5/10とかいきなり高いPRが表示されることがあります。これはあくまで仮です。
そのURLの1段上のサイトが6/10だったりしますとその配下は仮で5/10とか4/10になります。
更新後は正常なPRにランク付けされます。
[当サイトのページランク(PR)の変遷はどうなのか?]
プロバイダーに
置いたサイト
当自宅サイト
2002/12 PR4 対象外 (※1)
2003/1 PR4 対象外
2003/2 PR2 PR4 (※2)
2003/3 PR1 PR5 (※3)
当サイトのバックリンクの怪現象:PR5はまぼろしか?
2003/4 PR1 PR5 (※4)
当サイトのバックリンクの怪現象は収まりました。
※1

プロバイダーに置いたサイトは、yahooカテゴリーPR5からのリンクなので、PR4は順当なところです。
※2
yahooカテゴリー登録変更が反映されプロバイダーに置いたサイトは、PR2にランクダウン。
当自宅サイトはPR4でデビューとなりました。
※3 2003/3において当サイトのバックリンクの怪現象:PR5はまぼろしか?
※4 yahooカテゴリPR5、DOMZディレクトリーPR6なので当サイトはPR5です。
(のはずです。実際はリンク元は他のページにもリンクしているので等分されますが、 ページランクの内部数値は対数的(実際は違うロジック)と思われので1/10,1/100ぐらいは影響しないでしょう。)
 
 そこでです!
Googleではリンク元(バックリンク)が検索できます。
(googleの検索窓に自サイトのURLを入れて検索すれば、”リンクしている”ページの検索ができます。Google toolbarからも可能です。)
調べてみました、yahoo,dmoz,その他自サイト関連が表示されるはず。がしかし。。
なんと80件もリンクしてるではありませんか。しかも知らないとこがいっぱいあるので そこを手当たり次第そのホームページを訪れて見ましたが、当サイトにリンクを張ってもらって いるわけではありませんでした。それはこれから述べるWEBRINGの参加サイトからのリンクでした。

当サイトは、自宅サーバのWEBRINGに参加させて頂いています。
WEBRINGに参加されているサイトの1/4が当サイトのバックリンクに エントリーされています。実際は、当サイトにリンクは張って頂いていません。
ではなぜバックリンクされているのかというと、WEBRINGの乱移動でたまたま googleロボットが、該当サイトにアクセしたときランダムに当サイトのURLを拾ったものと思われます。
(ですがその確率はなぜか高すぎです。)
WEBRINGに参加している他サイトでは、1/80〜4/80の確率でバックリンクされています。
このWEBRINGに参加している当サイトだけが異常にバックリンクの確率が高すぎるのです。
これはいまだ謎です。
(尚、WEBRINGの乱移動におけるperlプログラムの乱数生成に偏りはありませんでした。)
まあなんてラッキーということでしょうか?
果たして次回更新ではどうなるのか。

※4  当サイトのバックリンクの怪現象は収まりました。
 (結果) 2003/4/11
残念ながら当サイトへの、自宅サーバのWEBRINGからのバックリンクは0となりました。!
しかしながら、このWEBRING参加サイトで別の方のサイトが、1/4(20リンクぐらい) 引き継がれました。 このことからどう考察されるのか。
 (考察) 2003/4/12
WEBRING参加サイトの全く同一のリンク情報である、
http://www.ar.wakwak.com/~tns/cgi-bin/ring/move.cgi?mode=randamから、googleのロボットは、  各サイトをランダムにストックします。これを何回か繰り返すことにより、各サイト分何回かたまります。

わかり易くするため下記のようになったとして、

  WEBING     Googleロボットアクセス
 ID No.     ランダムURLジャンプ先発生回数
    1       10
    2       7
    3       12
    .       .
    .       .
   50       13
    .       .
    .       .
   60       11
ここで、ランダム先発生回数がたまたまTOPだった,ID=50を代表として選択します。
あるいは、バックリンクを確定しようとgoogleが判断したときの最終の巡回サイトでID=50を代表として選択します。こちらの考えの方が素直です。by 鷹の巣さんよりの情報)

 ---- 引用 鷹の巣さんから------------------------------------------------
  1.Googleのクローラ(収集ロボット)は、CGIの動的なリンクも辿って、リンク元とリンク先を記憶する。
  2.ただし、リンク先については、Googleのクローラ(収集ロボット)が最後に収集したランダムなアクセス先にまとめられる。
  3.従って、最後に収集したランダムなアクセス先がバックリンクを甘受する。
  ---------------------------------------------------------------------

これで、ID=50 当サイトが選ばれたことにつじつまがあいます、また今回4月の 更新で、違うサイトに移行しています。

では、なぜ80サイトあるのに20サイトのバックリンクが生成されたか?
バックリンクに表示されるには、ある程度のPRが必要らしいので、 (PR4以上という情報もあります。)残りの60サイトは、googleにインデックスされて いないサイトを除きすべてステルスバックリンク(←Evaの造語です。)としてあると思われます。

また、いつかこのラッキーな現象が巡ってくることを祈って....

[ページランク5 Rank_1:1:5]
http://www.picolix.jp/index.htmlにアクセスすると、Google toolbarは、裏で次のようなアクセスをしています。
http://216.239.33.104/search?client=navclient-auto&googleip=O;216.239.33.104;531& ch=52880501431&features=Rank&q=info:http://www.picolix.jp/index.html

そこでちょっと簡略+@し当サイトのページランクをブラウザーからアクセスします。
http://www.google.co.jp/search?client=navclient-auto&ch=52880501431&features=Rank: FVN&q=info:http://www.picolix.jp/index.html

<説明>
 ch=xxxxxxxxxxxは、チェックSUMです。
  "http://www.picolix.jp/index.html"のチェックサムらしいですがアルゴリズムは
  不明です。(google toolebarを逆ASMすればわかりますが。。)
 features=
  Rank ページランク参照指示
  FVN  ディレクトリー参照指示

 ch=の値は従ってURL毎に異なります。この値は、パケットダンプして調べます。

 ※このchとpagerankを調べるパケットダンププログラム ggwatcher0.12goを作った
   のですがwin2000ではうまく動くのですが、XPでなぜか自分の送信したパケットが
   拾えません。
   WSASocketのSOCK_RAWでプログラムしているのですが、XPでは、
   Internet Connection Firewall (ICF) / Internet Connection Sharing
   (ICS)のサービスを開始すれば拾えるようになりました。
   http://homepage2.nifty.com/spw/のサイトで教えて頂きました。
 ※Googleページランクウォチャー ggwatcher0.992go上記をWinPCapを使って
   作り直しました。
   (これで、WIN98〜XPまで動作するようになりました。)

googleからの応答は下記の通りです。
Rank_1:1:5 FVN_1:76:Top/World/Japanese/コンピュータ/ソフトウェア/インターネット/ネットワーク管理

<説明>

 Rank_1:ページランクの文字数:PageRank
 FVN_1:DMOZのカテゴリ名のLENGTH長:Googleのディレクトリー 

 例)Rank_1:2:10  PR10です。(2は10が2バイトを意味します。)
     Rank_1:1:5    PR5です。
   FVN_1:76:Top/World/Japanese/コンピュータ/ソフトウェア/インターネット/ネットワーク管理
       ・DMOZのカテゴリ名のLENGTH長はバイト換算で76バイトです。
    ・TOP/World〜:googleのディレクトリーを表しています。
     現在、当サイトのDMOZのカテゴリ名とgoogleのディレクトリー名は同じなので
     DMOZのカテゴリ名のLENGTH長=GoogleのディレクトリーのLENGTH長となります。
 
[グーグル・ダンス Google dance]
データベース更新にランキングが上下するグーグル・ダンスはすでに有名ですが、詳細は他に譲りますが(http://www.google-dance.com/)、同様にページランクもダンスします。更新最中のPRは、http://www.webrankinfo.com/outils/pagerank-data-centers.php
で分かります。但し前述のchの値を調べないといけません。

[おまけ]
2003/4/10現在:下記の意味のないキーワード
(でもなぜか中国語のgoogle言語サイトからの検索で:”乱”のキーワードで
 ほぼ毎日1件:来訪者がございます。これは何を目的に検索しているのでしょうか?
 こんなこと書いたらますます増えるかもしれません。ごめんなさい。)

検索キーワード:乱
検索キーワード:移動

でgoogleで検索してみて下さい。200〜400万の順位1位で何故か当サイト
がHITします。
これは、前述のWEBRINGの文字列の”乱移動”に大いに関係があります。
バックリンクしているサイトには全てこの文字列の”乱移動”がありますので
PR+リンク元の相互関連性によりTOP1になっているものと想像されます。


次にDBが更新されたらどうなるかわかりませんが。

 (結果)
 WEBRINGからのバックリンクがごっそりとなくなりましたので、
 当サイトは、どこかに消え去りました。。(泣;2003/4/11)
 尚、現在は、WEBRING参加の他のサイトの方がTOP1を引き継いでいます。

[このページで紹介したリンク集まとめ]
 ・WEBRINGへの入り口は、TOPページからどうぞ
 ・英語版Google toolbar
 ・SapporoWorks:各種のネットワークプログラムの作成&公開
 ・グーグル・ダンスチェック
 ・ページランク・チェック
 ・自宅サーバーWebRing連絡用掲示板by 鷹の巣さん
 +@
 ・Googleのページランク(PageRank)を実験するぺーじ
 ・Googleクローラ(Googlebot)の巡回&更新周期表
 ・Google Dance黙示録

[HOME]  [google関連日記パート2]

ご意見、お問い合わせ、バグ情報はこちらまでeva@picolix.jp
http://www.picolix.jp
Copyright © 2002,2003 PicoLix All rights reserved.