QLOOKアクセス解析

アクセス殺到中の人気ブログランキングHOT!!

 このブログの他の記事を読もうとしている人はちょっと待て!まず先にこっちをチェックすべきだろう常識的に考えて…。
 本日もまた新鮮なネタが続々と入荷中。炎上ブログに激安情報、噂の芸能人に新たなネタ発見、あやしげなギャンブル必勝法、YouTube動画に無料壁紙配布、そして浮気の告白は…続きを読む »Ranking

Home » チラシの裏

Google神は全てをお見通しです

28 2 月 2009 No Comment ] タグ: , , ,

googleのサイト内検索一覧を見ていたら、flash ファイル(拡張子 .swf)が webページの一つとしてインデックスされているのを発見した

まあ google が flash のファイルも拾うのは知っていたんだけど。

で、このインデックスされたフラッシュファイルは、右サイドバーに貼り付けた自作の『 SA・PA・道の駅ガイド』広告バナーである。そしてタイトル部分に表示されている『N O W L O A D I N G』はフラッシュファイル読み込み時の案内表示で、『http://pt.afl.rakuten.co.jp/…』 という部分は中に仕込んだ楽天アフィリエイトのリンクだ。

通常 webページが検索結果に表示される場合はタイトルタグ <title> の内容が、それが無い場合は本文の一部が表示される。しかしフラッシュのファイル内にはそんなものは無いので、ファイル内のデータから人間に意味が判る文字の部分を自動的に抽出しているのだろう。

検索結果に登場してしかも謎の文字列とは言えファイル内容の一部をこのようにダイジェストとして表示しているのを見て、一体どの程度の情報を判断しているのか興味が湧いた。

そこでまずはタイトルにも出てきた『http://pt.afl.rakuten.co.jp/』で検索をしてみた。

すると予想通りファイルの中に埋め込まれた楽天アフィのリンクをダイジェストとして表示してくれた。こうしてフラッシュの中に仕込んだアフィリエイトのリンクが読めると、自分の浅ましさを見せ付けられているようで少々恥ずかしいw

さらにこの検索結果に見えている文字列で検索を繰り返せば、すこしずつファイルの奥(データの後ろ)を見る事が出来るのではないかと期待しながら試してみたが…。残念ながら検索結果に出ているリンク文字列の最後尾より後ろは表示されなかった。

という事は、フラッシュファイルのインデックスはファイルの先頭からある一定のデータ量に限られ、その限られたデータだけが検索結果の対象となり結果にも表示されるのではないだろうか。

ちなみにこのファイルのサイズは 216KBだ。画像も入ってるから結構大きいね。

仮説まとめ

  • Google はflashファイルも webページと同様に検索結果の対象としてデータを取得する
  • データの中から判読可能な部分を自動的に抽出し、検索結果のタイトルとして表示する
  • 検索結果の対象になるのは一定のデータサイズまでに限られる

この記事に投票してくれ。頼む!→人気ブログランキング

関連する投稿

このページのURL / トラックバックURL:

コメント受付中!

コメント受付中です。トラックバックする場合はこのサイトへのリンクが必要です。またこの記事へのコメントの RSS も購読できます。

You can use these tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Gravatar とかいう自分専用の顔写真やイラストを使える仕組みに対応しているらしいです。


現在の閲覧者数:
あわせて読みたいブログパーツ ページビューランキング ...............
フィードメーター - メシウマ
track feed メシウマ状態