忍者ブログ

開発者ブログ

忍者ブログの元開発者が送る愛と感動と涙のスペクタクル。プログラムの開発日誌やタダの日記です。

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

コメント

現在、新しいコメントを受け付けない設定になっています。

特殊URLやGoogleSiteMap設定の仕組み

こんばんわ。みずのです。

本日GoogleSiteMapの設定を導入しました。
まだテスト的な部分が多々あるので変更することが予想されます。

2006/05/22現在では、以下のような仕様となっております。

■URLについて

http://***.blog.shinobi.jp/sitemap.txt
http://***.blog.shinobi.jp/sitemap.xml
http://***.blog.shinobi.jp/sitemap.gz

このような3つのURLを用意しました。

それぞれ

sitemap.txt
sitemap.xml
sitemap.gz

というファイルを[ファイルアップロード]からアップロードすると、自動的に上記URLにてアクセスすることが出来るようになります。
これをGoogleSiteMapで利用するURLとしてお使いいただけます。

上記3つのファイルはそれぞれファイルフォーマット形式が違うため、フォーマットに合わせてファイル名を指定してください。
フォーマットなど、詳しい仕様についてはGoogle様のヘルプや書籍・WEBなどで参照してみてください。

■ファイル作成機能について

上記で説明している sitemap.gz というファイルを自動的に作成します。
これは /Entry/以下の各記事のURLを生成してsitemap.xmlを作成しgzip圧縮した物になります。
自動生成ではなく、ボタンを押した時にファイルを作成する手動の方式になります。

[SiteMapファイル作成]というボタンをクリックするとファイルアップロードした場合に登録される場所にファイルを作成します。
そのため、すでに同名のファイルがアップロードされている場合は上書き保存されますのでお気をつけ下さい。

また、ファイルアップロードされたファイルと同じ扱いになりますので、[ファイルアップロード]のページにもsitemap.gzというファイル名が登録され、表示されるようになります。

■その他ファイル作成機能の注意点など

  • URLは最大50000件までの制限となります。
    (あまり現実的な数字ではない気がしますので、恐らく後日もう少し制限します。)
  • /Entry/以外のページは登録されません
    本日中にトップページくらいは含むように変更します。
  • TimeZoneは+09:00で一律になっています。
  • URLなどのエンコード処理は行っていません。(通常必要ないため)
  • priorityの値は入れていません。
  • lastmodの値は各記事の最終更新時間になります。
  • changefreqの値はalwaysになります。


■その他の特殊URLについて

今回の導入に似ている物で、favicon.icoやrobots.txtがあります。
あまり説明されていないので、一応補足的に書いておきます。

http://***.blog.shinobi.jp/favicon.ico
ブラウザによって、閲覧時やお気に入り登録時にそれぞれのホームページのICONを取得しようとする場合があります。
SHINOBIブログの場合、http://***.blog.shinobi.jp/favicon.icoというURLでアクセスしてきます。

SHINOBIブログではそのためのICONファイルを簡単に置いておくことが出来ます。

[favicon.ico]というファイルを[ファイルアップロード]からアップすることでICONとして利用することが出来ます。

favicon.icoの作り方などは書籍やWEBを参考にしてみてください


http://***.blog.shinobi.jp/robots.txt
Googleなどのサーチエンジンに登録するため、クローラーという自動巡回ソフトがWEB上でいろんなホームページを見て周っています。
このクローラーがホームページをサーチエンジンに登録しているのです。

ただ、WEBに公開しているけど、他の人に見られたくないページというのが存在します。

そのようなページをクローラーに教えてあげるための一つの手段がrobots.txtになります。
このファイルに「ここは見ちゃだめ!」というように書いておくと上手く登録されないようになるのです。
詳細は書籍などを参考にしてください。

SHINOBIブログではrobots.txtは全ユーザー様一律で同じ設定がされています。
試しにhttp://samurai.blog.shinobi.jp/robots.txtを見てみてください。
このような設定になっているのです。
何となく見て解ると思うのですが、XMLで記述されているページを除いてます。

現在のところユーザー様毎にこの設定を行うことは出来ません。
もう少し詳細な設定を行いたい場合は<META>タグによる制限をお願いしております。
その制限方法についてはWEBや書籍で調べてみてください。
以前に弊社の質問BBSで返答していたりするので探してみてください。


http://***.blog.shinobi.jp/crossdomain.xml

このファイルはFlashのセキュリティに関する設定を行うファイルになります。2006/05/22現在では以下のような設定になっています。
http://samurai.blog.shinobi.jp/crossdomain.xml

このファイルもrobots.txtと同様にユーザー様に一律で設定されており、ユーザー様毎に設定を行うことは現在のところ出来ないようになっております。

ただし、何らかの問題があった場合は変更の可能性があります。その場合ブログツールなどの使用に支障が出る場合があるかも知れません。
■更新Ping送信処理追加
 更新結果をGoogleに通知する処理を加えました。

■トップページを追加
 sitemap.gzファイル作成の際にhttp://***.blog.shinobi.jp/のURLを追加しました。

拍手[0回]

PR

コメント

お名前
タイトル
文字色
メールアドレス
URL
コメント
パスワード Vodafone絵文字 i-mode絵文字 Ezweb絵文字

画像RSS

おまとめボタン

忍者カウンター

忍者ビジター

忍者アド

ブログ内検索

最新コメント

プロフィール

HN:
mizuno
HP:
性別:
男性
職業:
主に侍などを少々
趣味:
競馬
自己紹介:
母子手帳の仮死と書かれてる場所に丸されてます。

フリーエリア

忍者ツールズプロフィール

忍者ツールズプロフィールは終了しました