ウェブサイトのRSSについて質問です。
ファイル名がサイトによって、まちまちですが、
/index.rdf
/index.rss
/index.xml
/xml/index.xml
/rss/index.rss
など・・・
1.favicon.icoやrobots.txtのように、決められたルールはあるのでしょうか?
参考)
最近、rssを配信していないサイトのapacheのログに
***.***.***.*** File does not exist: /home/***/public_html/index.rdf
というエラーログが頻繁にたまっています。
何かの巡回ツールが回っているのでしょうか?
これから考察すると、index.rdfがいいように見受けられるのですが…
2.また、SEO的な効果から考えたとき、rssをおくことによるメリットはありますか?
http://blog.seo-insite.net/2006/04/post_14.html によると、ブログ検索エンジンにより取得しようとするファイルは異なるようです。
約15分の間に訪れてきたロボットたちは、
8分後・・・Bloglines/3.0-rho・・・atom.xml
13分後・・・Blogslive・・・index.rdf
13分後・・・Technoratibot/0.7・・・atom.xml, index.rdf, index.xml
14分後・・・Yahoo-Blogs/v3.9・・・index.rdf
という具合でした。
意外とindex.rdfしか取りにこないロボットが多いので、できれば3つatom.xml, index,rdf, index.xmlを用意しておくと良いかもしれません。
だそうです。
Googlebotがatom.xmlを取りにきているとも書かれています。
2.について僕の職場での話をさせて頂くと
という結果が出て来ています。
参考になれば幸いです。
参考になります。
ありがとうございます。
引き続き、募集いたします。
決まり・・というのは規格ということでしょうか?
設置方法でしょうか?
http://feedvalidator.org/docs/
とか
Validate an RSS or Atom Feed
など。
説明が足りなくてごめんなさい。
内容ではなく、ファイル名の規則です。
たとえば、ブラウザにアイコンを表示させたい場合は、favicon.icoをルートディレクトリに設置する必要がありますし、
検索ロボットに巡回の許可・不許可を設定するファイルは、これもルートにrobots.txtを設置するみたいなファイル名のルールです。
1. について解答します。
ファイル名というかURLというかは、特に決まりはないのではないでしょうか。
例えばHTMLで考えると、CGIプログラムの出力するものは、CGIの拡張子に関係なく(主に)HTMLですよね。CGIプログラムから画像を出力する場合もありますし。
例としては、Yahoo!などはCGIからrssを出力してますし、wikiの一つ、pukiwikiもそうです。
ですね。
w3c辺りに決まりがあるかと探しているのですが、
見つけることが出来ませんでした。
では、なぜ、Apacheのログに残るような自動巡回システムっぽい物は、index.rdfを取得しにこようとしているのかが気になります。
現在のところ厳密なルールは無いと思いますが、1つ言えるのは、.rdfという拡張子を用いて良いのは、RDF仕様をベースとしたRSS0.9とRSS1.0のみです。
RSSのバージョンには、RSS0.9,RSS0.91,RSS0.92,RSS1.0,RSS2.0がありますが、現在主に使用されているのはRSS1.0とRSS2.0です。
日本国内ではRSS1.0が多く、海外ではRSS2.0が多いようです。
RSS1.0なら、拡張子は .xml,.rdf,.rss
RSS2.0なら、拡張子は.xml,.rss
としておけば、問題はないと思います。
なるほど。
とってもよく分かりました。
この頂いた情報をもとに、もう少し探ってみます。
引き続き、情報を募集します。
RSSのSEOにおける役割は、大切です。何故今ブログが流行っているのかというと(と言っても既に2-3年前からこの流行は流行り始めました。)ブログやRSSのファイルを用いる事によってサーチエンジンのクロールを高める事が期待できます。SEO対策要素の一つで、新しい情報の乗っているサイトは、サーチエンジンに好まれると言う傾向を生かしたものです。ブログのウェブサイトやフォーラムのサイトが増え始めた理由はその要素にあります。もしあなたのブログがニュースと言った最新情報に敏感なトピックを取り扱っているなら、特に重要です。
当サイトでは、RSSのSEO対策はやってませんが、グーグル対策としてSEO対策をしている皆さんに最新の情報をアメリカから提供しています。もし良かったら見に来てください。http://www.pagerank-jp.thebest25sites.com
ありがとうございます。
http://blog.seo-insite.net/2006/04/post_14.html によると、ブログ検索エンジンにより取得しようとするファイルは異なるようです。
約15分の間に訪れてきたロボットたちは、
8分後・・・Bloglines/3.0-rho・・・atom.xml
13分後・・・Blogslive・・・index.rdf
13分後・・・Technoratibot/0.7・・・atom.xml, index.rdf, index.xml
14分後・・・Yahoo-Blogs/v3.9・・・index.rdf
という具合でした。
意外とindex.rdfしか取りにこないロボットが多いので、できれば3つatom.xml, index,rdf, index.xmlを用意しておくと良いかもしれません。
だそうです。
Googlebotがatom.xmlを取りにきているとも書かれています。
おお!このような情報を求めていました。
ありがとうございます。
おお!このような情報を求めていました。
ありがとうございます。