http://www.shinobi.jp/access_index.html
SHINOBI.JP 無料アクセス解析 - SEO対策、アクセスアップ に
アクセスログ解析のサービスを利用するのはどうでしょうか。
http://hobbit.ddo.jp/html/awstats.html
AWStats��FreeBSD�œ�����
たとえばAWStatsを使うと、使われたリンクは全て分かります。
UltraRanking Research (ウルトラランキング リサーチ) [視聴率,アクセス解析,サーチエンジン,バナー広告,メールマガジン,DM,マーケティング,ランキング,アクセスログ]
自分のサーバでない場合は、JAVAを使ったこんな手もあります。この場合も使われたリンクだけ。
?
時間はかりますが、アクセス解析して洗い出すのではダメですか? いろいろなツールがありますが。
http://www.tohoho-web.com/js/document.htm
ドキュメント(Document)
後は、簡易版としてはdocument.referrer を使う。
ん〜
http://trackfeed.com/?r=d595a9b3ef
リンクが張られた瞬時にRSSで通知するアクセス解析ツール - トラックフィード
こういったツールの紹介で
よろしいのでしょうか?
おーすごい。なんでしょうこれは。どういう仕組みになってるんでしょうね。
ACR WEB - CGIレンタル
1から3の回答者のかたの論点はずれていません。
アクセスログの取得を行えば時間はかかりますがリファラからリンクされているサイトがわかると思います。
逆にそれすら引っかからないページは人気も著しく低くリンクされていても影響を与えないと考えてよろしいと思います。
ん〜・・。論点ずれてます。影響を与えるとか与えないとかを論じているのではなく、全てを把握することが可能かどうかを論じているのです。ログの解析でわかるのは、あくまでそこからアクセスがあった場合で、「全てを把握」「可能かどうか」という命題の回答になっていません。
http://www.futomi.com/lecture/env_var/http_referer.html
Perlで作るCGI講座 - 環境変数 HTTP_REFERER - futomi's CGI Cafe
4の方が紹介されているツールも1~3の方のやり方と同じREFERERを見る方法が使われています。結局、自分のサイトに向けて貼られているリンクをクリックして、このスクリプトが実行されることで初めてリンクされていることを知らせることができるわけです。
結論から言えばすべてのリンクを把握するのは不可能です。例えば最近はDDNSで自宅サーバにてサイトを運営している人も多いですが、そういった極めてローカルに近いHTMLから貼られたリンク、しかも実際にクリックされずにREFERERも残さないリンクを知ることはできないわけです。
と言うわけで、やはりアクセス解析を使って調べるしかないわけです。(4の方のツールもアクセス解析のひとつですよ)
あまり納得いかれない回答で申し訳ありませんが、一応お望みの論点から他の方と同じことを書かせていただきました。
http://www.forest.impress.co.jp/article/2003/11/12/alltheweb.htm...
���̓m - �yReview NEWS�zIE�̉E�N���b�N���j���[�Ɍ����T�[�r�X���lj��ualltheweb �����N�������v
全て把握することが可能か不可能かといえば、不可能。
検索サイトが全てのサイトを把握しているわけでもないし。
極端な話をすると、私のパソコンのHDDにあなたのHPへのリンクを張ったhtmlファイルを置いとくとして、何もしていないのにそのファイルの存在が公になった場合は、問題ですよね。
http://d.hatena.ne.jp/matsunaga/20040114#p1
備忘録ことのはインフォーマル - ああ、そうか
同様のことを考えたことがありますが、現状無理というのが結論です。
自分自身のサイトへのリンク元チェックには、以下のものを使っています。
1)トラックバック。相手からの明示的なリンク報告(ただし相手からリンクしていないのにトラックバックされることもある)
2)リファラ解析。実際の流量の多いリンクの抽出(はてなダイアリーのリファラ表示も含む)。
3)Google検索。「link:」だけでなく「含む」検索を試してみてください。
それぞれの問題点。
1)トラックバック送受信の環境が整っていない場合、あるいはトラックバックを送る意思がない場合は告知されない。
2)そのリンクがたどられていない場合、たどった人がリファラ隠し対策をしている場合は告知されない。
3)リンク元ページがデータベースに収録されていない場合は告知されない。
現時点では、この3つでわからなければどうしようもないとしか言いようがないと思います。リアルタイムで一番取得しやすい&見やすいのは、はてなダイアリーやtDiaryのリファラ表示またはアクセス解析を使った方法ではないかと思いますが……。「全て」については「無理」だと思います。
http://ra-map.hp.infoseek.co.jp/cgi/redirect.html
REDIRECT CGI�@(referer���c���Ȃ�CGI �j
不可能です。
サーチエンジンに表示されない(させない)ページからリファラを出さないようにリンクされた場合はアドレス直打ちでのアクセスと区別がつきません。
ダイエット生活レシピ
↑URLはダミーです。
「ヤフー・ジャパン」でも「Google」でもどこの検索エンジンでもいいのですが、
検索窓に「link:ホームページのURL」を入力すると、自分のサイトにリンクを貼っているサイトがわかります。
(自分のサイトも検索されてしまいますが)
例> link:http://100kcal.com
↑を検索窓に入力すると↓の結果がでました。
http://search.yahoo.co.jp/bin/query?p=link%3ahttp%3a%2f%2f100kca...
Yahoo!検索 - link:http://100kcal.com
どうやら私が掲示板に書込みした際のURLもでてしまうようですが、これが一番確実だとおもいます。
質問文を読んでから答えよ。
http://www.math.tohoku.ac.jp/~kuroki/keijiban/Robots.html
$B%m%\%C%HBP:v(B
その様なサービスを実施するとしても、Webを巡回してデータ収集する(クローラやロボットなどと呼ばれる)プログラムは、サイトのrobots.txtに書かれた制限にしたがって、収集に制限を設けるのが現在のWebの不文律です。
そういう意味でも「全て」は不可能(というかやっちゃいけないこと)です。
他にもあります。
googleのキャッシュページからのリンクも「全て」に含めるつもりですか?
http://www.archive.org/ に収容された、すでに誰のメンテナンスもない様な過去のサイトとか、すでに消失してしまったサイト(のアーカイブ)からのリンクも必要ですか?
すでに前の回答者が何度も何度も書いていますが、”現在も生きているリンク”を把握しておく方が有用だと思うのですが。
http://mysite.ddo.jp/modules/mydownloads/singlefile.php?lid=10
マイサイト ユーザーズ - ダウンロード
自分のサイトがどこからリンクされているか、そのリンクからどのくらい参照されているのか。
そういう情報を集計、表示する「参照元情報モジュール」の改訂版を公開しました。ダウンロードページより取得してご利用ください。
うぜ
WWWのHTMLのハイパーリンクは、リンク先に対して何の情報も送信しないため、リンクされる側が待機してそれを知るすべはありません。
ですので、米軍のエシュロンシステムのような盗聴システムをより強力に拡張し、世界中のコンピュータを同時に監視し続けるなどして、リンクが作成された事を知る必要があります。
それはまるで、自分の名前が書かれた書籍を世界中から探し出すかのような作業となります。
http://pasokon-yugi.cool.ne.jp/freeware/#alltheweb
Freeware - パソコン遊戯
こちらを見てみると、Google、infoseek、gooにくわえて、 allthewebという検索サイトもリンク元の検索ができるそうです。
link:(調べたいURL)と自分が試してみたところ、Googleよりも検索結果が幅広く出ました。
しかし、実際には全て把握するということは上でも言われているように現在の技術上無理で、検索エンジンでリンク元を検索するというのは、検索エンジンにキャッシュされたデータの中から検索するということなので、質問されていることを完全に実行するというのは無理ではないかと思います。
「全て」を把握することを前提とした質問のようですのでそれに則して答えます。
技術的に「明確に」できません。リンクが貼られているかどうかを全て把握するにはこの世に存在する全文書(*)の全記述を何らかの方法で走査しなければならず、このようなことが可能な技術も組織も存在しないからです。仮に走査されていない文書が残っていたとすればその残された文書にご自分のサイトがリンクされていないという証明は不可能ですよね。
(*)「全文書」が何を示すかは「リンク」の定義によりけりです。誰かがメモ帳に残したURLのメモを含めるのか、ブラウザに残る履歴は含めるのか、WWWサーバ上に存在するHTML文書のみに限定するのか。いずれにせよ結論は同じですが。
基本的な問題としてそもそもWWW上のHTMLですら常に同じように存在しているという保証があるものは何一つありません。その意味ではご質問の「全て」をより厳密に定義すれば、「リンクを貼っている」かどうかの定義すら「この日この時間のある一瞬に該当の文書にリンクを貼っているもの」と定義しなければなりません。そうするとご質問に対する答えはより困難になります。一瞬で世界の全土を踏破できる人が存在しないように一瞬で全世界の文書を走査するのも到底不可能です。またその夢の手段が実現されたとしてもその手段から得られる結果はその一瞬にしか意味がありません。
擬似的に「ほぼ全て」ということでしたらこれまでの回答で十分です。
論点ずれてます。