Seach Consoleのサイへのリンクで見慣れないドメインからリンクが大量に張られてて、めっちゃワクテカしてそのドメインに飛んでみたら・・・あれ、自分のサイトが表示される(´・ω`・)エッ?
何で!?コピーサイトか!?なんだこりゃ!?ヽ(д`ヽ)。。オロオロ。。(ノ´д)ノ
って、対象ドメインが設定されているIPアドレスを見てみると、自分が管理しているサーバーに向けられていますた(((((((( ;゚Д゚))))))))ガクガクブルブルガタガタブルブル
おい、おい、設定間違ってるだろjkヽ(`Д´)ノプンプン
ちなみにそのドメインでインデックス状況を確認してみると、既に多数のページがそのドメインでもインデックスされてしまっている状況・・・orz
その結果、ドメイン名が違うだけで後は全く内容が同じ重複ページが大量に認識されてしまっていることになっていますた。重複ページキタ――(゚∀゚)――!!
原因としては、nginx側で設定しているドメイン以外のドメインなどがからアクセスがあった場合に、nginxが空気を読んでとりあえずデフォルトの定義情報(一番最初に定義されている?)を利用する仕様のせいで利用していないドメインから設定されていても表示がされていたようですエッ(゚Д゚≡゚Д゚)マジ?
( ´゚д゚`)エー
( ´゚д゚`)エー
nginxたん空気読みすぎ!!!(´;ω;`)ブワッ
ということで、nginxの設定を下記に修正。
未定義のホストからアクセスがあったらレスポンスコードを444を返すように設定する。
レスポンスコード444とは
nginx独自のステータスコード444は、レスポンスヘッダを返さずにコネクションを切断できる。レスポンスヘッダを返さないので、ステータスコード444をクライアントが受け取ることはない。
https://github.com/yuuki/yuuki/blob/master/misc/nginx-status-444.md
#未定義のHOST名でリクエストがあったらcloseする server { listen 80 default_server; server_name _; return 444; } #未定義のHOST名でリクエストがあったらcloseする(SSL用) server { listen 443 ssl default_server; server_name _; return 444; }
よし!これでパーペキって思ったんですが、
既にインデックスされてしまっているという状況を思い出し、このままだとクローラーが認識できないせいでインデックスが残ってしまう可能性がある?ことをふと思い出し、とりあえずインデックスを消すために該当ドメインでアクセスがあった場合には全てのページでnoindexを設定する方法にしますた。※アクセスが出来ない状況が続けばいずれインデックスは消える。
それでインデックスが消えたらnginx側でブロックしてしまおうかな~って感じに変更。
クローラーまでブロックしてしまうと、クローラー的にそのページが落ちてるだけなのか、消したいのか分からなくてインデックスを消してよいか悩むみたいです。なのでとりあえずクロールさせてあげて明示的にnoindexを認識させることでインデックスが消えやすくなるとのことだったような!(゚д゚)(。_。)(゚д゚)(。_。) ウンウン
てか、これってある意味逆SEOなんじゃ・・・っておもた。
適当なドメインを取って競合サイトのIPアドレスを設定して表示が出来たら簡単に重複ページを大量に作ることが可能。それを大量にやれば・・・ペナルティクル━━━━(゚∀゚)━━━━!!
という妄想。
そんなことやっちゃダメです!絶対に!|д゚)チラッ
みなさんも気を付けてくださいな~(ΦωΦ)フフフ…