当ブログの検索フォームへの検索文字列設定方法について

当ブログの検索フォームへの検索文字列設定方法について

Posted at December 4,2008 12:33 AM
Tag:[MovableType, Search, Spam]

現在、海外からの当ブログへの検索スパムがひどい状況で、勝手ながら、ここ数日検索機能(テキスト検索・タグ検索)を停止していました。

とりあえず検索スパム対処を行ってみました。これまでと検索方法が若干異なりますので、このエントリーで周知致します。

2008.12.12:IPアドレスの規制を追加しました。タグ検索もIPアドレスで規制しています。

1.検索スパムの状況

当サイトのブログ別のログ(検索状況)は次のような状況です。

ログ一覧

ご覧の通り、エントリーから半角英数文字列を無作為に抽出し、検索フォームに入力されています。このようなスパムと思われる検索が、800件/日のペースで、数ヶ月にわたって続いています(スパムでない検索は60件/日ほど)。

皆さんのブログにも検索スパムが飛来している可能性がありますので、ログをチェックしてみてください。

2.検索フォームの入力方法について

現在、検索機能を復旧させていますが、少し細工をしました。入力する検索文字列は下記のように設定してください。

[検索文字列][半角スペース][このブログ名]

上記のように、検索文字列の最後に必ず「半角スペース(全角スペースでもOKです)+当サイトのブログ名(あなたのブログ名ではありません)」を入力してください。「半角スペース+ブログ名」を入力しないとエラーページに遷移します。

検索したい文字列が2つある場合は次のようになります。

[検索文字列][半角スペース][検索文字列][半角スペース][このブログの名称]

検索文字列が3つ以上の場合も同じ要領で入力してください。

関連記事
zenback
人気エントリー
トラックバックURL


トラックバック

from trial and error
  最近?でもないけど、ずいぶん前からちょっと不思議に思ってたことが... [続きを読む]

Tracked on December 16, 2008 3:44 AM
コメント

こんばんわ^^

検索スパムっていう存在!? を始めて知りました (; ̄∇ ̄A

以前、訪問者さんから聞いた話ですが、検索結果の URL をリンクするといった使い方をしたりするそうなんです。
わたし的にはセンセーショナルな使い方でなるほどっ!! と思ったわけですが、mt-search.cgi の場合そういったアクセスログも残っちゃうんですよね!?

壱さんとこのサイトの検索結果 URL は Google だったか Yahoo にインデックスされてたし・・・。

幸いわたしのとこでは検索結果の URL を表に出してないのでそういった使い方はできないのですが、MT 知ってる人ならなんてことないですもんね。
一応 mt-search.cgi もリネームしておいたほうが良さそうですね。

スパマーっていろいろ考えるもんだなぁ・・・って少し感心しちゃう今日この頃です。

[1] Posted by bzbell logo : December 4, 2008 9:53 PM

いつも大変お世話になっています。m(._.)m

小粋空間さんを参考に、一昨日MT4.22にバージョンアップをしたのに
もう次のバージョンがリリースされているとは…。(;^_^A
わたしも検索スパムは、以前から気になっていましたがここ何日かは
特にひどい状況です。タグクラウドの単語がずらりと並んでいます。
検索スパムの嫌がらせには、何の意味があるのでしょうか?

あと、いつからの現象なのか不明なのですが、記事を編集している時に
確認ボタンを押して、ブログ記事のプレビューを行った際には
記事本文の下に該当の カテゴリ名 | comments[0] | trackbacks[0]と
表示されているのですが、実際にエントリしてみると…。
Permalink | | Comments [0] | Trackbacks [0] となります。

Permalink | カテゴリ名 | Comments [0] | Trackbacks [0] とするには
どのようにしたら良いのでしょうか?

お手数ですが、ご教授頂ければ幸いです。

よろしくお願い致します。

[2] Posted by せなっち♪ : December 4, 2008 11:09 PM

こんばんわ。

私も MT を使ってブログを運営していて、ログに検索履歴が大量に残る(1400件/day)症状に悩まされています。

ですが、そのIPを調べてみると...

crawl-*.googlebot.com.
*.crawl.yahoo.net.
msnbot-*.search.msn.com.

など、検索エンジンの bot からのアクセスがほとんどでした。
なぜ、検索エンジンがMTの検索を巡回するのかはわかりませんが。
かなり不思議です。

さらに、上の画像に載っているIPがうちのログに残っているものと同じものもあるので、同じ症状かもしれません。
一度、アクセスがあった IP を nslookup してみてはどうでしょう?
検索エンジンからの嫌がらせ?みたいで、気持ち悪いです。

[3] Posted by techno : December 5, 2008 1:52 AM

>bzbellさん
こんばんは。
コメント&情報ありがとうございます。
CGIが起動するので、検索結果はインデクシングしてほしくないですね…。

>せなっち♪さん
こんばんは。
コメントありがとうございました。
ご質問の件ですが、ご利用になっているテンプレートセットは最近リリースしたものでしょうか。また「ブログ記事のメタデータ」テンプレートモジュールを編集されていないか、ご連絡頂ければ幸いです。

>technoさん
こんばんは。
情報ありがとうございました。時間をみて試してみたいと思います。
ではでは!

[4] Posted by yujiro logo : December 7, 2008 12:23 AM


こんにちは、それでは少し補足させて頂きます。

しばらく MovableType 4.01-ja を利用していました。
おそらく変なところを私がイジッてしまったのでしょう、この頃から
プレビューで表示されているカテゴリ名が実際のエントリには、
表示されない症状がでていました。

12月3日に、4.01 → 4.14 → 4.22 とバージョンを上げました。
4.22で使わせて頂いているテンプレートは同日にダウンロードしました。
「template_4_2_utf8_1_11_style_liquid.zip」です。

4.22の導入では、テンプレートの初期化を行ったので正常に戻るかと
期待していたのですが…。

今回は「ブログ記事のメタデータ」、別段編集していないつもりなのです。

宜しくお願い致します。m(_._)m

[5] Posted by せなっち♪ : December 8, 2008 12:33 PM

こんばんは。日頃はMovableType関係の記事を拝見させて頂き、ありがとうございます。
さて、この記事で掲載されていた検索スパムですが、私のところにも1日200件位のペースでやってきていることがわかり、早速bzbellさんが話されたリネームによる対策を講じてみましたが、どうも効果が出ていません。
そこで、yujiroさんが記事の冒頭で書かれていた「検索機能を停止させる方法」をやってみたいのですが、それはどのような方法なのでしょうか?。
もし差し支えなければご教示ください。
(もしご教示頂けるようでしたら、私のメールアドレスへご連絡くださるようお願いします。)

[6] Posted by sinnchan logo : December 11, 2008 9:45 PM
コメントする
greeting

*必須

*必須(非表示)


ご質問のコメントの回答については、内容あるいは多忙の場合、1週間以上かかる場合があります。また、すべてのご質問にはお答えできない可能性があります。予めご了承ください。

太字イタリックアンダーラインハイパーリンク引用
[サインインしない場合はここにCAPTCHAを表示します]

コメント投稿後にScript Errorや500エラーが表示された場合は、すぐに再送信せず、ブラウザの「戻る」ボタンで一旦エントリーのページに戻り(プレビュー画面で投稿した場合は、投稿内容をマウスコピーしてからエントリーのページに戻り)、ブラウザをリロードして投稿コメントが反映されていることを確認してください。

コメント欄に(X)HTMLタグやMTタグを記述される場合、「<」は「&lt;」、「>」は「&gt;」と入力してください。例えば「<$MTBlogURL$>」は「&lt;$MTBlogURL$&gt;」となります(全て半角文字)