MTのEntryBodyタグのwordsモディファイアについて

MTのEntryBodyタグのwordsモディファイアについて

Posted at February 4,2016 1:11 AM
Tag:[Modifier, MovableType]

MTのEntryBodyタグのwordsモディファイアについて調べてみました。

1.はじめに

本文に次のような記述があるとします。

XXXについて紹介します。

<img src="http://user-domain/" alt="hoge" />

XXXは最近とても人気があります。

この本文のHTMLタグ以外の日本語を抽出したい場合、MTEntryBodyタグにremove_htmlモディファイアを記述すると思います。

<$mt:EntryBody remove_html="1"$>

が、次のようにwordsモディファイアでも日本語だけの可能です。

<$mt:EntryBody words="100"$>

なぜwordsモディファイアでも実現可能なのかちょっと気になったので、このモディファイアの実装を調べてみました。

2.wordsモディファイアの実装

wordsモディファイアは、MT::Template::Tags::Entry::_hdlr_entry_bodyで次の赤色部分の実装が該当します。

sub _hdlr_entry_body {
    my ( $ctx, $args ) = @_;
        :
    return first_n_text( $text, $args->{words} ) if exists $args->{words};
    return $text;
}

first_n_text()はMT::I18Nのメソッドで、次のように定義されています。

sub first_n        { _handle( first_n        => @_ ) }
sub first_n_text { _handle( first_n => @_ ) }    # for backward compatibility

_handle()メソッドは、MT::I18Nで次のような実装です。

sub _handle {
    my $meth  = shift;
    my $lang  = _language();
    my $class = 'MT::I18N::' . $lang;
    $class->$meth(@_);
}

ここでは$langに"ja"が設定されているので、MT::I18N::jaのfirst_n()が起動されます。

sub first_n_ja {
    return __PACKAGE__->first_n_encode(@_);
}

さらにfirst_n_encode()が起動され、ようやく実際の実装が登場します。

sub first_n_encode {
    my $class = shift;
    my ( $text, $length, $enc ) = @_;
    require MT::Util;
    $text = MT::Util::remove_html($text);
    $text =~ s/(\r?\n)+/ /g;
    $text = substr( $text, 0, $length );
    return $text;
}

first_n_encode()ではまずremove_html()を実施しています。

そして改行をスペースに変換して、最後に必要な文字数を抽出しています。

つまりwordsモディファイアの動作は、

  • 不要なHTMLタグはカウント対象外
  • 改行はスペースに置き換え

ということになります。

関連記事
トラックバックURL


コメントする
greeting

*必須

*必須(非表示)


ご質問のコメントの回答については、内容あるいは多忙の場合、1週間以上かかる場合があります。また、すべてのご質問にはお答えできない可能性があります。予めご了承ください。

太字イタリックアンダーラインハイパーリンク引用
[サインインしない場合はここにCAPTCHAを表示します]

コメント投稿後にScript Errorや500エラーが表示された場合は、すぐに再送信せず、ブラウザの「戻る」ボタンで一旦エントリーのページに戻り(プレビュー画面で投稿した場合は、投稿内容をマウスコピーしてからエントリーのページに戻り)、ブラウザをリロードして投稿コメントが反映されていることを確認してください。

コメント欄に(X)HTMLタグやMTタグを記述される場合、「<」は「&lt;」、「>」は「&gt;」と入力してください。例えば「<$MTBlogURL$>」は「&lt;$MTBlogURL$&gt;」となります(全て半角文字)