Categorized | Biocompute

php将HTML转换为txt文本的函数

Posted on 04 四月 2009 by 柳城 ,阅读 496

利用php的preg_replace函数html中的标记进行替换。

function html2text($str,$encode = 'GB2312')
{

  $str = preg_replace("/<style .*?</style>/is", "", $str);
  $str = preg_replace("/<script .*?</script>/is", "", $str);
  $str = preg_replace("/<br s*/?/>/i", "n", $str);
  $str = preg_replace("/</?p>/i", "nn", $str);
  $str = preg_replace("/</?td>/i", "n", $str);
  $str = preg_replace("/</?div>/i", "n", $str);
  $str = preg_replace("/</?blockquote>/i", "n", $str);
  $str = preg_replace("/</?li>/i", "n", $str);

  $str = preg_replace("/&nbsp;/i", " ", $str);
  $str = preg_replace("/&nbsp/i", " ", $str);

  $str = preg_replace("/&amp;/i", "&", $str);
  $str = preg_replace("/&amp/i", "&", $str);

  $str = preg_replace("/&lt;/i", "<", $str);
  $str = preg_replace("/&lt/i", "<", $str);

  $str = preg_replace("/&ldquo;/i", '"', $str);
  $str = preg_replace("/&ldquo/i", '"', $str);

     $str = preg_replace("/&lsquo;/i", "'", $str);
     $str = preg_replace("/&lsquo/i", "'", $str);

     $str = preg_replace("/&rsquo;/i", "'", $str);
     $str = preg_replace("/&rsquo/i", "'", $str);

  $str = preg_replace("/&gt;/i", ">", $str);
  $str = preg_replace("/&gt/i", ">", $str); 

  $str = preg_replace("/&rdquo;/i", '"', $str);
  $str = preg_replace("/&rdquo/i", '"', $str); 

  $str = strip_tags($str);
  $str = html_entity_decode($str, ENT_QUOTES, $encode);
  $str = preg_replace("/&#.*?;/i", "", $str);
     
  return $str;
}

转载请注明 : 来源于 php将HTML转换为txt文本的函数 | 柳城

赞助商

2条评论 于 “php将HTML转换为txt文本的函数”

  1. Lc. Lc. Says:

    重新回来看这段代码,好奇怪~~
    用strip_tags函数更加好啊 :db:

    [回复]

    露水飘飘
    露水飘飘 回复:

    嗯 我想也是这样的

    [回复]

Leave a Reply

广告招租

[强] [握手] [可爱] [ok] [呲牙] :) [偷笑] [流泪] [疑问] [亲亲] [擦汗] [得意] [衰] [可怜] [抱拳] [坏笑] more »

无觅相关文章插件,快速提升流量