python去除html标签

python
html

python去除html标签，自己写的，若有不足请指正：

#! /usr/bin/env python
#coding=utf-8
# blueel 2013-01-19
from HTMLParser import HTMLParser
 
class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)
 
def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

调用：

html = 'ou <label productIndex="0" class="skuBestInstallmentNumber">12</label>X de <label productIndex="0" class="skuBestInstallmentValue">R$ 116,58</label> sem juros'

print strip_tags(html)

上一篇：解决ImportError: libmysqlclient_r.so.16: cannot open shared object file
下一篇：用python实现的抓取腾讯视频所有电影的爬虫

PythonTab微信公众号:

Python技术交流互助群 ( 请勿加多个群 ):

群1: 87464755

群2: 333646237

群3: 318130924

群4: 385100854

python去除html标签

频道总排行

频道本月排行

最新文章

相关文章

python去除html标签

相关文章推荐

频道总排行

频道本月排行

最新文章

相关文章