Spaces:
Sleeping
Sleeping
File size: 653 Bytes
bed01bd |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
from html.parser import HTMLParser
class HTMLTagRemover(HTMLParser):
def __init__(self):
super().__init__()
self.reset()
self.fed = []
def handle_data(self, data):
self.fed.append(data)
def get_data(self):
return "\n".join(self.fed)
def remove_html_tags(text):
parser = HTMLTagRemover()
parser.feed(text)
return parser.get_data()
if __name__ == "__main__":
input_text = "<h1>一个标题</h1> 这是一段包含<code>标签</code>的文本。"
output_text = remove_html_tags(input_text)
print(output_text) # 输出: 一个标题 这是一段包含标签的文本。
|