如果还带有 html 标签的话就很好去除了,这里将另外一种情况,就是文本已经格式化了,但乱码小尾巴还在
这个方法对 txt 小说之类的文字处理比较有用
使用编辑器用下面正则进行匹配替换
[^,。!?\u4e00-\u9fa5]{10,}$
正文完
如果还带有 html 标签的话就很好去除了,这里将另外一种情况,就是文本已经格式化了,但乱码小尾巴还在
这个方法对 txt 小说之类的文字处理比较有用
使用编辑器用下面正则进行匹配替换
[^,。!?\u4e00-\u9fa5]{10,}$