天涯明月刀cv:如何分页?高难度!

来源:百度文库 编辑:中科新闻网 时间:2024/04/28 22:44:14
生成静态网页自动分页时,如何避免在截取的时候截断html语法?或可以在段落后截取?

现在我生成的静态网页,是按1500字节分一页,但是这样就造成有时将html语法截断了,有时出现乱码,因为截了汉字的一半,请问如何避免这种情况??(手工分页另论)

1.一半生成的静态页面每页都是固定的,内容是纯文字
2.先截取,再判定是不是,或.不是就往后继续截
3.也可以用正则表达式判定HTML标签的数量