pattern = re.compile('<div.?author.?title="(.*?)"',re.S)
pattern = re.compile('<div.*?class="content">(.*?)</div>',re.S)
pattern = re.compile('<i.*?class="number">(.*?)</i>',re.S)
以上注释的正常出结果
pattern = re.compile('<div.*?author.*?title="(.*?)".*?<div.*?class=".*?<div.*?class="content">(.?)</div>.?<i.*?class="number">(.*?)</i>',re.S)
三个合起来的不出结果,不知是什么问题
后面试着改了几次,结果有几次输出八进制
这是写的爬糗百的。。,求指点