现在的做法是各位大佬认为鄙夷的方式,
抱歉,我还在用 request-html,因为是一些原因,我现在只能(会 or 选择)用这个。。。 :-(
while xxx:
try:
pageStr = someFunc.GetReauestRenderHtmlSourcetoStr(linkURL)
if len(pageStr) > 150:
success = True
#xxx 省略
pass
else:
#是的,就是这样粗暴地抛出,而没有在 request-html 本身上去做对策
raise Exception()
except:
# 记录下异常的时间节点
todoSomething(xxx)
这有个不好,request-html 使用的是 pyppeteer+chrome,在 raise Exception()抛出后,chrome.exe 还会在进程里残留的,不会自己退出,以前单线程还好,在循环的开始加个 os.system("taskkill -f -im chrome.exe")就完事了,现在多进程就不能这么做了。。。请教各位大佬有什么好办法?学习学习...
其实请教问题的实质,并不只是,想要把 request-html 如何回收得干净,如果 try 段里面,有更杂乱的调用话,try 本身是否有其它方法而不用根据 Exception 的内容,直接清干净? 还是只能老老实实,逐个应对?