我想从
http://www.gosugamers.net/starcraft2 抓点赛事信息,具体就是Upcoming matches、Started GosuBets以及Recent results三块内容,于是用了Hpple这个库,我是这样写的:
NSData *siteData = [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://www.gosugamers.net/starcraft2"]];
TFHpple *xpathParser = [[TFHpple alloc] initWithHTMLData:siteData];
upcomingArray = [xpathParser searchWithXPathQuery:@"//div[@id='box_latest_gosubets_upcoming_matches']/div[@class='last_middle']"];
startedArray = [xpathParser searchWithXPathQuery:@"//div[@id='box_latest_gosubets_started_gosubets']/div[@class='last_middle']"];
recentArray = [xpathParser searchWithXPathQuery:@"//div[@id='box_latest_gosubets_recent_results']/div[@class='last_middle']"];
前面两个没问题,把每一个<div class="last_middle">下的内容都找出来了,问题是recentArray, 它把10个div塞到一块去了,而且结构也乱掉了。
我看网页源代码中这三个部分挺工整的呀,就是id不同而已,不知道为什么前面工作的好好的,第三个就出错了,捉急呀。