名称:php使用xpath来进行采集页面的内容
当前代码
<?php $html=file_get_contents('https://www.sogou.com/sogou?query=gif压缩'); $dom = new DOMDocument(); //从一个字符串加载HTML @$dom->loadHTML($html); //使该HTML规范化 $dom->normalize(); //用DOMXpath加载DOM,用于查询 $xpath = new DOMXPath($dom); #获取所有的a标签的地址 $hrefs = $xpath->query("/html/body//a//@href"); for ($i = 0; $i < $hrefs->length; $i++) { $href = $hrefs->item($i); $linktext = $href->nodeValue; echo $linktext; echo "\r\n"; }