PHP正则提取网页超链接
<?php
// 正则提取网页超链接
function get_links($str) {
preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$str,$links);
while(list($key,$val) = each($links[2])) {
if(!empty($val))
$links2[] = $val;
}
return $links2;
}
$str = file_get_contents("http://www.gouji.org");
echo '<pre>';
print_r(get_links($str));
exit;
本文出自简爱博客,转载时请注明出处及相应链接。
评论
唉,码盲的梦想就是别人写的代码都能加上注释……
没注释真心看不懂啊- -