PHP正则提取网页超链接

简爱代码>PHP2013-1-26 23:2047081
<?php
// 正则提取网页超链接
function get_links($str) {
  preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$str,$links);
  while(list($key,$val) = each($links[2])) {
    if(!empty($val))
    $links2[] = $val;
  }
  return $links2;
}


$str = file_get_contents("http://www.gouji.org");
echo '<pre>';
print_r(get_links($str));
exit;

本文出自简爱博客,转载时请注明出处及相应链接。

评论

  1. 阿修2013-03-27 23:21回复

    唉,码盲的梦想就是别人写的代码都能加上注释……
    没注释真心看不懂啊- -