简爱博客
PHP正则提取网页超链接
2013-1-26 简爱
<?php
// 正则提取网页超链接
function get_links($str) {
preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$str,$links);
while(list($key,$val) = each($links[2])) {
if(!empty($val))
$links2[] = $val;
}
return $links2;
}


$str = file_get_contents("http://www.gouji.org");
echo '<pre>';
print_r(get_links($str));
exit;

评论:
阿修
2013-03-27 23:21 回复
唉,码盲的梦想就是别人写的代码都能加上注释……
没注释真心看不懂啊- -