PHP采集代码实例,支持正则表达式设置从开始到结束区域,代码如下:
<?php
function preg_substr($start, $end, $str) // 正则截取函数
{
$temp = preg_split($start, $str);
$content = preg_split($end, $temp[1]);
return $content[0];
}
function str_substr($start, $end, $str) // 字符串截取函数
{
$temp = explode($start, $str, 2);
$content = explode($end, $temp[1], 2);
return $content[0];
}
// ---------------- 使用实例 ----------------
$str = iconv("UTF-8", "GB2312", file_get_contents("http://www.mycodes.net"));
echo ('标题: ' . str_substr("<title>", "</title>", $str)); // 通过字符串提取标题
echo ('作者: ' . preg_substr("/userid=d+">/", "/<//", $str)); // 通过正则提取作者
echo ('内容: ' . str_substr('<div class="content">', '</div>', $str)); //内容当然不可以少
?>