可用如下的代码来实现:
创新互联是专业的杜集网站建设公司,杜集接单;提供成都网站设计、网站制作,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行杜集网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!
?php
$str1="|1234|#2354#@2314@
|1314|#2154#@2214@
|1234|#2354#@2314@
|1314|#2154#@2214@";
if(preg_match_all("/\|(\d{4})\|\#(\d{4})\#\@(\d{4})\@/m",$str1, $out, PREG_PATTERN_ORDER))
for($i=0;$icount($out[0]);$i++)
{
echo "{'".$out[1][$i]."','".$out[2][$i]."','".$out[2][$i]."'}br/";
}
?
效果如下所示:
{'1234','2354','2354'}
{'1314','2154','2154'}
{'1234','2354','2354'}
{'1314','2154','2154'}
会用正则就会抓取。
不会正则,一时半会也教不错。
不过,推荐你使用phpQuery这个框架,用jQuery的使用器来抓取数据。
现获取此div的html串,然后处理。
例如:
ul
liMa hrMef="hMtMtp://xxx1" tarMget="_blaMnk" claMss=""/Ma/li
liMa hrMef="hMtMtp://xxx2" targMet="_blaMnk" claMss=""/Ma/li
/ul
正则:hMtMtp.+?(?=".+/a.*/li)
输出:
hMtMtp://xxx1
hMtMtp://xxx2
(把上面大写的M都去掉)
$string_1 = '
tr
td width=15% align=rightb电话:/b/td
td width=85%86666947/td
/tr
tr
td align=right b地址:/b/td
td 春熙路8号/td
/tr
tr
td align=right b人均:/b/td
td span class=f_red_14b14/span元/td
/tr
tr
td align=rightb菜系:/b/td
td快餐/小吃/td
/tr
'
;
preg_match_all ("|td[^]*([^(b)].*)/td|", $string_1, $out, PREG_PATTERN_ORDER);
print_r($out[1]);
---------------------------------------------------------
输出结果为:
Array
(
[0] = 86666947
[1] = 春熙路8号
[2] = 快餐/小吃
)