越简单越好!

采集的小小心得

发表于 2006-08-04 17:38 | 1076次阅读 0次点赞   杂七杂八

今天弄好了对XXX音乐网的采集(PHP).感觉心情挺好.也是初次在这里弄了个博客.

介绍一下几个采集常用函数: file_get_contents,preg_match_all,explode,eregi_replace.

file_get_contents : 这个是用来对网页的源文件进行读操作,(就像读文件一样将返回为一个字符串).另外几个函数都是在这个的基础上进行操作的.

preg_match_all:这是一个正则匹配函数.和一般的preg_match,ereg都不一样.它有它自己的一个特殊功能.

int preg_match_all ( string pattern, string subject, array matches [, int flags])

subject中搜索所有与pattern给出的正则表达式匹配的内容并将结果以flags指定的顺序放到matches中。

搜索到第一个匹配项之后,接下来的搜索从上一个匹配项末尾开始

这个功能就是:搜索能从上一个匹配项末尾开始下一个匹配项.   值就为flags[0][0],flags[0][1],flags[0][2]......

用途就是能直接匹配出你想要的所有结果.

explode:一个分割函数,用来切取我们想要的那一段.



eregi_replace:这个是替换函数,有的东西不想要了什么的就用这个替换成空,别人的网址什么的替换成自己的.


下班了没有时间了,下次来举个例子.呵!~~~~~~~~~~

返回顶部 ^