今天弄好了对XXX音乐网的采集(PHP).感觉心情挺好.也是初次在这里弄了个博客.
介绍一下几个采集常用函数: file_get_contents,preg_match_all,explode,eregi_replace.
file_get_contents : 这个是用来对网页的源文件进行读操作,(就像读文件一样将返回为一个字符串).另外几个函数都是在这个的基础上进行操作的.
preg_match_all:这是一个正则匹配函数.和一般的preg_match,ereg都不一样.它有它自己的一个特殊功能.
int preg_match_all ( string pattern, string subject, array matches [, int flags])
在subject中搜索所有与pattern给出的正则表达式匹配的内容并将结果以flags指定的顺序放到matches中。
搜索到第一个匹配项之后,接下来的搜索从上一个匹配项末尾开始。
这个功能就是:搜索能从上一个匹配项末尾开始下一个匹配项. 值就为flags[0][0],flags[0][1],flags[0][2]......
用途就是能直接匹配出你想要的所有结果.
explode:一个分割函数,用来切取我们想要的那一段.
下班了没有时间了,下次来举个例子.呵!~~~~~~~~~~