PHP preg_match_all() 函数

preg_match_all 函数用于执行一个全局正则表达式匹配。

语法

int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0 ]]] )

搜索 subject 中所有匹配 pattern 给定正则表达式的匹配结果并且将它们以 flag 指定顺序输出到 matches 中。

在第一个匹配找到后, 子序列继续从最后一次匹配位置搜索。

参数说明：

$pattern: 要搜索的模式字符串形式。
$subject: 输入字符串。
$matches: 多维数组作为输出参数输出所有匹配结果, 数组排序通过flags指定。
$flags：可以结合下面标记使用(注意不能同时使用PREG_PATTERN_ORDER和 PREG_SET_ORDER)：
1. PREG_PATTERN_ORDER:结果排序为$matches[0]保存完整模式的所有匹配, $matches[1] 保存第一个子组的所有匹配以此类推。
2. PREG_SET_ORDER:结果排序为$matches[0]包含第一次匹配得到的所有匹配(包含子组) $matches[1]是包含第二次匹配到的所有匹配(包含子组)的数组以此类推。
3. PREG_OFFSET_CAPTURE:如果这个标记被传递每个发现的匹配返回时会增加它相对目标字符串的偏移量。
offset: 通常查找时从目标字符串的开始位置开始。可选参数offset用于从目标字符串中指定位置开始搜索(单位是字节)。

返回值

返回完整匹配次数（可能是0）或者如果发生错误返回FALSE。

实例

查找匹配 与 标签的内容：

<?php $userinfo = "Name: PHP Title: Programming Language"; preg_match_all ("/(.*)/U", $userinfo, $pat_array); print_r($pat_array[0]); ?>

执行结果如下所示：

Array
(
    [0] => <b>PHP</b>
    [1] => <b>Programming Language</b>
)

查找匹配的HTML标签（贪婪）：

<?php //\2是一个后向引用的示例. 这会告诉pcre它必须匹配正则表达式中第二个圆括号(这里是([w]+)) //匹配到的结果. 这里使用两个反斜线是因为这里使用了双引号. $html = "bold text<a href=howdy.html>click me</a>"; preg_match_all("/(<([w]+)[^>]*>)(.*?)(</\2>)/", $html, $matches, PREG_SET_ORDER); foreach ($matches as $val) { echo "matched: " . $val[0] . "n"; echo "part 1: " . $val[1] . "n"; echo "part 2: " . $val[2] . "n"; echo "part 3: " . $val[3] . "n"; echo "part 4: " . $val[4] . "nn"; } ?>

执行结果如下所示：

matched: <b>bold text</b>
part 1: <b>
part 2: b
part 3: bold text
part 4: </b>

matched: <a href=howdy.html>click me</a>
part 1: <a href=howdy.html>
part 2: a
part 3: click me
part 4: </a>

PHP 正则表达式(PCRE)

#2687

PHP 中文分词 , php5 支持模式修饰符u ,

$str = "hi钓鱼岛是中国的";

preg_match_all("/./u", $str, $arr);

print_r($arr[0]);

PHP分割中文字符串

$str = "爱莲说";

preg_match_all('/[\x{4e00}-\x{9fa5}]/u',$str,$arr);

dump($arr);

//////

还有就是专业的SCWS 中文分词 SCWS 是 Simple Chinese Word Segmentation,基于词频词典的机械式中文分词引擎,将一整段的中文正确地切分成词,纯C语言开发,不依赖外部库函数,用动态链接库嵌入应用程序,支持GBK、UTF-8 等, PHP 扩展模块在PHP中用分词能满足一些小型搜索引擎关键字提取等场合运用 //github.com/hightman/scws

#2554

protected function getAllLinks($str,$mustHas="",$mustNoHas=""){

$links = array();

preg_match_all("/(href)\s*=\s*[\'\"]?(([[a-z]{3,5}:\/\/(([.a-zA-Z0-9-])+(:[0-9]+)*))*([+:%\/\?~=&;\\,._a-zA-Z0-9-]*))(#[.a-zA-Z0-9-]*)?[\'\" ]?(\s*rel\s*=\s*[\'\"]?(nofollow)[\'\"]?)?/i", $str, $regs);

foreach($regs[2] as $link){

if(!empty($mustHas) && (stripos($link,$mustHas)===false)){continue;}

if(!empty($mustNoHas) && (stripos($link,$mustHas)!==false)){continue;}

$links[]=$link;

}

return $links;

PHP 表单

PHP 高级教程

PHP 数据库

PHP 与 AJAX

PHP XML

PHP 参考手册

PHP preg_match_all() 函数

语法

返回值

实例

查找匹配 <b> 与 </b> 标签的内容：

查找匹配的HTML标签（贪婪）：

2篇笔记写笔记

尊贵的董事大人

PHP 表单

PHP 高级教程

PHP 数据库

PHP 与 AJAX

PHP XML

PHP 参考手册

PHP preg_match_all() 函数

语法

返回值

实例

查找匹配 <b> 与 </b> 标签的内容：

查找匹配的HTML标签（贪婪）：

2篇笔记写笔记

尊贵的董事大人

分类导航

Advertisement

微信关注