久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

PHP擴(kuò)展之文本處理(二)——PCRE正則表達(dá)式語法15——性能

瀏覽:3日期:2022-09-16 08:49:25

模式中一些項(xiàng)可能比其他一些更加高效。 比如使用 [aeiou] 這樣的字符類會比可選路徑 (a|e|i|o|u) 高效。 一般而言, 用盡可能簡單的構(gòu)造描述需求是最搞笑的。 Jeffrey Friedl 書(精通正則表達(dá)式)中包含了很多關(guān)于正則表達(dá)式性能的討論。

當(dāng)一個模式以 .* 開始并且設(shè)置了?PCRE_DOTALL?選項(xiàng)時,模式通過PCRE隱式錨定, 因?yàn)樗梢云ヅ渥址拈_始。然而,如果?PCRE_DOTALL?沒有設(shè)置, PCRE 不能做這個優(yōu)化,因?yàn)?元字符不能匹配換行符,如果目標(biāo)字符串包含換行符, 模式可能會從一個換行符后面開始匹配,而不是最開始位置。 比如,模式?(.*) second?匹配目標(biāo)字符串 ”firstnand second”(n 是一個換行符)第一個捕獲子組結(jié)果是 ”and”。為了這樣做, PCRE 嘗試從目標(biāo)字符串中每個換行符后開始匹配。

如果你使用模式匹配沒有換行符的目標(biāo)字符串, 可以通過設(shè)置?PCRE_DOTALL?或以 ^.* 開始的模式明確指示錨定以獲取最佳性能。 這樣節(jié)省了 PCRE 沿目標(biāo)字符串掃描查找換行符重新開始的時間。

小心模式中的無限重復(fù)嵌套。這在應(yīng)用到不匹配字符串時可能會導(dǎo)致運(yùn)行時間很長。 考慮模式片段?(a+)*。

這個模式可以有 33 種方式匹配 ”aaaa”, 并且這個數(shù)字會隨著字符串的長度的增加迅速增加. (*重復(fù)可以匹配0,1,2,3,4次, 并且除了0外每種情況+都有不同次數(shù)的匹配對應(yīng))。 當(dāng)模式的剩余部分導(dǎo)致整個匹配失敗的時候, PCRE原則上回嘗試每種可能的變化, 這將會非常耗時。

對于一些簡單的情況的優(yōu)化是像?(a+)*b?這樣緊接著使用原文字符串.。 在著手正式匹配工作之前,PCRE 檢查目標(biāo)字符串后面是否有 ”b” 字符, 如果沒有就立即失敗。然而當(dāng)緊接著沒有原文字符的時候這個優(yōu)化是不可用的。 你可以比較觀察?(a+)*d?和上面模式的行為差異。 前者在應(yīng)用到整行的 ”a” 組成的字符串時幾乎是立即報(bào)告失敗, 而后者在目標(biāo)字符串長于 20 個字符時,時間消耗就相當(dāng)可觀。

標(biāo)簽: PHP
相關(guān)文章:
主站蜘蛛池模板: 平舆县| 瑞金市| 闻喜县| 宾川县| 达尔| 双辽市| 盐山县| 普格县| 丰顺县| 封丘县| 额济纳旗| 佛教| 宁阳县| 偏关县| 固安县| 凤台县| 三江| 昌江| 呼玛县| 曲阜市| 富蕴县| 乌兰察布市| 都昌县| 那坡县| 昌都县| 玉溪市| 临夏市| 祥云县| 丰都县| 柞水县| 宜宾市| 大渡口区| 吉首市| 福州市| 微山县| 共和县| 长汀县| 航空| 中牟县| 大埔区| 义马市|