久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

a標簽 url 正則怎么寫(python 或者js)

瀏覽:151日期:2022-07-17 17:06:50

問題描述

<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>

我要取 href里的鏈接

6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)

第二個和第三個鏈接相同 怎么去重復(python下)

問題解答

回答1:

# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:

提取前三個鏈接:

links= re.findall(r’href='http://www.baoyu77737.com/wenda/(.*?=rf)'’,l_string,re.S)

去重:

new_links=set(links)

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 凤冈县| 罗山县| 宁安市| 商都县| 同江市| 二连浩特市| 安龙县| 贵州省| 庆云县| 二连浩特市| 吴堡县| 白玉县| 兰考县| 油尖旺区| 铜鼓县| 奉节县| 宿州市| 康乐县| 自贡市| 红桥区| 通榆县| 沅江市| 台南市| 定远县| 渝北区| 北碚区| 沈阳市| 禄劝| 靖宇县| 寿阳县| 孝义市| 云林县| 牡丹江市| 安化县| 浏阳市| 雷州市| 左云县| 永川市| 黎平县| 侯马市| 大化|