a標(biāo)簽 url 正則怎么寫(python 或者js)
問題描述
<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>
我要取 href里的鏈接
6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數(shù)viewkey page viewtype category)
第二個和第三個鏈接相同 怎么去重復(fù)(python下)
問題解答
回答1:# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三個鏈接:
links= re.findall(r’href='http://www.aoyou183.cn/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相關(guān)文章:
1. python的文件讀寫問題?2. javascript - h5上的手機號默認(rèn)沒有識別3. mysql里的大表用mycat做水平拆分,是不是要先手動分好,再配置mycat4. javascript - 圖片鏈接請求一直是pending狀態(tài),導(dǎo)致頁面崩潰,怎么解決?5. javascript - 關(guān)于圣杯布局的一點疑惑6. python - 獲取到的數(shù)據(jù)生成新的mysql表7. javascript - 請問 chrome 為什么會重復(fù)加載圖片資源?8. window下mysql中文亂碼怎么解決??9. javascript - jquery hide()方法無效10. 怎么用css截取字符?
