亚洲最大av在线-床戏高潮做进去大尺度视频-国产中文字幕在线免费观看-久久久橹橹橹久久久久高清-国产一级做a爱免费视频-黄色三级av-亚洲涩涩涩-麻豆传媒在线免费-精品福利片-成人在线视频播放-国产永久在线-日韩欧美福利-在线播放免费av-国产做受高潮91软件-天天久久综合-欧美黄色一级-色天使在线观看

網(wǎng)頁數(shù)據(jù)抓取之自動分類功能

2016-09-10 14:17:52 瀏覽:8392

我們在使用火車采集器進行數(shù)據(jù)抓取的時候,會需要將采集內容包含某個字的所有內容都替換為某個固定的內容。使用場景如:我們從網(wǎng)站采集城市名稱,然后城市名稱示例:浙江省杭州市,我們需要將這個內容替換為杭州,這時就可以使用自動分類功能。

下面以百度為例介紹下用法,首先在火車采集器V9建立規(guī)則,內容采集規(guī)則的標簽編輯如下:

1.png

 

如上圖,我們想要將包含百度的標題 內容更替換為常用搜索網(wǎng)站,則寫成如下格式:

2.png

 

運行結果為:

3.png

 

就是數(shù)據(jù)抓取時將某字段所有內容自動分類的使用方法,在操作需要注意的是

1、一行一個分類,可以寫多個分類。若是一個關鍵詞符合多個分類,則優(yōu)先替換上面的分類,火車采集器中是按照從上至下的原則替換。

2、若是所有分類不符合的情況下,你想要將關鍵詞賦予為一個默認值,按下圖操作:

 

4.png


學會數(shù)據(jù)抓取的自動分類操作,對包含同類字段的內容進行分類就方便多了,大家也操作試試吧。

掃碼關注微信
五家渠市| 昌宁县| 交口县| 含山县| 九龙城区| 大姚县| 涡阳县| 奇台县| 临邑县| 和田市| 庄浪县| 密山市| 色达县| 嘉善县| 富源县| 兴和县| 丰城市| 洛川县| 石楼县| 平原县| 光山县| 云龙县| 大埔区| 永清县| 苏尼特右旗| 宣汉县| 图木舒克市| 邵武市| 清新县| 田阳县| 阿坝县| 鹤庆县| 共和县| 花莲市| 福海县| 久治县| 子洲县| 镇雄县| 峨眉山市| 剑川县| 洞口县|