1. <var id="fe6gj"></var>

    <rp id="fe6gj"><nav id="fe6gj"></nav></rp>

    <noframes id="fe6gj"><cite id="fe6gj"></cite>

    <ins id="fe6gj"><button id="fe6gj"><p id="fe6gj"></p></button></ins>
    1. <tt id="fe6gj"><i id="fe6gj"><sub id="fe6gj"></sub></i></tt>
        始創于2000年 股票代碼:831685
        咨詢熱線:0371-60135900 注冊有禮 登錄
        • 掛牌上市企業
        • 60秒人工響應
        • 99.99%連通率
        • 7*24h人工
        • 故障100倍補償
        您的位置: 網站首頁 > 幫助中心>文章內容

        用俠客站群系統對某健康網保健欄目抓取模塊

        發布時間:  2012/8/24 11:13:28

        本節進入使用俠客站群系統對某健康網抓取模塊流程2的制作,采取正則提取內容鏈接,在普通教程里,這節是按視覺提取的,我也這么操作過,但是通過篩選,怎么也弄不出來,只好通過源文件設置了正則公式才告成功,正則不明白的可以去www.xiake5.com網站看相關視頻。

        找到上節里提到的入口地址:http://man.xx.net/nxbj/bjcs,咱們進去瞅瞅吧:

        圖片1.jpg

         

        看到了吧,這些都是文章,成片的文章吶,嘎嘎嘎,抓走,取走,一個不留,三光政策,還等啥呢,下手吧,找源文件吧:

        圖片2.jpg

         

        這里我把源文件和頁面都調到了一起 了,這樣更容易看一點,呵呵,頁面上的文章,在源文件里都看到了吧,利用正則,全都提取,在這里我試過其他辦法,就是不行,只有使用正則,才能提取,不知 道是不是因為是JS的問題,利用俠客站點上提供的:俠客正則測試工具,測試下正則公式吧:

        圖片3.jpg

         

        恩,正則公式提取內容鏈接成功,將公式復制下來后,

        在回來的頁面:

        圖片5.jpg

         

        點擊“流程2:獲取內容鏈接”,彈出:

        圖片6.jpg

         

        選擇“未命名規則”,彈出

        圖片7.jpg

         

        好滴啦,這樣流程2就算提取完了,一步步的保存就可以了,流程3內容取得,下回書再說。

        圖片4.jpg


        本文出自:億恩科技【www.endtimedelusion.com】

        服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

      1. 您可能在找
      2. 億恩北京公司:
      3. 經營性ICP/ISP證:京B2-20150015
      4. 億恩鄭州公司:
      5. 經營性ICP/ISP/IDC證:豫B1.B2-20060070
      6. 億恩南昌公司:
      7. 經營性ICP/ISP證:贛B2-20080012
      8. 服務器/云主機 24小時售后服務電話:0371-60135900
      9. 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
      10. 專注服務器托管17年
        掃掃關注-微信公眾號
        0371-60135900
        Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
          0
         
         
         
         

        0371-60135900
        7*24小時客服服務熱線

         
         
        av不卡不卡在线观看_最近2018年中文字幕_亚洲欧美一区二区三区_一级A爱做片免费观看国产_日韩在线中文天天更新_伊人中文无码在线