最新公告
  • 欢迎您光临 我爱模板网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境! 立即加入钻石VIP
  • 帝国cms分页采集正则及过滤技巧

    正文概述 管理员   2025-09-05   4

    老实说我并不主张网站采集,不过做为站长,网页采集实在是一大利器。拿帝国CMS来说,采集功能很强大。虽然帝国CMS采集方法简单易学,但还是有朋友为采集规则而绞尽脑汁。以下是我悼念的一些帝国CMS的采集正则。

    从文章的源代码中获得的

    第一种:

    <p align='center'><b><font color='red'>[1]</font>&nbsp;<a href='/Eat/RMenu/200806/38611_2.html'>[2]</a>&nbsp;<a href='/Eat/RMenu/200806/38611_3.html'>[3]</a>&nbsp;<a href='/Eat/RMenu/200806/38611_4.html'>[4]</a>&nbsp;<a href='/Eat/RMenu/200806/38611_2.html'>下一页</a> </b></p>

    编写的规则:

    选全部列出式区域正则:

    <p align='center'><b><font color='red'>[!--smallpageallzz--]'>下一页
    

    链接正则:

    <a href='[!--pageallzz--]'>
    
    

    第二种

    采集代码

    <p align='center'><b><font color='red'>[1]</font>&nbsp;<a href='/lw/3/lw_31205_2.html'>[2]</a>&nbsp;<a href='/lw/3/lw_31205_2.html'>下一页</a> </b></p> <center>《
    
    

    编写的规则:

    选用上下导航式:
    分页区域正则:<font color='red'>[!--smallpagezz--]下一页
    分页链接正则:<a href='[!--pagezz--]'
    新闻正文正则:

     src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
    </script></td>
     </tr>
     </table>[!--newstext--]</td>
     </tr>
     <tr>
     <td width=5></td>

    过滤广告正则:

    </p> <center>[!--ad--]</center>,</p><p align='center'>[!--ad--]</b>

    例如:https://www.daixiao360.cn/js/271.html

    第三种

    <p align="center"><img src="/bgy/Images_1/sy8.gif" border="0" align="absbottom"> <FONT style="COLOR: #ff0000">【1】</font> <a class=page href="094221656-2.html" target=_self>【2】</a> <a class=page href="094221656-3.html" target=_self>【3】</a> <a class=page href="094221656-4.html" target=_self>【4】</a> <a class=page href="094221656-5.html" target=_self>【5】</a> <a href="094221656-2.html"><img src="/gwy/Images1/xy.gif" border="0" align="absbottom"></a></p>

    编写的规则:

    "全部列出"式正则设置:

    分页区域正则(无)
    分页链接正则: <a class=page href="[!--pageallzz--]" target=_self>

    第四种:

    <DIV class=pageContainer> <DIV class=pager><span class="nextprev">&lt;&lt; 前一页</span><span class="current">1</span><a href="0731_3493_686224_1.shtml" title="转到第2页">2</a><a href="0731_3493_686224_2.shtml" title="转到第3页">3</a><a href="0731_3493_686224_1.shtml" class="nextprev" title="后一页">后一页 &gt;&gt;</a></DIV></DIV></DIV>
    </div>

    选全部列出式区域正则:

    <DIV class=pageContainer> <DIV class=pager><span class="nextprev">[!--smallpageallzz--]" class="nextprev" title="后一页">
    
    

    链接正则:

    <a href="[!--pageallzz--]"

    我爱模板网 » 帝国cms分页采集正则及过滤技巧

    发表评论

    如需帝国cms功能定制以及二次开发请联系我们

    联系作者
    script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?587cc1e5c052b5b0ce99533beff13c96"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();

    请选择支付方式

    ×
    支付宝支付
    余额支付
    ×
    微信扫码支付 0 元