老版地址(仅作固定作用):old.jincong.net

DEDE采集规则过滤与替换

过滤与替换常用操作:点击“常用规则&dquo;,选择要过滤的代码段,再编辑成我们需要的。如果会文章简单采集了,接下来就需要过滤掉采集内容中的广告和链接及其它代码。一般的写法是{dede:im}要过滤的内容{/dede:......
以下是【金聪采编】分享的内容全文:

过滤与替换常用操作:点击“常用规则”,选择要过滤的代码段,再编辑成我们需要的。

如果会文章简单采集了,接下来就需要过滤掉采集内容中的广告和链接及其它代码。一般的写法是{dede:trim}要过滤的内容{/dede:trim}  ,举几个例子:

1,去除超链接,这种最常用。

{dede:trim replace=''}<a([^>]*)>{/dede:trim}

{dede:trim replace=''}</a>{/dede:trim}

如果填成这样,那就把链接的文本也一起去掉了

{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}

2,过滤JS调用广告,比如GG的广告,就加个这样的:

{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}

3,过滤div标签。这个很重要,如果没过滤干净则可能使发布出来的文章版面错位,目前大多数遇到采集后错位的原因在此。

{dede:trim replace=''}<div([^.]*)>{/dede:trim}

{dede:trim replace=''}</div>{/dede:trim}

有的时候也需要这样子过滤:

{dede:trim replace=''}<div 选择器>(.*)</div>{/dede:trim}

4,其它的过滤规则可以照以上规律进行推出。

5,过滤摘要和关键字使用,经常要用到。

{dede:trim replace=''}{/dede:trim}

6,简单替换。

{dede:trim replace='替换后的词语'}要替换的词语{/dede:trim}

采集的内容当然也要求搜索引擎收录,过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。

金聪线报提示:[ DEDE采集规则过滤与替换 ] 仅为会员分享交流,仅供学习、参考使用,请勿用于其他用途,如果想商业使用或者代理,请自行联系版权方获取授权。任何未获取授权的商业使用与本站无关,请自行承担相应责任。
本站不存储任何资源文件,敬请周知!
此资源仅供个人学习、研究使用,禁止非法转播或商业用途,请在获取后24小时内删除,如果你觉得满意,请寻求购买正版或获取授权!
免责申明:本站仅提供学习的平台,所有资料均来自于网络分享线索,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请提供相应的资质证明,我们将于3个工作日内予以处理。版权申诉相关说明
本网站采用 BY-NC-SA 协议进行授权 转载请注明原文链接:DEDE采集规则过滤与替换
221381
领取福利

微信扫码领取福利

微信扫码分享