本文 27480 pv

3

ip被封的解决方法

© kekehu / 信息抓取 / 2010.01.14 / 18:08 / 27480PV

最近各种网站的采集程序写的比较多,遇到在采时采到100多条时突然发现对方的网站打不开了,猜到肯定被封ip了,用了代理还是会封,这不是办法。在网上找了一些资料都没有找到,功夫不负有心人啊,在找的时侯有一个人提到了用搜索引擎爬虫蜘蛛的USERAGENT。虽然只提到一点点我还是想到了,列出我的解决方法,

1.使用Snoopy或curl传搜索引擎爬虫的USERAGENT值。
  查看搜索引擎爬虫的USERAGENT值:http://www.geekso.com/spdier-useragent/

2.使用Snoopy或curl传referer值。
   如:$snoopy->referer = 'http://www.google.com';
         $header[] = "Referer: http://www.google.com/";

3.使用Snoopy或curl代理。
   如:$snoopy->proxy_host  = "59.108.44.41";
         $snoopy->proxy_port  = "3128";

4.使用Snoopy或curl防造IP。
   如:$snoopy->rawheaders['X_FORWARDED_FOR'] = '127.0.0.1';
         $snoopy->rawheaders['CLIENT-IP'] = '127.0.0.1';

5.用php写一个重起路由器的程序,这样就会获得新的ip地址。

6.如果发现重起路由器还是显示被封,有可能对方封了你路由器的mac地址,现在路由器都有修改MAC的功能,可以写程序或手动修改路由器的MAC地址。

本文有 3 篇评论

  1. @ 111 说 :
    2013.04.12 11:12
    avatar

    千篇一律,说点自己的实际做过的嘛

  2. @ redice Email 说 :
    2011.06.28 18:29
    avatar

    代理才是王道。第6条肯定是不对的,有点TCP/IP常识的人都知道MAC地址只在局域网内有效。MAC位于以太头中,数据包离开每个路由器时,以太头中的MAC地址就会被替换为路由器的MAC地址。服务器能获取到的MAC地址最多只能是同局域网路由器的MAC,怎么可能获取客户端的MAC呢?

  3. @ 无题 说 :
    2010.12.26 20:58
    avatar

    还是不行哦!soso采集一样被封,不知道他怎么判断IP的,我们伪造的IP还是给识别吗?

1/1 第一页 1 最后页

发表你的见解

打开HTML 打开UBB 打开表情 隐藏 记住我
emotemotemotemotemotemotemotemotemotemotemotemotemotemotemotemotemotemotemotemot
emotemotemotemotemot