高可匿代理获取工具

这几天写爬虫写的很疯狂,毕竟妹子对于我还是有很大吸引力的嘛~

在爬虫运行的阶段,我喜闻乐见的遭遇了反爬虫机制的阻击。于是经过一番较量,我先后伪造了Header,使用Selenium去Driver请求,用PhantomJs去渲染Response。但这一切都没有逃过反爬虫机制的法眼。在反反爬虫无数次之后,宝宝痛定思痛决定想一个长久的对策出来。

想想怎么样才能彻底不让反爬虫机制抓到?当然是把请求分散到不同的ip,然后多线程渲染啦。

然后问题就又来了,我上哪搞这么多代理ip去?

于是乱刀 v0.1版本应运而生,这个工具可以为我源源不断的提供高可匿的代理ip,这样我就可以愉快的爬取妹子的照片了,啦啦啦~~~

由于luandao的定位是辅助工具,所以我貌似只需要编译一个pyc出来就可以了。当然,你要是想单纯的获取一下代理地址,我这里也是支持的。

luandao的Github地址:

https://github.com/Elfsong/WintersWrath/blob/master/python/luandao.pyc




Enjoy Reading This Article?

Here are some more articles you might like to read next:

  • Resillience
  • Multi-Head Attention
  • Preference Alignment 101
  • Challenges in Code Generation
  • PREDICTING AND OPTIMIZING LLVM COMPILER PASS ORDER