java采集网站上的二维码图片源码   

本项目的功能主要是对网站上的图片进行采集,目前是采集http://www.weixinqun.com/group?t=41上的二维码图片,大家可以按照自己的需求学习采集其他网站上的图片信息。适合大家练习爬虫。

主要用到的技术如下:

  • 使用HttpURLConnection模拟浏览器抓取网页内容
  • Timer定时任务设置
  • 多线程抓取以及线程池的使用
  • Jsoup解析网页操作

代码部分:

HttpClientUtil.fixedThreadPool.execute(new Runnable() {

    @Override
    public void run() {
        getWeiXinQun();
        if(minText.getText().equals("")){
             queryBtn.setEnabled(true);
        }
    }

});
String url = "http://www.weixinqun.com/group?p=0";
String content = HttpClientUtil.get(url);
Document doc = Jsoup.parse(content);
Elements els = doc.select("#tab_head li");
for (Element el : els) {
    Element img = el.getElementsByTag("a").get(0);
    String pageUrl = URL + img.attr("href");
    String html = HttpClientUtil.get(pageUrl);
    Document document = Jsoup.parse(html);
    String imgUrl = document.select(".iframe img").get(0).attr("src");
    downImage(imgUrl);
}

界面效果:

猿天地博客图片