java爬虫多张图片代码,java爬虫爬取图片

java爬虫读取某一张指定图片的url,求解答

使用jsoup解析到这个url就行,dom结构如下:

成都创新互联专注于兴宾网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供兴宾营销型网站建设,兴宾网站制作、兴宾网页设计、兴宾网站官网定制、微信小程序服务,打造兴宾网络公司原创品牌,更为您提供兴宾网站排名全网营销落地服务。

look-inside-cover类只有一个,所以直接找到这个img元素,获取src属性,就可以获取到图片路径。

代码实现如下:

Document doc = Jsoup.connect("").get();

Elements imgs = doc.select(".look-inside-cover");

String imgUrl = imgs.get(0).attr("src");

jsoup的jar包分享给你:

java 怎么一次性读取多张图片

实现思路:一次性读取选中的统一路径下的多张图片,实现整体复制。

//复制文件夹

package com.cdd.util;

import java.io.*;

public class FileUtil {

private static void copy(File[] files, File d) {

if (!d.exists()) //如果指定目录不存在

d.mkdir(); //创建目录

for (int i = 0; i files.length; i++) { //循环遍历要复制的文件夹

if (files[i].isFile()) { //如果文件夹中是文件

try {

FileInputStream fis = new FileInputStream(files[i]); //创建FileInputStream对象

FileOutputStream out = new FileOutputStream(new File(d

.getPath()

+ File.separator + files[i].getName())); //复制后文件的保存路径

int count = fis.available();

byte[] data = new byte[count];

while ((str = bre.readLine())!= null) //读取文件通过readline方法可以有效的避免乱码

out.write(str ); //将读取的信息写入文件中

}

out.close(); //关闭流

fis.close();

} catch (Exception e) {

e.printStackTrace();

}

}

if (files[i].isDirectory()) { //如果文件夹中是一个路径

File des = new File(d.getPath() + File.separator

+ files[i].getName()); //在复制后路径中创建子文件夹

des.mkdir();

copy(files[i].listFiles(), des); //再次调用本方法

}

}

System.out.println("文件夹复制成功");

}

用java编写 网络爬虫求代码和流程 急

import java.awt.*;

import java.awt.event.*;

import java.io.*;

import java.net.*;

import java.util.*;

import java.util.regex.*;

import javax.swing.*;

import javax.swing.table.*;//一个Web的爬行者(注:爬行在这里的意思与抓取,捕获相同)

public class SearchCrawler extends JFrame{

//最大URL保存值

private static final String[] MAX_URLS={"50","100","500","1000"};

//缓存robot禁止爬行列表

private HashMap disallowListCache=new HashMap();

//搜索GUI控件

private JTextField startTextField;

private JComboBox maxComboBox;

private JCheckBox limitCheckBox;

private JTextField logTextField;

private JTextField searchTextField;

private JCheckBox caseCheckBox;

private JButton searchButton;

//搜索状态GUI控件

private JLabel crawlingLabel2;

private JLabel crawledLabel2;

private JLabel toCrawlLabel2;

private JProgressBar progressBar;

private JLabel matchesLabel2;

//搜索匹配项表格列表

private JTable table;

//标记爬行机器是否正在爬行

private boolean crawling;

//写日志匹配文件的引用

private PrintWriter logFileWriter;

//网络爬行者的构造函数

public SearchCrawler(){

//设置应用程序标题栏

setTitle("搜索爬行者");

//设置窗体大小

setSize(600,600);

//处理窗体关闭事件

addWindowListener(new WindowAdapter(){

public void windowClosing(WindowEvent e){

actionExit();

}

});

//设置文件菜单

JMenuBar menuBar=new JMenuBar();

JMenu fileMenu=new JMenu("文件");

fileMenu.setMnemonic(KeyEvent.VK_F);

JMenuItem fileExitMenuItem=new JMenuItem("退出",KeyEvent.VK_X);

fileExitMenuItem.addActionListener(new ActionListener(){

public void actionPerformed(ActionEvent e){

actionExit();

}

});

fileMenu.add(fileExitMenuItem);

menuBar.add(fileMenu);

setJMenuBar(menuBar);

Java中怎么抓取网页中的图片

通过httpclient来爬取网站内容,分析当前内容页中的图片‘规则’

抓取一般都是模拟浏览器访问目标网页,通过返回的页面html代码进行分析自己需要的数据

查找规则,例如你爬取的网页 ,看到当前页面显示的图片格式如下img src=""

通过解析爬取的网页源代码(html)进行字符串的操作即可,现在有相应的第三方jar包可以帮你更快的完成这部分工作,例如htmlpaser,获取到对应的地址,然后进行保存或下载。

你可以搜索,java爬虫(httpclient)和htmlpaser做更多的了解。


网页名称:java爬虫多张图片代码,java爬虫爬取图片
文章URL:http://bzwzjz.com/article/heehcg.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 手机网站建设 网站制作 宜宾网站设计 自适应网站建设 攀枝花网站设计 自适应网站设计 成都网站设计公司 成都网站建设 手机网站制作 网站设计 手机网站制作 盐亭网站设计 营销网站建设 网站建设费用 成都网站制作 成都营销网站制作 营销型网站建设 成都网站建设 企业网站设计 成都网站建设 成都商城网站制作 专业网站设计