文章詳情頁

Java中用爬蟲進行解析的實例方法

瀏覽：30日期：2022-08-19 10:50:30

我們都知道可以用爬蟲來找尋一些想要的數據，除了可以使用python進行操作，我們最近學習的java同樣也支持爬蟲的運行，本篇小編就教大家用java爬蟲來進行網頁的解析，具體內容請往下看：

1、springboot項目，引入jsoup

<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.10.2</version></dependency>

2、準備解析對象

Content.javapackage com.asia.pojo;import lombok.AllArgsConstructor;import lombok.Data;import lombok.NoArgsConstructor;@Data@NoArgsConstructor@AllArgsConstructorpublic class Content { private String title; private String img; private String price;}

3、爬蟲工具類

HtmlParseUtil.javapackage com.asia.utils;import java.net.URL;import java.net.URLDecoder;import java.util.ArrayList;import java.util.List;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import com.asia.pojo.Content;public class HtmlParseUtil {public static void main(String[] args) throws Exception {new HtmlParseUtil().parseJD('西瓜').forEach(System.out::println);}public List<Content> parseJD(String keywords) throws Exception {String url = 'https://search.jd.com/Search?keyword=' + URLDecoder.decode(keywords, 'GBK');// 解析網頁.（Jsoup返回Document就是瀏覽器的Document對象）Document document = Jsoup.parse((new URL(url)), 30000);Element element = document.getElementById('J_goodsList');Elements elements = element.getElementsByTag('li');List<Content> list = new ArrayList<Content>();for (Element el : elements) {String src = el.getElementsByTag('img').eq(0).attr('data-lazy-img');String price = el.getElementsByClass('p-price').eq(0).text();String name = el.getElementsByClass('p-name').eq(0).text();list.add(new Content(name, src, price));}return list;}}

到此這篇關于Java中用爬蟲進行解析的實例方法的文章就介紹到這了,更多相關Java中如何使用爬蟲進行解析內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網！

Java

上一條：java 注解默認值操作下一條：Java 利用binarySearch實現抽獎計算邏輯

相關文章：

1. asp知識整理筆記4（問答模式）2. CSS可以做的幾個令你嘆為觀止的實例分享3. XML入門的常見問題(二)4. JSP之表單提交get和post的區別詳解及實例5. 讀大數據量的XML文件的讀取問題6. jsp文件下載功能實現代碼7. 低版本IE正常運行HTML5+CSS3網站的3種解決方案8. ASP實現加法驗證碼9. javascript xml xsl取值及數據修改第1/2頁10. 概述IE和SQL2k開發一個XML聊天程序

排行榜

					
					PHP單件模式和命令鏈模式的基礎知識
Python多線程操作之互斥鎖、遞歸鎖、信號量、事件實例詳解
php strncmp函數原型源碼分析
Android基于AdapterViewFlipper實現的圖片/文字輪播動畫控件
JSP之表單提交get和post的區別詳解及實例
jsp文件下載功能實現代碼
部署vue+Springboot前后端分離項目的步驟實現
asp知識整理筆記4（問答模式）
ASP實現加法驗證碼
JSP+Servlet實現文件上傳到服務器功能
解決ajax請求后臺,有時收不到返回值的問題