亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

Java獲取網頁數據步驟方法詳解

瀏覽:41日期:2022-09-03 17:03:35

在很多行業當中,我們需要對行業進行分析,就需要對這個行業的數據進行分類,匯總,及時分析行業的數據,對于公司未來的發展,有很好的參照和橫向對比。面前通過網絡進行數據獲取是一個很有效而且快捷的方式。首先我們來簡單的介紹一下,利用java對網頁數據進行抓取的一些步驟,有不足的地方,還望指正,哈哈。屁話不多說了。

其實一般分為以下步驟:

1:通過HttpClient請求到達某網頁的url訪問地址(特別需要注意的是請求方式)

2:獲取網頁源碼

3:查看源碼是否有我們需要提取的數據

4:對源碼進行拆解,一般使用分割,正則或者第三方jar包

5:獲取需要的數據對自己創建的對象賦值

6:數據提取保存

下面簡單的說一下在提取數據中的部分源碼,以及用途:

/** * 向指定URL發送GET方法的請求 * * @param url * 發送請求的URL * @param param * 請求參數,請求參數應該是 name1=value1&name2=value2 的形式。 * @return URL 所代表遠程資源的響應結果 */ public static String sendGet(String url, String param) { String result = ''; BufferedReader in = null; try { String urlNameString = url; URL realUrl = new URL(urlNameString); // 打開和URL之間的連接 URLConnection connection = realUrl.openConnection(); // 設置通用的請求屬性 connection.setRequestProperty('accept', '*/*'); connection.setRequestProperty('connection', 'Keep-Alive'); connection.setRequestProperty('user-agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;SV1)'); // 建立實際的連接 connection.connect(); // 獲取所有響應頭字段 Map<String, List<String>> map = connection.getHeaderFields(); // 定義 BufferedReader輸入流來讀取URL的響應 in = new BufferedReader(new InputStreamReader( connection.getInputStream())); //這里如果出現亂碼,請使用帶編碼的InputStreamReader構造方法,將需要的編碼設置進去 String line; while ((line = in.readLine()) != null) {result += line; } } catch (Exception e) { System.out.println('發送GET請求出現異常!' + e); e.printStackTrace(); } // 使用finally塊來關閉輸入流 finally { try {if (in != null) { in.close();} } catch (Exception e2) {e2.printStackTrace(); } } return result; }

解析存儲數據

public Bid getData(String html) throws Exception { //獲取的數據,存放在到Bid的對象中,自己可以重新建立一個對象存儲 Bid bid = new Bid(); //采用Jsoup解析 Document doc = Jsoup.parse(html); // System.out.println('doc內容' + doc.text()); //獲取html標簽中的內容tr Elements elements = doc.select('tr'); System.out.println(elements.size() + '****條'); //循環遍歷數據 for (Element element : elements) { if (element.select('td').first() == null){continue; } Elements tdes = element.select('td'); for(int i = 0; i < tdes.size(); i++){this.relation(tdes,tdes.get(i).text(),bid,i+1); } } return bid; }

得到的數據

Bid { h2 = ’詳見內容’, itemName = ’訴訟服務中心設備采購’, item = ’貨物/辦公消耗用品及類似物品/其他辦公消耗用品及類似物品’, itemUnit = ’詳見內容’, areaName = ’港北區’, noticeTime = ’2018年10月22日 18:41’, itemNoticeTime = ’null’, itemTime = ’null’, kaibiaoTime = ’2018年10月26日 09:00’, winTime = ’null’, kaibiaoDiDian = ’null’, yusuanMoney = ’¥67.00元(人民幣)’, allMoney = ’null’, money = ’null’, text = ’’}

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Java
相關文章:
主站蜘蛛池模板: 成人日韩视频 | 香蕉依依精品视频在线播放 | 国产美腿丝袜福利视频在线观看 | 日韩毛片在线 | 亚洲黄色官网 | 国产高清在线精品 | 亚洲91在线 | 日本xxx高清免费视频 | 操亚洲女人 | 国产成人精品综合久久久 | 国产午夜a理论毛片在线影院 | 国语自产免费精品视频在 | 国产又色又爽在线观看 | 在线不卡视频 | 国产成人久久精品二区三区牛 | 日韩不卡一级毛片免费 | 亚洲色图国产精品 | 亚洲欧美日韩成人 | 欧美一级做一a做片性视频 欧美一级做一级爱a做片性 | 91精品麻豆 | 精品久久久久久国产91 | 国产又黄又免费aaaa视频 | www在线小视频免费 www在线观看免费视频 | 国产亚洲欧美另类一区二区三区 | 女神穿上情趣丝袜啪啪一整晚 | 免费观看性行为的视频网站 | 免费在线观看色 | 久久草在线视频播放 | 欧美一级特黄aa大片视频 | 亚洲一级毛片免观看 | 国产 日韩 欧美 亚洲 | 精品视频 九九九 | 欧美精品成人一区二区视频一 | 精品国产九九 | 国产亚洲精品久久久久91网站 | 日本乱人伦片中文三区 | 青木玲中文字幕一区二区 | 国产精品视频99 | 国产精品嫩草影院一二三区 | 最新国产午夜精品视频成人 | 亚洲成a人片毛片在线 |