素材网 素材网

java查询判断外网地址是否为死链

xw素材网
0

代码作用:

    因网站改变导致出现大量404错误页面,百度收录404页面数据有时候带有正确的网站地址,这样导致百度不能有效的处理404错误页面,所有我们要过滤的排查所有百度提供的404错误页面是否正确。


第一步:准备一个txt文件,里面每行放入一条链接地址

如图:


第二步:


首先读取txt文件里面每行的内容

 /** 
     * 以行为单位读取文件,常用于读面向行的格式化文件 
     */  
    public static void readFileByLines(String fileName) {  
    	Test2 read=new Test2();
        File file = new File(fileName);  
        BufferedReader reader = null;  
        try {  
            System.out.println("以行为单位读取文件内容,一次读一整行:");  
            reader = new BufferedReader(new FileReader(file));  
            String tempString = null;  
            int line = 1;  
            // 一次读入一行,直到读入null为文件结束  
            while ((tempString = reader.readLine()) != null) {  
                // 显示行号  
                
                String getRrl=read.ifURL(tempString);
                //System.out.println("返回值:"+getRrl);
                if(getRrl.equals("200"))
                {
                	System.out.println("line " + line + ": " + tempString+"==========【200】");  
                }else
                {
                	System.out.print(line+" | ");
                }
                line++;  
            }  
            reader.close();  
        } catch (IOException e) {  
            e.printStackTrace();  
        } finally {  
            if (reader != null) {  
                try {  
                    reader.close();  
                } catch (IOException e1) {  
                }  
            }  
        }  
    }

再次:读取到每条路径以后检查返回值为:400或200或301等状态

 public String ifURL(String url)
   {
	   String backValue="";
		//System.out.println("=========开始解析===============");
		try {  
            URL u = new URL("http://"+url);  
           // boolean connect=false;
            try {  
                HttpURLConnection uConnection = (HttpURLConnection) u.openConnection();  
                try {  
                    uConnection.connect();  
                    backValue=uConnection.getResponseCode()+"";
                   // System.out.println("返回值:"+uConnection.getResponseCode());  
                   // connect = true;  
                   
                } catch (Exception e) {  
                    //connect = false;  
                    e.printStackTrace();  
                   // System.out.println("connect failed");  
                }  
                  
            } catch (IOException e) {  
                //System.out.println("出现异常");  
                backValue="==出现异常===";
               // e.printStackTrace();  
            }  
              
        } catch (MalformedURLException e) {  
            //System.out.println(""); 
            backValue="==这个是图片路径!===";
           // e.printStackTrace();  
        }  
		return backValue;
   }

最后:调用Main函数开始执行检查吧。

public static void main(String args[]) throws IOException {
    readFileByLines("D:/baidu.txt");    
}


此类引用的包:

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;


@ 2013 xwcms.net . All Rights Reserved. xw素材网 | 备案号:晋ICP备13005902号 联系管理员
×

邮箱订阅

什么是邮箱订阅?

邮箱订阅是xw素材网为jquery爱好者与web程序员提供一项以邮箱的方式发送最新jquery资源与素材资源的模式,用户只需在左侧填写正确的邮箱用户名与邮箱地址我们将每天推荐最新优质资源到用户邮箱。当然每份邮箱都会有一个取消订阅按钮,当用户点击取消按钮时我们将会停止对用户发送邮箱资源推送。再次感谢大家对xw素材网的支持与关注。