apache tika检测文件是否损坏

ApacheTika用于文件类型检测和从各种格局的文件内容提取的库。

将上传文件至服务器,进行解析文件时,经常需要判别文件是否损坏。咱们能够运用tika来检测文件是否损坏
maven引进如下:
org.apache.tikatika-app1.18xercesxercesImpl2.11.0
如果jar包抵触时能够引进如下:

Java


org.apache.tikatika-core1.18org.apache.tikatika-parsers1.18xercesxercesImpl2.11.0
运用tika检测文件是否损坏:
如果从输入流读取失败,则parse办法抛出IOException反常,从流中获取的文档不能被解析抛TikaException反常,处理器不能处理事件则抛SAXException反常
当文档不能被解析时,阐明文档损坏
履行过程:
publicstaticvoidmain(String[]args){
try{
//Assumesample.txtisinyourcurrentdirectory
Filefile=newFile(“D:\测验.txt”);
booleanresult=isParseFile(file);
}catch(Exceptione){
e.printStackTrace();
}
}
/**
*验证文件是否损坏
*
*@paramfile文件
*@returntrue/false
*@throwsException
*/
privatestaticbooleanisParseFile(Filefile)throwsException{
try{
Tikatika=newTika();
Stringfilecontent=tika.parseToString(file);
System.out.println(filecontent);
returntrue;
}catch(TikaExceptione){
returnfalse;
}
}

© 版权声明
好牛新坐标
版权声明:
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com

相关文章