file标签读取文件之解决乱码问题

file标签读取文件之解决乱码问题

用FileReader API的readAsText读取上传的文件内容,但是选择的文件有可能是UTF-8编码,也有可能是GB2312,如何解决乱码的问题呢,请看下文:

通过FileReader()中的readAsDataURL读取文件,并引用jschardet进行编码检查,链接: jschardet ,也可以通过 npm install jschardet 进行安装.

详情看代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<script src="jquery.js"></script>
<script src="jschardet.js"></script>
</head>
<body>
<input id = "file" type="file" name="contractFileName" onchange="fileChange(this);" />
<br>
<br>
<input type="button" value="显示文件信息" onclick="showFileInformation();">
<script type="text/javascript">
var isIE = /msie/i.test(navigator.userAgent) && !window.opera;
function fileChange(target, id) {
var filetypes = [".xml"];
var filepath = target.value;
if (filepath) {
var isnext = false;
var fileend = filepath.substring(filepath.indexOf("."));
if (filetypes && filetypes.length > 0) {
for (var i = 0; i < filetypes.length; i++) {
if (filetypes[i] == fileend) {
isnext = true;
break;
}
}
}
if (!isnext) {
target.value = "";
alert("不接受此文件类型!");
if (isIE) {
var objFile = document.getElementById("file");
objFile.outerHTML = objFile.outerHTML.replace(/(value=\").+\"/i, "$1\"");
}
return false;
}
var imageEle=document.getElementById("file");
if (window.FileReader) {
var imageFileList=imageEle.files;
if (imageFileList.length > 0) {
var file=imageFileList[0];
var reader = new FileReader();
reader.readAsDataURL(file);
reader.onload = function(evt) {
var xmlResult = evt.target.result;
encoding = checkEncoding( xmlResult );
}
}
}
} else {
return false;
}
}

var showFileInformation=function(){
var imageEle=document.getElementById("file");
if (window.FileReader) {
var imageFileList=imageEle.files;
var file=imageFileList[0];
var reader = new FileReader();
reader.readAsText(file,encoding);
reader.onload = function(evt) {
var xmlResult = evt.target.result;
alert(encoding);
alert(xmlResult);
}
}
}

//检查编码,引用了 jschardet
function checkEncoding( base64Str ){
//这种方式得到的是一种二进制串
var str = atob( base64Str.split(";base64,")[1] );
//要用二进制格式
var encoding = jschardet.detect( str );
encoding = encoding.encoding;
if( encoding == "windows-1252"){ //有时会识别错误(如UTF8的中文二字)
encoding = "ANSI";
}
return encoding;
}
</script>
</body>
</html>

坚持原创技术分享,您的支持将鼓励我继续创作!