我的日常

登录/注册
您现在的位置:论坛 盖世程序员(我猜到了开头 却没有猜到结局) 盖世程序员 > php如何检测文件编码方法
总共48087条微博

动态微博

查看: 1198|回复: 0

php如何检测文件编码方法

[复制链接]

279

主题

41

听众

689

金钱

版主

该用户从未签到

跳转到指定楼层
楼主
发表于 2015-07-15 20:48:49 |只看该作者 |倒序浏览
关于文件编码的检测,百度一下一大把都是,但是确实没有能用的、
; ~% @0 g/ _' {0 a很多人建议 mb_detect_encoding 检测,可是不知为何我这不成功,什么都没输出、
1 @' e8 ]0 ^8 E, p( e* L看到有人写了个增强版,用 BOM 判断的,我果断就无视了,这东西完全不靠谱、  z; r3 F8 }. M5 B" T* `
最终根据PHP手册里 mb_detect_encoding 函数下方的例子,自己写了一个检测函数,
) y! G9 O! B# l6 w还包括自动检测编码并按指点编码读取文件的函数、" k1 d. y: _5 U; l
源码献上,不喜勿喷。6 q2 N" |# c! e/ f* b3 y' R
网上的方法我试过没用才写的,说不定环境不一样导致的。
% m9 m$ \, p% O8 I* t所以万一没用,也别喷我,我只是共享想思路而已、、
7 g( w- P* g, J9 L  K
  1. <?php
    % Y7 w/ a. c3 o5 W2 A4 j$ w
  2. /**2 G9 Q0 ]. D- V. |! E+ }0 t# M
  3. * 检测文件编码9 k9 p  [% I# _* N# L7 ^; x
  4. * @param string $file 文件路径$ Q; Z6 y, e& [
  5. * @return string|null 返回 编码名 或 null
    & r4 q6 E& W& N8 y, v  z
  6. */
    . K* J, q, v/ U/ T* y  w
  7. function detect_encoding($file) {
    6 W3 \- P& G4 o) b, }$ g; I0 ?
  8.     $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');- G. Q7 E- H. M- ~8 U8 B9 Y. K  _
  9.     $str = file_get_contents($file);
    # p2 Q  r: d' M
  10.     foreach ($list as $item) {
    # j, R0 I0 N  L) b* O. x" a6 w
  11.         $tmp = mb_convert_encoding($str, $item, $item);5 ]' B' q: F8 o& z7 q! I0 C
  12.         if (md5($tmp) == md5($str)) {, P6 t" `7 q1 A) ^' t
  13.             return $item;
    ; m1 K0 f* S; @+ f8 s+ ^
  14.         }( R. U3 N; D" J
  15.     }
    & j/ ^4 H+ [0 O# P$ T/ O: ~; w- N  F1 R# c
  16.     return null;& }1 I2 f* Z* V
  17. }, f9 s6 a8 j; S  m0 ?8 U- T% E

  18. 9 G1 i$ @, X: O
  19. /**5 t% ^0 R, m7 H; {9 C$ M
  20. * 自动解析编码读入文件; E+ f" e$ v* v9 Q  W+ r
  21. * @param string $file 文件路径$ G! w, j; z) u& Y3 L6 d  y
  22. * @param string $charset 读取编码/ O3 ~$ P+ x1 D0 M/ R! H+ X
  23. * @return string 返回读取内容$ F4 P" ~9 c- t, W- n: S0 ?0 c4 }
  24. */; u$ V' Z6 ~/ c  ^
  25. function auto_read($file, $charset='UTF-8') {2 R7 {& |- m& U$ U+ t
  26.     $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
    * F5 G$ L. w- O2 ?, R0 f
  27.     $str = file_get_contents($file);/ c1 f. W( \1 n& B% a. r
  28.     foreach ($list as $item) {- w( n7 u  V% S8 M/ L$ d# x4 I
  29.         $tmp = mb_convert_encoding($str, $item, $item);* u9 P% j2 e$ i& ~2 ~6 O7 z
  30.         if (md5($tmp) == md5($str)) {
    + P1 F* p. }3 ]0 E! h2 `# M% H
  31.             return mb_convert_encoding($str, $charset, $item);
    / S' e" ]2 C& r4 m1 b* I
  32.         }: O; D+ y8 M% j
  33.     }
    8 c2 E" l( L. I, E1 {4 M2 ]5 x
  34.     return "";! B5 R6 |$ D6 Z! q1 F% v; S& c
  35. }
复制代码

$ o+ l0 x) L6 l; {% A! W6 Q0 ]1 C. y: F; D- |3 H1 G$ z8 l# |
+ x( N+ W! F% z$ p

8 M! z6 t5 H% V) ~% ^8 ^: j

科帮网 1、本主题所有言论和图片纯属会员个人意见,与本社区立场无关
2、本站所有主题由该帖子作者发表,该帖子作者与科帮网享有帖子相关版权
3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和科帮网的同意
4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
7、科帮网管理员和版主有权不事先通知发贴者而删除本文


JAVA爱好者①群:JAVA爱好者① JAVA爱好者②群:JAVA爱好者② JAVA爱好者③ : JAVA爱好者③

快速回复
您需要登录后才可以回帖 登录 | 立即注册

   

关闭

站长推荐上一条 /1 下一条

发布主题 快速回复 返回列表 联系我们 官方QQ群 科帮网手机客户端
快速回复 返回顶部 返回列表