我的日常

登录/注册
您现在的位置:论坛 资料库 数据库开发 > MySQL修改数据库编码为UTF8
总共48087条微博

动态微博

查看: 1631|回复: 0

MySQL修改数据库编码为UTF8

[复制链接]
admin    

1244

主题

544

听众

1万

金钱

管理员

  • TA的每日心情

    2021-2-2 11:21
  • 签到天数: 36 天

    [LV.5]常住居民I

    管理员

    跳转到指定楼层
    楼主
    发表于 2016-06-20 13:51:31 |只看该作者 |倒序浏览
      mysql 创建 数据库时指定编码很重要,很多开发者都使用了默认编码,乱码问题可是防不胜防。制定数据库的编码可以很大程度上避免倒入导出带来的乱码问题。

      网页数据一般采用UTF8编码,而数据库默认为latin 。我们可以通过修改数据库默认编码方式为UTF8来减少数据库创建时的设置,也能最大限度的避免因粗心造成的乱码问题。

      我们遵循的标准是,数据库,表,字段和页面或文本的编码要统一起来

      我们可以通过命令查看数据库当前编码:

      mysql> SHOW VARIABLES LIKE 'character%';

      发现很多对应的都是 latin1,我们的目标就是在下次使用此命令时latin1能被UTF8取代。

      第一阶段:

      mysql设置编码命令

      SET character_set_client = utf8;

      SET character_set_connection = utf8;

      SET character_set_database = utf8;

      SET character_set_results = utf8;

      SET character_set_server = utf8;

      然后 mysql> SHOW VARIABLES LIKE 'character%'; 你可以看到全变为 utf8 。

      但是,这只是一种假象

      此种方式只在当前状态下有效,当重启数据库服务后失效。

      所以如果想要不出现乱码只有修改my.ini文件,

      从my.ini下手(标签下没有的添加,有的修改)

      [client]

      default-character-set=utf8

      [mysql]

      default-character-set=utf8

      [mysqld]

      default-character-set=utf8

      以上3个section都要加default-character-set=utf8,平时我们可能只加了mysqld一项。

      然后重启mysql,执行

      mysql> SHOW VARIABLES LIKE 'character%';

      确保所有的Value项都是utf8即可。

      但是可恶的事情又来了,

      |character_set_client | utf8 |

      | character_set_connection | utf8 |

      | character_set_database | utf8 |

      | character_set_filesystem | binary |

      | character_set_results | utf8 |

      | character_set_server | latin1 |

      | character_set_system | utf8

      注意 该配置| character_set_server | latin1 无法设置成UTF8 交互时候仍然会出现乱码。

      第二阶段:找到下面这东东

      X:\%path%\MySQL\MySQL Server 5.0\bin\MySQLInstanceConfig.exe

      重新启动设置,将默认编码设置为utf8.这样就能达到我们所要的效果了。

      mysql> SHOW VARIABLES LIKE 'character%';

      +--------------------------+---------------------------------------------------------+

      | Variable_name | Value |

      +--------------------------+---------------------------------------------------------+

      | character_set_client | utf8 |

      | character_set_connection | utf8 |

      | character_set_database | utf8 |

      | character_set_filesystem | binary |

      | character_set_results | utf8 |

      | character_set_server | utf8 |

      | character_set_system | utf8 |

      | character_sets_dir | C:\Program Files\MySQL\MySQL Server 5.0\share\charsets\ |

      +--------------------------+---------------------------------------------------------+

      8 rows in set



      服务器端的编码是由字符集(Character Set)和校对规则(Collation)决定的。

      上面提到,MySQL 中是根据下面几个变量确定服务器端和客户端用的什么字符集:

      character_set_client     客户端字符集

      character_set_connection   客户端与服务器端连接采用的字符集

      character_set_results     SELECT查询返回数据的字符集

      character_set_database    数据库采用的字符集

      也就是说,只要保证这几个变量采用一致的字符集,就不会出现乱码问题了。

      查看系统的字符集用下面的命令:

      1 mysql> SHOW VARIABLES LIKE 'character_set_%';

      2 +--------------------------+-----------------------------------------+

      3 | Variable_name | Value |

      4 +--------------------------+-----------------------------------------+

      5 | character_set_client | utf8 |

      6 | character_set_connection | utf8 |

      7 | character_set_database | utf8 |

      8 | character_set_filesystem | binary |

      9 | character_set_results | utf8 |

      10 | character_set_server | utf8 |

      11 | character_set_system | utf8 |

      12 | character_sets_dir | E:\usr\MySQL Server 5.0\share\charsets\ |

      13 +--------------------------+-----------------------------------------+

      14 8 rows in set (0.00 sec)

      15

      可以看到,我的这几个变量都是一致的。但如果不一致呢?网上许多教程告诉你“你set names下就解决了”。

      那么set names是什么呢? set names实际上就是同时设置了 character_set_client ,character_set_connection和 character_set_results 这三个系统变量。

      例如在mysql命令行上输入 set names 'gbk' 命令等同于:

      SET character_set_client = gbk;

      SET character_set_connection = gbk;

      SET character_set_results = gbk;

      很多情况下,这样设置了之后就能把乱码问题解决了。但是还是不能完全避免出现乱码的可能,为什么呢?

      因为character_set_client ,character_set_connection 这两个变量仅用于保证与 character_set_database 编码的一致,而 character_set_results 则用于保证 SELECT 返回的结果与程序的编码一致。

      例如,你的数据库(character_set_database)用的是 utf8 的字符集,那么你就要保证 character_set_client ,character_set_connection 也是utf8的字符集。

      而你的程序也许采用的并不是utf8 ,比如你的程序用的是gbk ,那么你若把 character_set_results 也设置为 utf8 的话就会出现乱码问题。此时你应该把 character_set_results 设置为gbk。这样就能保证数据库返回的结果与你的程序的编码一致。

      到此应该就可以解决绝大多数我们遇到的乱码问题了,另外还必须强调的是,有时候乱码的出现有可能是以上几种原因混合造成的。

      总而言之,我们应当尽量的保证数据库中的数据是正确的,就是客户端到服务器端或者服务器端到客户端转换的过程中不要产生乱码,那么问题处理起来就相对简单了。

      四、总结

      总结为以下四点:

      1、要保证发送的数据与数据库的字符集一致,即 character_set_client,character_set_connection 与character_set_database 一致。

      2、要保证数据库中存储的数据与数据库编码一致,即数据的编码与character_set_database一致。

      3、要保证 SELECT 的返回与程序的编码一致,即 character_set_results 与程序(PHP、java等)编码一致。

      4、要保证程序编码与浏览器编码一致,即程序编码与 一致。


    科帮网 1、本主题所有言论和图片纯属会员个人意见,与本社区立场无关
    2、本站所有主题由该帖子作者发表,该帖子作者与科帮网享有帖子相关版权
    3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和科帮网的同意
    4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
    5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
    6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
    7、科帮网管理员和版主有权不事先通知发贴者而删除本文


    JAVA爱好者①群:JAVA爱好者① JAVA爱好者②群:JAVA爱好者② JAVA爱好者③ : JAVA爱好者③

    快速回复
    您需要登录后才可以回帖 登录 | 立即注册

       

    关闭

    站长推荐上一条 /1 下一条

    发布主题 快速回复 返回列表 联系我们 官方QQ群 科帮网手机客户端
    快速回复 返回顶部 返回列表