如何将不同编码格式的文档内容存储到MongoDB?
-
MongoDB的默认的编码方式为UTF-8,现在项目需求将一系列文档的内容存储到MongoDB,但这些文档的编码方式可能有几种,该怎么实现呢?
-
加 metadata 紀錄原始的編碼格式, 在進出 mongodb 前後依據紀錄進行轉換
-
例如: php 可以使用 mb_convert_encoding 搭配 mb_detect_encoding 偵測編碼轉換成 UTF-8
http://php.net/manual/en/function.mb-convert-encoding.php
http://php.net/manual/en/function.mb-detect-encoding.php
-
讀取資料轉成UTF8再存入這是一定要做的.
建議後續的應用就不要再使用其他的編碼了.
如果真的需要用到.哪就只能再多紀錄原始編碼格式。