如何自动检测文本文件编码?
有很多纯文本文件是用变体字符集编码的,我想把它们全部转换成UTF-8,但在运行iconv之前,我需要知道它们的原始编码。
我想把它们全部转换为UTF-8,但在运行iconv之前,我需要知道它的原始编码。大多数浏览器在编码中都有一个Auto Detect
选项,但是,我无法逐一检查这些文本文件,因为数量太多。
只有知道了原始编码,我才能通过iconv -f DETECTED_CHARSET -t utf-8
来转换文本。
有没有什么工具可以检测纯文本文件的编码?不一定要100%完美,我不介意1,000,000个文件中有100个文件被错误转换。