macOS 和 Windows 之间的文件乱码问题

macOS 默认使用 UTF-8编码,而 Windows 系统则默认使用 GB 编码。

我这次收到的数据,是从很老版本的 windows 系统中拷贝出的,不仅文件名乱码,用 office 365 excal(macOS) 打开内部也是乱码。

这部分可跳过

尝试借了 windows 电脑,但数据格式不标准,几千个文件需要一个一个处理,需要的时间实在太长,没办法一下子借好几天。

尝试了用阿里云桌面操作,但总会显示这样一个报错:「无法将内容复制到剪贴板,其他应用程序正在使用该内容。你仍然可以粘贴此工作簿中的内容,但其他应用程序中将无法使用该内容。」查了很多资料,也无法解决,猜测是把数据从云桌面复制到本地 macOS 电脑的过程中出现的小 bug。

还尝试使用 ChatGPT 写 Python 代码,批量处理乱码问题。自己的 python 底子确实太弱,折腾了好久,能批量处理文件名,但还是无法处理文档(.xls)内部的乱码。

解决方案

最后找出了一套简单的解决方案。

  • 文件名乱码的部分,可以通过把压缩包后缀从 .zip 改成 .7z 解决。
  • .xls 文件内部的乱码,可以在 macOS 上使用 XPS 打开,就能识别成正确的文本了。数据处理阶段复制到高版本的 excal 中,就能转换其中的乱码。

这个体验还是挺奇特的,很久没使用 XPS,没想到它还有这个优点,对老版本 office 文档的兼容性比微软本身还好。

Leave a Reply

Your email address will not be published. Required fields are marked *