关于我们

深圳市数据动力信息技术有限公司从2012年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有数千个的稳定高匿HTTP代理地址池,可以有效绕过各种反采集策略。

您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。

数据的格式可以是EXCEL,CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。

联系我们

0755-27586035(拨打免费)

15899780267

 61979241或 1033289572

 

点击这里给我发消息

友情链接

当前位置: 首页 > 技术文章 >
如何将UTF-8编码的CSV文件转换为GBK编码?
发布时间: 来源:数据动力 浏览:5

我们公司产生的CSV文件一般默认都是UTF-8编码的(考虑到通用性),如果用Excel直接打开就会显示为乱码形式的,这是因为在中文Windows环境下,Excel默认的字符编码是GBK。

所以要想让Excel正常显示,我们需要先将CSV文件从UTF-8编码修改为GBK编码。如何操作呢?这是我们客户经常会问到的问题。

其实方法很简单:

1)用UltraEdit打开我们要处理的CSV文件。

2)文件 -> 另存为,编码选择“ANSI/ASCII”,保存即可。如下图所示。

PS:同理,我们也可以将GBK另存为UTF-8。

如果是在Linux系统下,可以使用iconv命令来转换,例如:

iconv -f UTF-8 -t GBK utf8_file.csv -o gbk_file.csv

也可以结合find命令的exec参数实现批量转换功能,例如下面的命令将会把当前目录下的所有CSV文件从UTF-8编码转换为GBK编码,另存为“GBK_”加原始文件名:

find *.csv -type f -exec iconv -f UTF-8 -t GBK {} -o GBK_{} \;