如何解决 Stata 14 的中文乱码问题

如题所述

举报该文章

相关建议 2017-05-20

首先，打开此数据集 surname_test.dta。

. use surname_test.dta, clear

点击数据编辑器 “Data Editor (Browse)” 的快捷键，查看数据：

可以看出，上表的最后一列，变量 character（中文姓氏）出现了乱码，无法正确显示。在使用 Stata 14 命令 unicode 进行编码时，内存中不能有数据，故先删除数据。

. clear

然后，将需要编码的文件（在此为 surname_test.dta），放入当期工作路径（current working directory），通常在Stata的左下角显示。

也可使用命令pwd（path of working directory）来显示当期工作路径。或使用命令cd（change directory）将当期工作路径改为文件 surname_test.dta 所在的位置，详见“help cd”。

. pwd

C:\Program Files (x86)\Stata14

接下来，使用命令 unicode analyze 分析数据集 surname_test.dta 是否需要编码翻译。

. unicode analyze surname_test.dta

结果显示，有一个字符串变量需要编码翻译（1 str# variable needs translation）。为此，将编码设为国标码（GB18030），再进行翻译。

. unicode encoding set gb18030

(default encoding now gb18030)

. unicode translate surname_test.dta

(using gb18030 encoding)

结果显示，此文件已编码翻译成功。再次打开此数据集，并通过数据编辑器 “Data Editor (Browse)” 查看：

. use surname_test.dta,clear

上表已能正确显示中国人口最多的十大姓氏依次为：王、李、张、刘、陈、杨、黄、赵、周、吴。相信朋友可以安心使用 Stata 14 了。

温馨提示：内容为网友见解，仅供参考

当前网址：https://22.t2y.org/zz/scf6sf0h0s20hi0t0f.html

其他看法

第1个回答 2021-04-28

解压文件出现中文乱码怎么办解决办法

华为Mate50 Pro曲面旗舰手机

¥6799

苹果 AirPods Pro 2代

¥1699

索尼65英寸4K HDR专业游戏电视

¥7499

惠普战66五代15.6英寸轻薄本

¥4399

查

看

更

多

第2个回答 2017-09-28

可以转码，之后就不是乱码了。用下面的命令：
unicode analyze *
unicode encoding set gb18030
unicode translate *
这三个命令一般情况可以解决你的问题。如果还是不行可试试其它方法。详见help unicode
注意：运行这三个命令前，当前目录需是你欲转换文件所在目录，且内存中不能有stata数据文件。

第3个回答推荐于2018-01-31

对头，可以转码，之后就不是乱码了。用下面的命令：
unicode analyze *
unicode encoding set gb18030
unicode translate *
这三个命令一般情况可以解决你的问题。如果还是不行可试试其它方法。详见help unicode
注意：运行这三个命令前，当前目录需是你欲转换文件所在目录，且内存中不能有stata数据文件。本回答被网友采纳

第4个回答 2017-08-28

可能是因为以前用13或ftf更早版本输入的中文，在14中，就成了乱码，这时可用unicodetranslate进行转换，主要有三个命令：
unicode analyze filespec [, redo nodata]

unicode encoding set ["]encoding["]

unicode translate filespec [, invalid[(escape|mark|ignore)] transutf8 nodata ]

其中的选项 ["]encoding["]用国标就可以了。数据和do文件，都是用这三个命令。但是第一个命令可以用，也可以不用，不会影响处理结果。第二个命令是必须用的。

1 2 下一页

相似回答

大家正在搜