博文分享|Stata软件从Johns Hopkins University导入COVID-19数据
在上一篇文章中,作者提到不打算发布covid19.ado文件,因为在2020年3月19日提到“如果Johns Hopkins更改数据时,它可能会变得没有意义”。而当前数据已经在2020年3月23日有所更改,它很可能还会不断的发生变化。随着数据的变化,作者可能会在将来发布更新,但是您可能需要在作者发布之前更快的进行调整。因此,让我们看看如何更新代码以适应不断变化的数据。 首先,运行上一篇博客文章中的代码。 当我们describe数据时,看起来有些错误。 我们具**称相似的变量,例如provincestate和province_state,countryregion和country_region等。 较新的原始文件中的变量名称已更改。 但是追加数据时,必须具有相同的变量名。
我浏览了较新的原始数据文件,并确定了数据更改的日期。您*打开文件即可执行此操作。您可以简单地describe本地磁盘或云帐户中的数据。
2020年3月22日的原始数据使用旧的变量名称。 2020年3月23日的原始数据使用新的变量名称。 我们可以编写一些巧妙的代码来区分3月23日之前和之后创建的文件。但是一个简单的替代方法是使用capture rename来更改原始数据文件中必要的变量名。
让我们在3月23日的原始数据文件上尝试一下,然后再将其合并到我们的其余代码中。 现在,新数据中的变量名称与旧数据中的变量名称匹配。新数据中的某些变量未出现在旧数据中。这些新变量将添加到较终数据集中,但不包含3月23日之前的任何数据。
以下更新的代码将从2020年3月23日起从Johns Hopkins GitHub repository中导入原始数据。我标红了新命令。
我们可以通过描述结果数据来验证此方法是否有效。 保存此数据集,以便以后使用。 请注意,我们尚未检查并确认这些数据。上面的代码和所得数据应仅用于指导目的。 北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的Stata用户提供优质的软件销售和培训服务。 |
turntech88.b2b168.com/m/