CASFM方法简报——空间数据的概念是什么?
本期我们对题为家庭医学研究中的空间视角这一CASFM方法简报的的第二部分进行翻译整理,主要包括空间数据的概念,期待与大家共同学习。本文作者为康涅狄格大学医学院健康差异研究所Emil N Coman教授。
本文来源:COMAN E N,STEINBACH S,CAO G F. Spatial perspectives in Family health research[J].Family Practice,cmab165. https://doi.org/10.1093/fampra/cmab165.
空间数据
健康和医疗数据统计分析一个通常被忽视的方面是观察“空间”是有序的,即使这在数据本身中可能并不明确(即位置是按空间排列的)。但是,统计分析要求观察结果相互独立。
因为彼此靠近的单位(例如人或地区)往往更相似,不符合独立性假设。但是,当明确定义每个观测的地理位置时,可以阐明观测之间的空间关系,以便在分析中对其进行解释:
区域之间的“传染”可以直接建模。为了衡量相邻区域之间的空间相似性,分析人员开发了不同的措施来量化每个空间特征(例如预期寿命)的这种相似性。这种相似性通常被称为空间自相关,这可能用词不当,因为变量与自身并不相关:这里的“自相关”是指一个区域的同一变量值与其相邻区域值之间的相关性。
空间相似性可以在多个地理尺度上表现出来,例如居住在彼此附近的人大多相似,并且位于附近的人口普查区也大多相似。空间数据的这一特征是具有个人和社区水平特征的混合健康数据会错误估计感兴趣的实际因果效应的原因之一,即便使用考虑社区中个人聚类的多水平模型分析也是如此。尽管每个区域内个体的空间相似性是通过聚集到邻域中来解释的,但相邻区域之间的空间相似性却并非如此。超过90%的关于邻里效应的研究论文没有考虑空间效应。
空间关系在概念上与其他关系结构没有区别,例如社会关系(例如同事之间的友谊)或二元关系结构(例如患者和医生)。在社会关系中,个人之间的联系是由社会联系来定义的。相反,区域之间的关系由它们的相对空间位置定义。空间连接也可以是基于距离的,例如居住在彼此5英里范围内的人们是相互联系的,或者基于拓扑(地理)关系,例如独立(例如居住在人口普查区内的所有人)或邻接(例如共享边界的县)。这些连接通常以邻域矩阵的形式表示,其中每个条目代表区域之间的连接(或非连接)强度。
下图显示了空间相似性如何混淆变量之间的关联。关联意味着在一个变量(较深的阴影)上的较高分数往往会伴随另一个变量的较高分数。围绕中心的六边形可以是相似的,这意味着具有相似的灰色阴影或相似的圆形大小。
图1A说明了灰色阴影和圆形大小的随机空间模式:
没有一个表现出空间非独立性,但较深的阴影随着较大的尺寸而变化,表明存在空间关联。
另一方面;图1B显示了相似的圆圈大小,从左到右减小,这是灰色阴影中找不到的模式。
皮尔逊相关性分析将在这里分析灰色阴影和圆圈大小之间的关系。
注:当较深的阴影倾向于与较大的圆圈一起出现时,就会出现协变;A(无空间相似性)与 B(圆大小的空间相似性)六边形镶嵌的空间相似性不同;A 中存在暗阴影和圆圈大小之间的协变,但B中不存在。
图12个通用空间变量的空间相似性及其协变之间的相互作用
CASFM方法简报是同行评审的简要报告,对基层卫生研究中采用的方法进行描述,定期发布于家庭医学期刊。这些基层卫生研究方法报告旨在作为全职调查人员的资源,以及未接受过正式研究方法和统计培训读者的教育工具。该系列报告可用于进一步了解家庭医学研究方法,包括定性、定量、混合和其他研究方法;并在审查既定做法的同时涵盖新兴方法。