摘要
背景
许多研究依赖于自我报告的身高和体重。虽然有大量关于身高和体重误报的文献存在,但很少有关于提高准确性的文献。本研究的目的是通过实验设计和比较方法,利用心理学和调查研究文献中的相关证据,确定是否可以通过改进调查中这些问题的提问方式来提高自我报告的身高和体重数据的准确性。
方法
来自两项独立研究的两项调查被用来检验我们的假设(科学调查,n= 1200;饮食行为调查中,n= 200)。参与者被随机分配到六种条件中的一种,其中四种是为了提高自我报告的身高和体重数据的准确性(“序言”),另外两种作为对照条件(“没有序言”)。研究人员检验了四种假设:(1)在被问到身高和体重之前阅读了序言的参与者报告的身高和体重比没有阅读序言的参与者低;(H2) bmi指数高的参与者,问题措辞(即序言与无序言)对自述体重的影响更大;(H3)年龄越大的被试,问题措辞对身高的影响越大;(H4)体重问题的任何一个版本-标准或“特定体重”-都可能导致参与者报告更准确的自我报告体重。采用单向MANOVA检验假设1;采用双向方差分析检验假设2;采用调节分析对假设3进行检验;采用独立样本t检验检验假设4。
结果
这些假设都没有得到支持。
结论
这篇论文提供了一个重要的起点,为进一步探索问题措辞如何改善自我报告的身高和体重提供了信息。未来的研究应该探索问题序言如何操作假设的潜在机制,身高和体重问题的敏感性或侵入性,个人对身高和体重的信念,以及调查背景。
背景
肥胖是多种慢性疾病的一个重要危险因素[28,48,69].尽管研究表明使用身体质量指数(BMI)作为衡量身体肥胖程度的方法存在局限性[7,44,52,53,57], BMI继续用于临床诊断[1,8,46]并估计超重和肥胖的人口比率[2,11,29], BMI越高,肥胖相关共病的风险越高,发病率和死亡率也越高[16,45,71].BMI的计算方法是用一个人的体重(公斤)除以身高(米)的平方。BMI低于18.5被认为体重过轻,25 - 30被认为超重,超过30被认为肥胖[73].
理想情况下,由临床医生使用校正仪器测量身高和体重,如身高测量仪和体重称[19].然而,由于资金和资源的限制,在大规模人群健康研究中经常使用自我报告测量方法[67,70].将自我报告的身高和体重数据与临床数据进行比较的研究通常发现,两组测量数据之间存在差异,某些人群高估了身高和/或低估了体重[12,23].结果可能是低估了BMI [26,43]以及将个人错误地分类为“体重过轻”、“正常体重”、“超重”和“肥胖”[32],导致对肥胖流行率的估计较低,以及较大的随机误差[23].旨在纠正这一错误的公式只取得了部分成功[3.,26,46].
考虑到计算BMI依赖于自我报告,探索使用这种方法收集更准确数据的方法是很重要的。公共卫生文献中很大程度上忽略了一个可能性,那就是改进调查中询问身高和体重问题的方式。在调查研究文献中,人们早就知道,提问的方式会对回答产生重大影响。34,55].因此,自我报告身高和体重的准确性似乎可以通过不同的提问方式来提高。
本研究的主要目的是通过实验设计来确定,是否可以通过改进调查中这些问题的提问方式来提高自我报告的身高和体重数据的准确性。研究结果将有助于建立在理解自我报告偏差基础上的证据,并有助于整合目前在心理学和调查研究学科中有些独立存在的文献。
自我报告BMI的准确性
比较测量的和自我报告的BMI的研究发现,尽管这两种测量方法之间的相关性通常很高[13,32,47]中,有一种倾向于虚报身高而少报体重,导致BMI的虚报[23,43以及随后对参与者的BMI类别的错误分类。这种系统误差导致了误分类偏差,误分类偏差有两种类型:微分偏差和非微分偏差。差异错分类与其他研究变量相关,而非差异错分类与其他研究变量无关(Rothman [54: 133)。非差别错误分类不太可能对估计产生偏见,并且倾向于产生“稀释”或接近零的估计。这意味着,如果一开始就没有效应,非差异误分类不太可能对效应估计产生偏差(Rothman [54: 134)。来自差异错误分类的偏见是难以预测的,并且可能加剧或低估影响(Rothman [54: 134)。错误分类偏差的问题在测量自我报告的身高和体重的研究中尤其相关:在BMI分类错误几率相同的亚组研究中,有更多可预测的偏差,总体上不太可能有偏见。
现有的研究表明,bmi指数较高的人往往少报体重[32,43,63,72,而老年人往往会高估身高[1,64].因此,错误分类似乎是有差异的,而不是无差异的[51].关于这种偏差影响的结论从轻微到显著不等[17,20.,22,24,38,47,60].然而,所有人都同意更准确的数据是可取的。
对误报的解释
为了提高自我报告的身高和体重数据的准确性,有必要了解这些数据误报的原因。心理学文献大多关注于特征和态度的报告,而调查文献则强调行为的报告,但似乎相似的过程导致了这两种类型的错误陈述[66].
心理学和调查方法论文献中最常见的解释是社会可取性[40].该理论认为,人们强烈希望别人从积极的角度看待自己。在崇尚低体重高身高的文化中,人们可能会谎称自己比实际身高要高,体重也比实际体重要轻,这是为了向他人(比如调查面试官)展现更积极的自我形象。39].最近一项支持这一理论的研究发现,在调整了实际体重后,女性的自我报告体重和测量体重之间的差异与社会可取性得分显著相关。41].
这种扭曲的自我呈现可能构成一种“故意欺骗行为”(即印象管理),也可能只是一种“自我服务的估计错误”(即自我欺骗)[15,49,68].DeAndrea等人(2012)认为,一个人可以通过确定是否存在“基本真相”来区分这两种可能性——即对一个人的真实身高和体重的了解。换句话说,如果某人知道自己的实际身高和体重,那么任何对这些数据的歪曲都是故意的,而如果他们不确定自己的实际身高和体重,或者至少说服自己不确定自己的实际身高和体重,他们可能会简单地对数据进行正面的报道。这一理论表明,如果人们能够确定或增强“地面真相”,那么准确的身高和体重报告就会得到加强。
如果社会可取性理论适用于自我报告身高和体重是正确的,人们虚报自己的身高和体重是为了影响面试官对自己的看法,那么解决这个数据偏差问题的一个方法就是消除面试官的影响,使用匿名的方式进行调查,如在线或邮件,而不是通过电话或面对面。然而,大量的研究发现,在许多情况下,即使没有人问问题,也会对调查问题提供更符合社会需求的回答,从而对这一理论作为身高和体重误报的唯一解释提出了质疑。25,36].例如,Krueuter等人(2008)发现,在包括获得学术荣誉和向大学捐款在内的五种规范行为中,面试者和自我管理模式的反应没有差异。皮尤研究中心的研究[35的调查发现,被随机分配到电话采访或网络调查的参与者在报告去教堂的频率上几乎没有差别。
对自我报告的身高和体重的偏见的另一个可能的解释是基于身份理论,该理论关注的是人们的价值以及人们如何看待自己。61].与提供调查答案来说服面试官他们是一个有价值的人不同,调查参与者可能会表达他们作为一个有价值的人的自我认同(即一个稍微高一些、更轻一些的人)。参与者认为自己,或者希望自己是健康、活跃、有吸引力的,因此在回答身高和体重问题时,会以一种更符合这种自我看法的方式回答。如果一个人看重健康和有吸引力,并且认为自己是健康和有吸引力的,他们可能会少报自己的真实体重和/或多报自己的真实身高,以此作为一个低成本的机会来彰显自己的身份。4].布伦纳&德拉玛特公司([4]:337)假定,不是单纯出于对自我表现的关注,被调查者从实用主义的角度重新解释了这个问题,把它解释为一个关于身份而不是行为的问题,这是一个受理想自我和现实自我之间一致性渴望影响的过程。这种对调查问题的实用主义解释鼓励受访者以一种肯定强烈价值认同的方式回答问题。“与社会可取性理论不同,认同理论并没有预测在非匿名调查模式下(即当另一个人问问题时)对社会可取性问题的回答会更有偏见,而是预测在自我认同与现实不一致时更有偏见。”因此,传统的直接调查问题可以促使参与者不仅反思现实自我,也反思理想自我[31].
问题措辞对敏感问题回答的影响
从调查研究文献中可以清楚地看到,调查问题的提问方式会对回答产生影响。对于“敏感”问题,如非法药物使用、堕胎和性行为,以及“侵入性”问题,如家庭收入,尤其如此,尽管被视为敏感或侵入性的问题可能因人口统计群体、文化背景、[33]和个别的[66].
有证据表明,特别要求参与者提供准确的信息,有时被称为启动程序,提高敏感或侵入性调查问题的准确性[66].另一个有希望提高自我报告身高和体重的准确性的方法是提供额外的保证保密的数据,这已被证明可以减少误报[58].尽管大多数调查在调查开始时或作为知情同意过程的一部分提供了此类保证,但在询问身高和体重问题之前提供额外的保证可能会改善报告。
最后,框架效应可能很重要[6].框架是指人们感知和概念化问题的过程。当问题表述的改变导致观点的改变时,就会产生框架效应[9].框架效应有两种亚型措辞而且上下文效果。语境效应指的是提问的语境对调查结果的影响。措辞效应指的是提问时所用的语言。这些影响已在一系列问题上观察到[18,21,50].虽然通常讨论的是态度,但框架效应可能对其他类型的调查回应也很重要,如自我报告身高和体重。然而,很少有研究考察它对这类问题的影响。
麦格尔森等人[42例如,通过将参与者随机分配到相同问题的不同版本,研究了情境和措辞对挪威辅助死亡支持的影响。在一个版本中,参与者被简单地问及他们是否同意医生协助自杀应该被允许给那些患有晚期疾病且预期寿命很短的人。第二个版本增加了更多的信息,包括一个“非常痛苦”的特定病人的例子,医生的仔细考虑,以及病人选择“避免巨大的痛苦”。第一个版本问的是“医生协助自杀”和“安乐死”,第二个版本用的是“患者可以选择的致命药物剂量,以避免巨大的痛苦”。结果是分配到版本2的参与者对辅助死亡的支持明显增加。经济态度领域的另一个措辞效应的例子发现,当参与者被问及“通货膨胀”而不是“一般价格”或“你支付的价格”时,对未来通货膨胀率的预期和看法更低,变化更小[14].然而,语境和措辞的这些影响并不总是成立的。辛格和库伯[59例如,他们进行了一项实验,他们随机分配参与者回答关于对产前检查和堕胎的态度的问题,问题的框架要么是“婴儿”,要么是“胎儿”,他们期望被分配到第二个版本的人会获得更高的支持。然而,他们发现,在堕胎偏好的问题措辞上没有显著差异,在产前检查方面有微小但显著的差异。然而,他们确实发现,问题的措辞在一些人口统计子群体的反应中产生了实质性的差异。这可能是因为许多人对堕胎的态度太过坚定,以至于框架效应几乎没有影响。
最后,一个权威的引文,即在提出问题时附有权威的陈述来支持它,这也被证明会影响调查的回答——同样,主要是关于态度的问题[10].尾兔[10)在意大利的一项研究中,研究了问题的措辞和语境对人们对同性恋行为的态度的影响,以及一项可能出台的反对同性恋恐惧症的法律。研究发现,更多的负面反应来自下面这句话:“西尔维奥•贝卢斯科尼曾说过,与其成为同性恋,不如欣赏美丽的女孩。”有人可能会质疑这种说法的“权威性”;然而,这一点认为,声明是附属于一个权威人士。
本研究的目的是通过实验设计,利用心理学和调查研究文献中的相关证据,确定是否可以通过改进调查中这些问题的提问方式来提高自我报告的身高和体重数据的准确性。测试了四个假设。下面的方法部分阐述了这些假设。
方法
来自两项独立研究的两项调查被用来检验我们的假设。研究1(“科学调查”)的伦理批准由澳大利亚国立大学人类研究伦理委员会提供。研究2(“进食行为(EB)调查”)的伦理批准由查尔斯斯特大学人类研究伦理委员会提供。所有方法都是按照上述机构制定的指导方针和规定执行的。
参与者和过程
科学调查包括随机数字拨号(RDD)计算机辅助电话访谈(CATI),对1200名澳大利亚成年人(18岁以上)进行调查。EB调查包括对200名非大都市澳大利亚成年人(18岁以上)的RDD CATI调查。科学调查的参与率(AAPOR 2016)为43.2%。在5637个拨打的电话号码中,有1065个无法使用(例如无法接通;1371个电话没有联系(例如没有人接电话;电话应答机;), 426人被认为不在范围内(例如,不会说英语;家里没有18岁以上的人)。调查范围内的2776个电话号码中,有1200个已完成面谈。EB调查的参与率为34.7%。 Of the 2,867 telephone numbers dialled, 1,524 were unusable, for 522 there was no contact, and 79 were deemed out of scope. Of the 742 telephone numbers considered in scope, 200 interviews were completed.
在调查开始前,每位参与者都获得了知情同意。没有为参与提供奖励。这两项调查都是由社会研究公司社会研究中心进行的。
两个样本的主要人口统计数据见表1.考虑到EB调查的人口是非大都市澳大利亚人,而科学调查的人口是所有的澳大利亚人,与EB调查的参与者相比,科学调查的参与者受教育程度更高,收入更高,bmi更低(AIHW 2017)也就不足为奇了;科学调查的样本中男性和女性的比例也更为均衡。
措施
科学调查的重点是公众对科学的态度。与本研究相关的问题构成了调查第二部分的一个模块。身高和体重问题是在科学态度问题和一般健康问题之后提出的,但在人口统计学问题之前。EB调查的重点是饮食行为和身心健康。在回答了一系列关于饮食行为、对节食信息的关注程度、健康状况和吸烟行为的问题之后,研究人员询问了身高和体重问题。
在这两项调查中,参与者被随机分配到三个版本的身高和体重问题序言中的一个。然后他们被独立地随机分配到两个版本的体重问题中的一个。因此,在每次调查中,每个参与者都被问到六个关于身高和体重的组合问题中的一个(见表)2).身高问题总是在体重问题之前被问到。
在科学调查中,参与者被随机分配到以下“序言条件”中的一种:(a)“没有序言”条件,在这种条件下,他们只被问及不穿鞋的身高;(b)“问责/启动”条件,面试官首先强调收集准确的身高和体重数据的重要性,然后再问身高问题;或者(c)“权威引用/问责/启动”条件,参与者还被告知,研究表明人们倾向于高估身高和低估体重。在EB调查中,参与者被随机分配到以下“序言条件”之一(a)“没有序言”条件,与科学调查相同;(b)“背景/启动/保密”条件,在此条件下,采访者不仅强调了收集身高和体重数据的准确性的重要性,而且重申了参与者的匿名性;或(c)“语境/启动/权威引用”条件,与科学调查条件类似。
在身高问题之后,参与者再次被随机分配到两个体重问题中的一个。“标准”版本只是要求参与者报告他们的体重。只有在被询问时,他们才被告知这意味着他们的体重不穿衣服或鞋子。“特定”版本规定了不穿衣服或鞋子的重量。表格2表示向参与者提出的12个(每个研究6个)身高和体重问题组合,以及每种条件下的参与者数量。
假设
本研究采用实验设计,测试在身高和体重问题中增加序言是否会导致更准确的自我报告身高和体重回答。由于我们没有参与者的实际身高和体重数据,所以我们采用了比较方法,即假设低身高和高体重更准确。当缺乏客观标准(如澳大利亚人和农村地区的澳大利亚人的测量身高和体重)和存在已知偏差(即体重少报和身高多报)时,采用比较方法[37].此外,我们还检验了文献支持的关于改进的问题措辞对特定亚人群的差异影响的假设。
对以下假设进行了检验
研究假设:参与者阅读一篇序言(要么是Sci-3-4(问责+启动),要么是Sci-5-6(问责+启动+权威引用);或EB-3-4(上下文+启动+保密)或EB-5-6(上下文+启动+权威引用))在被问及身高和体重问题之前,平均而言,比那些没有阅读序言的人(Sci-1-2;EB-1-2)。
假设2:对于bmi指数较高的个体来说,问题措辞(即序言与无序言)与自我报告体重之间的关联更大。
假设3:在年龄较大的参与者中,问题措辞和自我报告的身高之间的关联更大。
假设4:我们还测试,但没有假设,是否“标准”或“特定”的体重问题(即Sci-3-6 vs. Sci-1-2和EB-3-6 vs. EB-1-2)将导致更准确(即更高)的自我报告的体重。一方面,我们会预测“特定的”版本——“不穿衣服或鞋子”——应该会产生更准确的重量,因为人们不穿衣服和鞋子的体重会略轻。另一方面,“特定”版本中的额外措辞可能促使参与者报告更准确的回答[15],这应该会导致更高的自我报告权重。
统计分析
样本量主要基于实际考虑,因此没有对样本量进行先验计算。在《科学》的调查中,相关问题被添加到现有的计划调查中,该调查需要1200个样本量。样本量(n= 200)的EB调查由预算决定。的变量,高度而且的年龄,满足正态性和其他统计假设的标准检验;重量而且身体质量指数积极倾斜。之所以采用参数检验,是因为使用非参数检验有几个显著的缺点,而且样本量足够大,以致偏度在分析中不会产生实质性差异(Tabachnick & Fidell [62: 80)。所有观察到的身高和体重异常值都被纳入分析,因为报告的值在合理的范围内[27].
由于两项调查的人群不同(例如,所有18岁以上的澳大利亚人;非大都市澳大利亚18岁以上)。以下检验用于检验6个不同问题版本组之间的人口统计学差异:独立性卡方检验(性别);Krukal-Wallis测试(教育;家庭收入);单因素方差分析(ANOVA)(年龄)。采用单因素多变量方差分析(MANOVA)对假设1进行检验。采用Hayes PROCESS宏观调节分析对假设3进行检验。由于BMI是用体重(因变量)计算的,所以调节分析不适合检验假设2。相反,我们以问题措辞和BMI类别(“正常体重”、“超重”、“肥胖”)为因素进行双向方差分析,以检验问题措辞和BMI之间的相互作用。 As few participants were classified as “underweight” based on BMI (Science Survey: n = 24, 2.2%; EB Survey: n = 5, 2.4%), they were not included in this analysis. Independent samples t-test was conducted to test Hypothesis 4. All analyses were conducted using IBM SPSS Statistics for Windows, version 26 (IBM Corp., Armonk, N.Y., USA).
结果
六个问题版本组在以下人口统计数据上没有差异:性别脚注1(科学调查:卡方(5,n = 1180) = 3.19,p= 0.67,克莱姆V= 0.05;EB调查:卡方(5,n = 200) = 9.33,p= 0.10,克莱姆V= 0.22,教育(科学调查:卡方(5,n = 1165) = 6.06,p= 0.300;EB调查:卡方(5,n = 198) = 7.22,p= 0.205),或家庭收入(科学调查:卡方(5,n = 927) = 4.30,p= 0.507;EB调查:卡方(5,n = 185) = 8.56,p= 0.128)。在年龄方面,科学调查的六个问题版本组之间没有显著差异(F(5,1144) = 0.23,p= 0.95),但EB-4(平均= 53.5)和EB-5(平均= 37.1)在EB调查中的差异显著(F(5,193) = 2.77,p= 0.02)。
假设1:调查参与者在被问到他们的身高和体重之前阅读了序言,他们报告的身高和体重比没有阅读序言的人要低
如表所示3.而且4在自我报告的身高和体重方面,没有序言组和有序言组之间没有显著差异。因此,假设1不被支持。科学调查的参与者要么阅读Sci-3,要么阅读Sci-4(问责;启动)或Sci-5或Sci-6(问责制;启动;与没有读导言(Sci 1或Sci-2)的参与者相比,读导言的参与者并没有报告更低的高度和更高的权重。同样,EB调查中阅读EB-3或EB-4(上下文+启动+保密)或EB-5或EB-6(上下文+启动+权威引用)序言的参与者与没有阅读序言的参与者(EB-1或EB-2)相比,并没有报告身高和体重较低。
将每个导语分别与无导语条件(即科学调查中的无导语vs问责+启动vs问责+启动+权威引用,以及无导语vs上下文+启动+保密vs上下文+启动+权威引用)进行比较,也没有统计学上的显著差异,尽管我们注意到在EB调查中,语境+启动+保密条件下的平均体重比无序言条件下(81.6 kg (SD = 17.35)比76.2 kg (SD = 18.09))高5.4 kgs,比语境+启动+权威引用条件下(76.5 kg (SD = 14.57)高5.1 kgs;(F(2,197) = 2.02,p= 0.135).《科学调查》的序言都没有包含保密声明。
假设2:在bmi指数较高的参与者中,问题措辞(即序言与无序言)对自述体重的影响更大
体重作为BMI类别函数的平均值和标准差见表5.问题措辞和BMI类别之间的交互作用没有统计学意义(科学调查:F(2,1057) = 0.65,p= 0.52。EB调查:F(2,189) = 2.13,p= 0.122)。因此,假设2不被支持。
假设3:问题措辞对身高的影响对年龄较大的参与者更大
如表所示6和无花果。1A和b,虽然斜率在预期的方向上,但问题措辞(即开场白与无开场白)与年龄之间的交互作用在统计上不显著。因此,假设3不被支持。
假设4:体重问题的任何一种版本——标准体重或“特定体重”——都可能导致参与者报告更准确的自我报告体重。
从表中可以看出7,标准组与特定组自述体重差异无统计学意义。因此,假设4不被支持。
讨论和结论
在那些阅读了旨在引出更准确答案的身高和体重问题的序言(即较低的身高和较高的体重)的调查参与者和那些没有阅读序言的参与者之间,没有观察到自我报告的身高或体重有显著差异。此外,也没有人支持这样的假设:对于那些bmi指数较高的参与者,问题措辞对自述体重的影响更大;对于年龄较大的参与者,问题措辞对自述身高的影响更大。
在设计导言时,我们将重点放在那些在文献中确定的机制上,以提高对被视为敏感或侵入性问题的回答的准确性;也就是说,问责制;启动;保密性、框架、措辞和上下文;和权威的引文。对我们的结果的一个可能的解释是,序言的措辞没有正确地操作假设的潜在机制。例如,也许这个短语,“研究表明,人们倾向于高估自己的身高,低估自己的体重。没有正确运用权威引用机制。也有可能是参与者没有注意到开场白,只是听到了关于身高和体重的问题。然而,这在网络调查中更常见。[5,而不是在面试官朗读问题的时候。
另一种可能性是,已经确定的机制并不适用于身高或体重问题。也许,关于身高和体重的问题不够敏感或侵入性,不适合通过提问措辞来操纵。65].对数据的检查显示,在《科学》杂志的调查中,只有0.3%的参与者拒绝回答关于他们家里是否有称的“中性”问题,2.3%的人拒绝提供自己的体重,1.2%的人拒绝提供自己的身高。相比之下,有2.5%的人拒绝提供年龄,10.7%的人拒绝提供家庭收入——后者的拒绝率是出了名的高[74].这些数据表明,关于身高,特别是体重的问题可以说是“敏感的”。然而,在EB调查中,没有人拒绝提供自己的身高,只有0.5%(1名参与者)拒绝提供自己的体重。这两项调查对这些问题的回复率的差异可能与调查背景有关——EB调查是作为一项关于健康和饮食行为的调查而引入的,因此有关身高和体重的问题可能并不出乎意料。相比之下,《科学》调查是作为一项关于参与者对科学态度的调查而介绍给他们的,大多数问题都是关于这个话题的,因此,关于一个人的身高和体重的问题可能被认为是出乎意料的,因此是敏感或冒犯的。或者,EB调查中较低的拒签率可能是由于两项调查的人口不同——EB调查中的非大都市居民与科学调查中的大部分大都市居民相比。在EB调查中,年龄(0%)和家庭收入(0.3%)的拒绝率也很低,尽管另有9.8%的参与者表示他们“不知道”自己的家庭收入,这可能是软拒绝[30.,56].
另一种可能是,人们对自己身高和体重的信念是如此根深蒂固——可能是由于错误的记忆(例如,一个人年轻时和现在的体重是多少),也可能是由于强烈的身份依恋,认为自己比实际的体重更高更瘦。4] -旨在触发已识别机制的提示会完全失败[59].然而,有证据表明,那些强烈怀疑自己会在被问及身高和体重后被称重和测量的人不太可能对自我报告产生偏见。72)表明事实可能并非如此。相反,问责制可能是对抗这种自我表现扭曲的关键。根据印象管理理论,被发现谎报身高和体重,比被认为比社会期望的更矮更重,对一个人的印象管理造成的损害可能更大。15].调查研究文献将这种现象称为“伪管道”[27,66].例如,Großschadl等人(2012)提出,与大多数其他研究相比,他们发现女性和老年人自我报告的身高和体重测量值与实际身高和体重测量值之间的差异更小,这是因为参与者完成了作为健康检查的一部分的调查,因此可能知道他们也会被测量身高和体重。还有一种可能是,自愿接受健康检查的人更了解自己的实际身高和体重,因此更了解“基本真相”。尽管有几篇序言试图通过强调收集准确数据的重要性来引发“问责”,但这无疑是一种比被权衡和衡量的“威胁”更弱的刺激。未来的研究可能会考虑要求参与者(拥有工作磅秤和/或卷尺)称自己的重量和测量,并报告数据,看看这是否会提高准确性。这也将有助于建立地面实况(即他们的实际测量),从而帮助确定有偏见的报告是一种“蓄意欺骗行为”还是仅仅是一种“自私自利的估计错误”[15].”
最后,可能是调查的大环境起了作用。在《科学》调查中,大多数调查问题都是关于对科学的态度,没有任何一组根据序言条件的差异接近统计显著性。然而,在EB调查中,重点是健康和饮食行为,大多数差异是在预期的方向上,尽管样本量小,但有几个接近统计显著性。
本研究的局限性,除了EB调查的样本量小和使用比较方法代替实测数据比较外,还包括EB调查仅限于非大都市居民。与大都市居民相比,澳大利亚农村居民受到身高和体重问题措辞的影响可能有所不同。另一个限制是,用于这些分析的调查旨在服务于许多目的,因此,一些问题并没有理想地设计来回答本研究中提出的研究问题。特别是,每一个序言都结合了旨在影响响应的机制,而不是单独测试每一个,因此不可能理清每一个的影响。
然而,尽管这四个假设都缺乏支持,我们相信这篇论文对文献做出了重要贡献。从人口健康的角度来看,重要的是,自我报告的身高和体重要尽可能准确,我们要继续寻求实现这一目标的方法。尽管来自调查研究文献的证据表明,问题的措辞可以对回答产生重大影响,但迄今为止,很少有研究检验通过不同的提问方式来提高自我报告的身高和体重数据的准确性。本研究旨在做到这一点,利用调查研究的问题措辞的证据和心理学文献的自我报告偏差。我们相信,本研究对研究自我报告偏差的证据做出了重要贡献,同时也为该课题未来的研究提供了一些有前途的途径。
特别是,我们建议开展一项以健康为重点的充分动力研究,测试单一机制和机制的组合,以便系统地确定问题措辞是否以及何时可以提高自我报告的身高和体重的准确性。具体地说,我们认为有必要通过纳入实际身高和体重测量的可能性来进一步探讨问责机制。我们还建议进一步测试保密机制,该机制仅包含在欧洲委员会调查的一个序言中。尽管没有统计学意义,但语境+启动+保密条件下的自述体重比无序言条件下高5.4 kgs,比语境+启动+权威引用条件下高5.1 kgs。对未来研究的其他建议包括社会可取性的测量[41和身份依恋,以便更好地理解它们在自我报告身高和体重方面的作用。对于身高和体重的误报,探索除社会可取性和身份认同理论之外的其他理论解释,以及如何解决这些问题,也是很有用的。最后,质性研究将有助于更好地了解人们将更高或更瘦作为理想身材的程度,以及这对自我报告的身高和体重有何影响。
数据和材料的可用性
在当前研究中分析的“科学调查”数据集可在澳大利亚数据档案库中找到,https://dataverse.ada.edu.au/dataverse/ada
在当前研究中分析的“EB调查”数据集可根据合理要求从通讯作者处获得。
笔记
-
性别项目出现在调查快结束时。调查的采访者被要求分配性别;如果他们不确定被调查者的性别,他们就被要求问“你的性别是什么?”,并给出了相应的回答选项:男性;女性;其他/变性/双性等。
缩写
- 体重指数:
-
身体质量指数
- 研究1:
-
科学的调查
- 研究2:
-
饮食行为调查
- 海尔哥哥:
-
饮食行为
- 抽样:
-
随机数字拨号
- 软件:
-
电脑辅助电话访谈
- 方差分析:
-
方差分析
- MANOVA:
-
多变量方差分析
参考文献
陈晓燕,陈晓燕,陈晓燕。老年人群自我报告健康参数的可信度研究。Prim Health Care Res Dev. 2020;21:e20。https://doi.org/10.1017/S1463423620000201.
Aune D, Sen A, Norat T, Janszky I, Romundstad P, Tonstad S,等。体重指数、腹部肥胖、心力衰竭发生率和死亡率:前瞻性研究的系统综述和剂量-反应meta分析循环。2016;133(7):639 - 49。
Ayre T, Wong J, Kumar A.调查全国健康调查中测量的和自我报告的BMI之间的差异。人格评估的ABS。2012;63(3):506-16。
Brenner PS, DeLamater J.谎言,该死的谎言,调查自我报告?身份是导致测量偏差的原因。社会心理学季刊。2016年,79(4):333 - 54。
Brosnan K, Babakhani N, Dolnicar S.“我知道你会问我什么”为什么受访者不阅读调查问题。国际J标志2019;61(4):366-79。
调查中的框架效应:受访者如何理解我们提出的问题。正确的做法:吉迪恩·凯伦编辑。在框架的观点。心理学出版社;2011.
超越BMI:在社会科学研究中更准确测量肥胖和肥胖的价值。卫生经济杂志2008;27(2):519-29。
Cameron N, Godino J, Nichols JF, Wing D, Hill L, Patrick K.超重或肥胖的拉丁裔和非拉丁裔成年人的身体活动与BMI、体脂和内脏脂肪之间的关系。中华医学杂志2017;41(6):873-7。
Chong D, Druckman JN。框架理论。政治科学。2007;10:103-26。
调查模式对问题措辞效果影响的比较分析。定性定量。2013;47(6):3135 - 52。
Cole TJ, Flegal KM, Nicholls D, Jackson AA。用体重指数来定义儿童和青少年的瘦:国际调查。BMJ。2007, 335(7612): 194。
Danubio ME, Miranda G, Vinciguerra MG, Vecchi E, Rufo F.自我报告和测量的身高和体重的比较:对年轻成年人肥胖研究的启示。生态学杂志,2008;6(1):181-90。
Davies A, Wellard-Cole L, Rangan A, Allman-Farinelli M.自我报告体重和身高对BMI分类的有效性:一项年轻人的横断面研究。营养。2020;71:110622。https://doi.org/10.1016/j.nut.2019.110622.
de Bruin WB, Van Der Klaauw W, Topa G, Downs JS, Fischhoff B, Armantier O.问题措辞对消费者报告通胀预期的影响。经济与心理学报,2012;33(4):749-57。
DeAndrea DC, Tom Tong S, Liang YJ, Levine TR, Walther JB。人们什么时候会向别人歪曲自己?社会可取性、基本事实和问责对欺骗性自我表现的影响。J Commun。2012;62(3):400 - 17所示。
代斯普利司j]。体脂分布与心血管疾病风险:最新进展循环。2012;126(10):1301 - 13所示。
Dhaliwal SS, Howat P, Bejoy T, Welborn TA。自我报告体重和身高,以评估肥胖控制方案。中华医学杂志2010;34(4):489-99。
Druckman约。论框架效应的局限性:谁能框架?政治杂志。2001, 63(4): 1041 - 66。
Biehl A, Hovengen R, Meyer HE, Hjelmesæth J, Meisfjord J, Grøholt EK, Roelants M, Strand BH。在基于人口的调查中,仪器误差对超重和肥胖估计患病率的影响。《公共卫生》,2013;13(1):1 - 6。
Engstrom JL, Paterson SA, Doherty A, Trabulsi M, Speer KL.女性自我报告身高和体重的准确性:一项文献综合综述。助产学与妇女健康杂志。2003年,48(5):338 - 45。
费尔德曼,哈特。气候变化作为一个两极分化的线索:对公众支持低碳能源政策的框架效应。地球环境学报2018;51:54-66。
Flegal KM, Kit BK, Graubard BI。在体重指数和死亡率的观察性研究中,根据自我报告的体重和身高的错误分类导致危险比的偏差。中华流行病学杂志2018;187(1):125-34。
Flegal KM, Ogden CL, Fryar C, Afful J, Klein R,黄dt。比较1999-2016年全国调查中自我报告和测量的身高、体重、BMI和肥胖患病率。肥胖。2019;27(10):1711 - 9。
Glaesmer H, Brähler E. Schätzung der Prävalenz von ubergeicht und Adipositas auf der Grundlage subjektiver Daten zum体重指数(BMI)[基于体重指数(BMI)主观数据的超重和肥胖患病率估计]。Gesundheitswesen。2002;64(3):133 - 8。https://doi.org/10.1055/s-2002-22317.德国人。
基于网络的问卷调查中的社会可取性回答:对坦白假设的元分析综述。评估。2017;24(6):746 - 62。
高斯。自我报告的BMI有多准确?减轻公牛。2014;39(1):105 - 14所示。
Großschädl F,哈迪奇B,斯特朗格WJ。奥地利成年人自我报告体重和身高的有效性:BMI分类的社会人口决定因素和后果。公共卫生杂志,2012;15(1):20-7。
Guh DP, Zhang W, Bansback N, Amarsi Z, Birmingham CL, Anis AH。与肥胖和超重相关的共病发生率:一项系统综述和荟萃分析。公共卫生。2009;9(1):1 - 20。
霍尔DM,科尔TJ。BMI有什么用?《儿童教育》2006;91(4):283-6。
Hamrick KS。饮食与健康模块中体重指数数据的无反应偏倚分析。USDA-ERS技术公报,2012;1(1934)。
自我差异:一种关于自我和情感的理论。Psychol启1987;94(3):319。
Hodge JM, Shah R, McCullough ML, Gapstur SM, Patel AV.在一个全国性的大型成人队列中自我报告的身高和体重的验证。《公共科学图书馆•综合》。2020;15 (4):e0231229。https://doi.org/10.1371/journal.pone.0231229.
Johnson TP, Van de Vijver FJ。跨文化研究中的社会可取性。跨文化调查方法。2003; 325:195 - 204。
王晓燕,王晓燕。问题对问卷回答的影响:一项综述。皇家统计学会学报:A辑(一般)。1982年,145(1):42-57。
基特·S.《从电话到网络:民意调查中采访效应模式的挑战》,皮尤研究中心方法,2015。从检索https://policycommons.net/artifacts/619120/from-telephone-to-the-web/1600179/2022年7月28日。CID: 20.500.12592/8wc2tm。
Kreuter F, Presser S, Tourangeau R. catti, ivr和web调查中的社会期望偏差:模式和问题敏感性的影响。中国科学(d辑:自然科学版)。
敏感调查中社会愿望偏差的决定因素:文献综述。定性定量。2013;47(4):2025 - 47。
Kuczmarski MF, Kuczmarski RJ, Najjar M.年龄对自我报告的身高、体重和身体质量指数有效性的影响:来自1988-1994年第三次全国健康和营养调查的发现。中国饮食杂志2001;101(1):28-34。
社会可取性和自我报告的体重和身高。中国生物医学工程学报,2000;24(5):663-5。
自我呈现:印象管理与人际行为。Brown & Benchmark出版社;1995.
罗婕,Thomson CA, Hendryx M, Tinker LF, Manson JE, Li Y,等。妇女健康倡议中自我报告体重的准确性。公共卫生营养学2019;22(6):1019-28。
马格尔森M, Supphellen M, Nortvedt P, Materstvedt LJ。辅助死亡态度受问题措辞和顺序的影响:一项调查实验。医学伦理学。2016;17(1):1 - 9。
Maukonen M, Männistö S, Tolonen H.评估成人肥胖的测量与自我报告的人体测量学的比较:一项文献综述。斯堪的纳维亚公共卫生杂志。2018年,46(5):565 - 79。
Mumm R, herhellsen M.关于BMI和BMI的长期变化的简短说明。人类生物学与公共卫生,2021;22:2。
Neeland IJ, AT, Ayers CR, Berry JD, Rohatgi A, Das SR,等。肥胖成人体脂分布与心血管疾病发生率。中国心血管杂志2015;65(19):2150-1。
Neermark S, Holst C, Bisgaard T, Bay-Nielsen M, Becker U, Tolstrup JS。丹麦健康检查调查中自我报告的身高和体重的验证和校准。欧洲公共卫生杂志。2019;29(2):291-6。
自我报告的身高和体重测量的偏差及其对建模健康结果的影响。SSM大众健康,2019;7:100405。https://doi.org/10.1016/j.ssmph.2019.100405.
吴敏,Fleming T, Robinson M, Thomson B, Graetz N, Margono C,等。1980-2013年期间全球、区域和国家儿童和成人超重和肥胖的患病率:2013年全球疾病负担研究的系统分析。《柳叶刀》杂志上。2014, 384(9945): 766 - 81。
Paulhus DL。社会期望的反应:一个结构的进化。在:Braun HI, Jackson DN, Wiley DE编辑。建构在心理和教育测量中的作用(第49-69页)。劳伦斯·厄鲍姆联合出版社;2002.
措辞和框架效应对道德直觉的影响。Ethol Sociobiol。1996;17(3):145 - 71。
彭丽娟,李晓燕,李晓燕,李晓燕。研究与医疗实践中的错误分类偏见。36家Pract。2019;(6):804 - 7。
Prentice AM, Jebb SA。除了身体质量指数。ob启2001;2(3):141 - 7。
Rothman KJ。测量肥胖的bmi相关误差。中华医学杂志。2008;32(3):556 - 9。
Rothman KJ。流行病学:导论,第二版。牛津大学出版社;2012.
自我报告:问题如何塑造答案。Psychol。1999年,54(2):93。
Sell RL, Kates J, Brodie M.使用电话筛选器识别同性恋、女同性恋和双性恋的概率样本。53 J同性恋。2007;(4):163 - 71。
沙阿NR,布雷弗曼ER。测量病人的肥胖:利用身体质量指数(BMI),体脂百分比和瘦素。《公共科学图书馆•综合》。2012;7 (4):e33308。https://doi.org/10.1371/journal.pone.0033308.
歌手E,冯·瑟恩DR,米勒ER。保密保证与回应:实验文献的定量回顾。中国科学(d辑:自然科学版)。
歌手E,库伯议员。问题措辞对产前检查和堕胎态度的影响。中国科学(d辑:自然科学版)2014;
Spencer EA, Appleby PN, Davey GK, Key TJ。4808名EPIC-Oxford参与者自我报告的身高和体重的有效性。《公共卫生快报》2002;5(4):561-5。
斯崔克S,伯克PJ。同一性理论的过去,现在和未来。社会心理学季刊。2000; 1:284 - 97。
Tabachnick BG, Fidell LS。使用多元统计(第6版)。波士顿:皮尔森;2013.
Tang W, Aggarwal A, Moudon AV, Drewnowski A.在西雅图和金县的成年人中自我报告和测量体重和身高。BMC肥胖。2016; 3(1): 1 - 8。
Taylor AW, Grande ED, Gill TK, Chittleborough CR, Wilson DH, Adams RJ, Grant JF, Phillips P, Appleton S, Ruffin RE。自我报告身高和体重的有效性如何?使用大队列研究比较CATI自我报告和临床测量。中华卫生杂志。2006;30(3):238-46。
Tourangeau R, Rips LJ, Rasinski K,编辑。调查反应的心理学。剑桥大学出版社;2000.https://doi.org/10.1017/CBO9780511819322.
闫婷。调查中的敏感问题。Psychol公牛。2007;133(5):859。
Turrell G, Nathan A, Burton NW, Brown WJ, McElwee P, Barnett AG, Pachana NA, Oldenburg B, Rachele JN, Giskes K, Giles-Corti B.队列资料:habitat -一项关于中晚期成年期身体活动、久坐行为、健康和功能的纵向多层次研究。国际流行病学杂志2021;50(3):730-1。
重新思考社会愿望量表:从印象管理到人际导向的自我控制。心理科学展望2010;5(3):243-62。
王艳春,McPherson K, Marsh T, Gortmaker SL, Brown M.美国和英国预测肥胖趋势的健康和经济负担。《柳叶刀》杂志。2011;378(9793):815 - 25所示。
伍登议员沃森。HILDA调查:一个成功的家庭面板调查设计和开发的案例研究。纵向与生命过程研究。2012;3(3):369-81。
体重指数分类百分位和截止点。: StatPearls[网络]。金银岛:StatPearls Publishing;2022.PMID: 31082114。
文敏,王晓燕。自我报告成年身高、体重和体重指数效度的性别和种族差异。Ethn说。2012;22(1):72。
世界卫生组织(who)。体质指数(BMI)[互联网]。2021年[引自2021年12月23日]。可以从:https://www.euro.who.int/en/health-topics/disease-prevention/nutrition/a-healthy-lifestyle/body-mass-index-bmi
颜婷。调查中询问敏感问题的后果。Ann Rev Stat app . 2021;7(8): 109-27。
确认
作者要感谢以下人员对这项研究的贡献:Barbara Masser教授和Matthew Bourke博士,感谢他们在统计方面的建议和帮助;以及伊恩·麦卡利斯特教授同意为他的澳大利亚国立大学科学民意调查添加几个问题。
资金
开放获取基金由CAUL及其成员机构提供和组织。这项研究的部分资金来自查尔斯斯特大学的研究发展基金。此外,社会研究中心为这项研究提供了实物捐助。资助者在数据的设计、分析或解释或手稿的撰写中都没有任何作用。社会研究中心收集的调查数据是本文分析的基础。
作者信息
作者和联系
贡献
NV将研究概念化,分析和解释数据,并起草手稿。ED协助数据采集,为研究设计提供输入,并对初稿进行实质性修改。JR协助对数据进行分析和解读,并对初稿进行实质性修改。所有作者阅读并批准了最终稿件。
相应的作者
道德声明
伦理批准和同意参与
研究1(“科学调查”)的伦理批准由澳大利亚国立大学人类研究伦理委员会(2008/114)提供。研究2(“进食行为(EB)调查”)的伦理批准由查尔斯斯特大学人类研究伦理委员会(2010/144)提供。所有方法都是按照上述机构制定的指导方针和规定执行的。调查参与者在调查开始前提供知情同意。
同意出版
不适用。
相互竞争的利益
作者声明他们没有竞争利益。
额外的信息
出版商的注意
188博金宝app网施普林格自然对出版的地图和机构附属的管辖权要求保持中立。
权利和权限
开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。
关于这篇文章
引用这篇文章
Van Dyke, N, Drinkwater, E.J. & Rachele, J.N.。在调查中提高自我报告的身高和体重的准确性:一项实验研究。BMC医学治疗方法22241(2022)。https://doi.org/10.1186/s12874-022-01690-x
收到了:
接受:
发表:
DOI:https://doi.org/10.1186/s12874-022-01690-x
关键字
- 身体质量指数
- 自我报告
- 高度
- 重量
- 调查
- 提问的措辞
- 敏感的
- 启动
- 框架