对耳鸣自评量表应用价值的思考
刘蓬郑芸
封面配图:视觉中国
刘蓬,临床医学博士,广州中医院耳鼻喉科副主任,教授,主任医师,博士生导师,医院客座教授、四川大学创新实践导师,世界中联耳鼻喉口腔科专业委员会副会长兼秘书长,中国中医药研究促进会耳鼻咽喉科专业委员会副会长,中华中医药学会耳鼻喉科分会常委兼耳鸣眩晕研究组组长,中国中西医结合学会耳鼻咽喉科专业委员会常委兼耳鸣学组副主任,中国医疗保健国际交流促进会耳内科学分会委员等,《听力学及言语疾病杂志》《中国中西医结合耳鼻咽喉科杂志》《中医眼耳鼻喉科杂志》编委。从事耳鼻咽喉中西医结合临床、教学、科研工作30余年,主编及参编教材、专著16部,发表学术论文60余篇。
耳鸣是没有声源时的一种声感,这种声感可以出现在耳内、颅内、颅外甚至空中。它是一种纯粹的主观感觉,目前尚无客观检测方法可以检测到耳鸣是否存在。不同的人对这种声感的反应完全不同。大约80%的人对耳鸣置之不理,只有20%左右的耳鸣者寻求医疗帮助,这种现象在其它疾病中是极为少见的。耳鸣的这种特殊性给临床医生和研究者带来了一个特殊的难题,即如何准确评估耳鸣的严重程度。合理评估耳鸣的严重程度有两个目的,一是给医生和患者提供是否需要临床干预的依据;二是合理评价临床疗效。
耳鸣自评量表(SRTQ)是将设计好的问卷式量表交给病人进行打分,根据分数的高低对耳鸣严重程度作出评估,这是近20多年来文献中应用于耳鸣疗效评价较多的一种方法。笔者在长期的临床实践中发现,这种方法的可靠性值得商榷。
1.已发表的SRTQ
年Hallam等发表了第一个耳鸣自评量表耳鸣问卷(TQ),该量表共有52个问题,每个问题的答案分“是、有时是、不是”3个等级,分别记2、1、0分,总分分。年Kuk等发表了一个包含27个问题的耳鸣自评量表耳鸣残疾问卷(THQ),与TQ不同的是,每个问题的计分方法是让患者在0~分中选择,最后再将总分按百分制进行换算。这两种计分模式为很多研究者效仿。近30年来,先后有23种SRTQ陆续发表(见表1),每个量表包含的问题最少7个,最多52个。在这些SRTQ中,应用较多且获年美国耳鸣临床实践指南推荐的有耳鸣问卷、耳鸣残疾问卷、耳鸣反应问卷(TRQ)、耳鸣残疾量表(THI)耳鸣功能指数(TFI)5种。国外应用较多的是THI,国内也以中文版THI应用最多,尽管TQ、THQ也有中文版,但临床应用较少。
SRTQ的主要目的在于量化耳鸣给患者造成的困扰,这些困扰部分反映了耳鸣的严重程度,对于疗效评价有一定参考价值。然而,众多SRTQ存在这一现象本身也反映了这一方法用于疗效评价可能存在一定的局限性。
2.SRTQ条目设计的局限性
年,Tyler等在英国进行了一项研究:征集72个耳鸣患者对耳鸣的书面抱怨,其中涉及耳鸣对听力、情绪、日常生活及一般健康影响等4方面的抱怨,这些抱怨语句成为后来众多SRTQ条目设计的基本来源,不同的作者选用不同的抱怨语句形成问卷的条目,从而形成条目数量不等的SRTQ。
患者的抱怨直接用于耳鸣严重程度的评估是否合适?这是一个值得商榷的问题,因为很多抱怨不一定能真实反映耳鸣严重程度,甚至可以说,有些抱怨与耳鸣严重程度毫无关联。原因主要为:一是患者的抱怨可能基于对耳鸣的错误认知;二是不同性格和文化背景的人对耳鸣的抱怨差异很大。
2.1患者的抱怨可能基于对耳鸣的错误认知
患者对耳鸣的抱怨内容取决于其对耳鸣的认知,由于患者多数都不知道耳鸣究竟意味着什么及对身体可能造成什么危害,通常会将耳鸣发生后的一系列身心问题都归咎于耳鸣,而实际上很多问题可能并非耳鸣直接造成的,因此,直接取材于患者的抱怨不一定能真实反映耳鸣的严重程度。
例如,TQ的问题:耳鸣有时造成我很严重的头痛、耳鸣有时造成我耳痛或头痛、耳鸣造成我的头部和颈部肌肉紧张,用专业常识分析一下,耳鸣是不可能引起头痛、耳痛、头部和颈部肌肉紧张的,这显然是患者对耳鸣缺乏基本的认知所造成的误会,TQ中还有“几乎我所有的问题都是由于耳鸣引起的”这样的问题,这都是直接采纳患者的抱怨而未用专业知识加以仔细分辨而形成的条目,几乎所有的SRTQ中都有类似的条目,如在国内应用较多的THI中有“耳鸣会经常让你感到疲劳吗?耳鸣是否使你觉得没有安全感”等条目,耳鸣仅是听到一种响声而已,并不会引起疲劳,也不会危及生命,如果产生了疲劳或没有安全感,说明患者对耳鸣产生了误会,将部分患者对耳鸣的错误归因作为一个固定问题询问其他患者,以评估耳鸣的严重程度并不合适,因为这些条目的答案实际上与耳鸣严重程度无关。
2.2患者的抱怨与性格及文化背景有关
不同性格、生活经历和文化背景的患者对耳鸣的认知和反应完全不同,这一特点决定了不同的患者对耳鸣的抱怨内容完全不同,这一因素也会造成有些抱怨与耳鸣严重程度关系不大。例如TQ:“我不得不承受耳鸣,这太不公平了;我是耳鸣的牺牲者;有时我想到有耳鸣就非常生气”;THI:“耳鸣是否使你变得容易发怒?”;THQ:“耳鸣使我人际关系不好”。这类的抱怨可能来自西方文化背景下的人,对于大部分中国人来说不会有这样的问题,而这类问题的答案与耳鸣严重程度毫无关联。
另一方面,不同知识背景的人对同一个问题所用的抱怨语句也会不同,将一部分患者对耳鸣的抱怨语句用于询问其他文化背景的患者有时也不合适,这是同一个问卷中往往使用多个语句来询问同一个方面的问题的原因之一,如THI:“你会因耳鸣而生气吗?你经常因耳鸣而发怒吗?你经常会因耳鸣而抱怨吗?”这三个问题所问的是同一件事,这可能是不同的患者习惯于用不同的语句来表达所造成的。但即便如此,也很难将不同文化背景下所有患者的抱怨语句通过一个问卷全面体现出来形成国际通用的问卷,近30年来SRTQ不断被研发出来就是最好的证据,因不同的问卷核心内容大体相似,区别只是条目数量的差异以及所用的语句表达方式不同。
3.由患者填写SRTQ的弊端
SRTQ通过患者自行填写的方式取得分数,这种方式可能产生如下3个方面的问题。
3.1患者理解有差异
不同知识背景的患者对同一个书面问题的理解可能有差异,通常情况下临床医生在繁忙的诊疗工作中不可能就问卷的每一个条目对每个患者作出详细解释后才让患者填写,因此很难保证每个患者能按问卷设计者的要求准确理解书面问题的含义而作出正确的选择,从而容易造成误差及相互之间分数的不可比性。吴迪等用中文版THI对例耳鸣患者进行了试验,在THI的三个常规答案选项基础上,增加了一个“不确定”,即患者如果不能正确理解该问题而在“是、有时、否”三个选项间作出正确选择时,可以选择“不确定”,患者首先按常规自己阅读THI量表并填写答案,然后由医务人员针对每个问题的含义与患者进行解释后,再让患者重新选择答案,结果第一次填写时只有49.4%的患者能独立完成,超过一半的患者无法正确理解THI的某些条目,而这些无法理解的条目在常规填写中患者很可能会任意填写或不填写,造成分数的不可靠或无法统计。由此可见,患者对书面问题的理解能力差异,容易造成所填写的答案不一定能反映患者的真实情况,这是一个不容忽视的问题。
3.2问卷中的负面问题可能造成负面影响
由于SRTQ中的问题大多取材于患者对耳鸣的抱怨,有些极为负面的问题都是基于患者的错误归因而产生的,如TQ:“如果耳鸣继续存在,我的生活将没有意义”;THI:“你是否因耳鸣而绝望?”TRQ:“耳鸣已经让我产生了自杀的念头等”。很多求医的耳鸣患者大多有不同程度的焦虑、抑郁倾向,让每个耳鸣患者反复多次在这些极为负面的问题里填写答案,可能产生错误的认识甚至负面的暗示,加重其对耳鸣的担忧和焦虑。
3.3填写费时
耳鸣的临床干预是一个长期的过程,在干预过程中需要反复多次对患者的耳鸣程度进行评估以决定下一步是否需要调整干预方案。现有的SRTQ大多较为复杂,如美国耳鸣临床实践指南推荐的5个SRTQ中,涉及的条目为25~52个,包含25个条目的THI填写时间一般需10分钟以上,患者反复填写此类问卷比较费时,且可能造成厌烦而使填写结果不准确,这也是近些年来不断有相对简短的SRTQ被研发出来的原因之一。尽管这些相对简短的问卷条目数明显减少(仅有7~12个条目,见表1),可以缩短填写时间,但由于问卷仍是基于患者对耳鸣的抱怨而建立的,因此局限性依然不可避免。
4.临床应用的局限性
SRTQ的临床应用主要在两个方面:一是作为疗效评价的工具,二是作为临床干预决策的参考。
4.1SRTQ用于疗效评价的局限性
任何一个患者填写任何一份SRTQ后都可以得到一个分数,但每次填写得到的分数可能都不同,这个差异可能来自两个方面:一是患者对条目的理解发生了变化或填写时的认真程度不同,二是病情本身发生了加重或减轻的变化。前者属于测量误差,后者属于疗效。一个好的疗效评价工具应尽可能减少测量误差,才能准确反映病情的变化。测量误差是难以避免的,多少分值变化属于测量误差范围,这是在选择疗效评价工具前必须清楚的。
最小临床有意义变化值(MCSSC)是衡量疗效评价工具允许的测量误差的一项指标,只有明确了MCSSC才能确定疗效评价标准(即多大的分值变化可以确定为有效)。在现有的20多种SRTQ中,大多数都没有进行MCSSC研究,只有THI、TFI等极少数的SRTQ报道了MCSSC的研究,而在极少数的研究报道中,结果的可靠性也是值得商榷的,如目前应用最广泛的THI,据研发者Newman等报道的MCSSC为20分,即治疗后THI得分降低超过20分才能被确定为有效,而据Zeman等报道的MCMSC为7分,两者相差达13分,使临床医生很难选择哪一个分数变化值作为有效标准。笔者认为造成这种差异的原因除二者采用的研究方法不同之外,由患者自行填写量表这种方式导致的结果不稳定可能是重要原因之一。由于SRTQ的MCSSC研究结果稳定性不理想,在实际应用中很少有研究者根据MCSSC来判定疗效,大多采用治疗前后平均分值是否存在统计学差异的方式来判断某一治疗方法的疗效,例如Newman等统计了41篇应用THI作为疗效评价工具的文献,大部分是采用THI得分均数比较的方法,但采用这种方法判定疗效存在一个不容忽视的问题:没有考虑可能存在的测量误差,即治疗前后平均分值存在的统计学差异未必反映的是耳鸣程度的变化,有可能由测量误差所导致。另外,样本量过少的情况下也无法通过均数比较来判定疗效。故应用THI等耳鸣自评量表进行疗效评价的合理性尚值得进一步探讨。
4.2SRTQ对临床决策的参考价值
无论是耳鸣患者,还是接诊耳鸣患者的医生,都需要知道患者的耳鸣有多严重?这对于是否需要干预以及需要什么样的干预具有重要意义,例如轻度耳鸣,可能仅需要简单的解释,而重度耳鸣,可能需要详细的心理疏导并配合一些医疗干预措施。作为耳鸣严重程度评估工具,应能给医生和患者提供一个比较明确的严重程度的提示。在现有的20多种SRTQ中,大多只能得到一个总分,没有提供严重程度分级标准,只有THI、TFI等极少数的SRTQ提供了依据得分值的耳鸣严重程度分级标准。值得注意的是,依据THI的分级标准有两种,尚未统一:Newman等提出根据THI得分值大小将耳鸣残疾程度分为4级:0~16分为1级(无残疾),18~36分为2级(轻度残疾),38~56分为3级(中度残疾),58~分为4级(重度残疾);而McCombe等提出依据THI将耳鸣严重程度分为分为5级:1级为轻微耳鸣(0~16分),2级为轻度耳鸣(18~36分),3级为中度耳鸣(38~56分),4级为重度耳鸣(58~76分),5级为极重度耳鸣(78~分)。
综上所述,目前应用的SRTQ均来自国外,由于条目设计时直接取材于耳鸣患者的抱怨、使用时由患者自己阅读填写,使得分值不能真实反映耳鸣的严重程度,年美国耳鸣临床实践指南在现有的20多种SRTQ中,推荐了5个SRTQ作为区分耳鸣是否扰人的评估工具,说明尚无一个公认的最理想的SRTQ,由于测量误差难以确定,因此临床应用SRTQ作为疗效评价工具时宜慎重。我国学者自主研发的耳鸣评价量表(TEQ)在研发思路及使用方法上克服了SRTQ的以上缺陷,为耳鸣严重程度评估及疗效评价提供了新的思路。TEQ由6个问题组成,每个问题都是在长期的耳鸣临床实践中被筛选出来可以代表耳鸣严重程度的指标,既考虑了耳鸣本身的轻重变化,也考虑了耳鸣对患者产生的影响。使用时由医生逐个问题询问患者后予以评分,可以在临床常规的病史询问中完成,无需额外耗费时间,且避免了由患者自行填写问卷带来的理解差异以及其他负面影响,一般在2~4分钟内可以轻松完成评估。相关研究表明,TEQ具有良好的信度、效度与反应度,分值可以作为耳鸣严重程度分级与疗效评价的可靠依据。
相关文献请查看当期原文
《中国听力语言康复科学杂志》
年第16卷第4期P-
预览时标签不可点收录于话题#个上一篇下一篇