原标题:标准化数据采集平台构建及在临床试验数据质量控制的应用
来源:临床药理学 ):
[摘要]规范、完整的试验数据是临床试验统计分析的先决条件也是临床试验结果真实可信的有力保障。当前电子数据采集系统(EDC)以其能够优化试验设计、保障数据真实可靠、控制试验成本和风险等优势得到了国内临床試验数据管理行业的极大重视但也存在数据采集规范化、标准化不足的问题。本文以基于ClinCapture二次开发的药物临床试验数据采集平台eClinicaXY为例闡述了标准化数据采集平台的架构设计、遵循标准以及在临床试验数据质量管控方面的优势特点。
[关键词]临床试验;数据采集平台;標准化;数据 质量控制
临床试验数据管理的目的在于采用严格的质呈控制获取完整、可靠的临床研究数据进而通过科学严谨的统计分析確定研究治疗的有效性与安全性。 当前我国临床试验数据的标准化管理尚处于发展阶段数据与执行流程质昼管控不足与现如今整体临床研究统一规范化要求之间的矛盾还未能完全显现[l] ,使得试验数据解读及异常数据核查往往存在一定的延滞性和局部性,徒然增加数据清洗审核周期及试验结果的不确定性
EDC)是包含事件计划和用户沟通方案在内的适用于临床试验数据采栠、传输和管理的软件平台。据统计EDC可平均同步筛查第三方接口的受试者什么意思随机化,可根据试验设计选择依据盲表或基于动态随机化算法的中央/中心随机化;(2)可在系统中预设試验于预、人口统计学、动态或自定义分组受试者什么意思可根据试验方案按单一或多重分组权重接受不同的于预;(3) 根据符合CDSIC数据采集域的eCRF模版文件生成研究事件,将所有研究事件分解为计划、非计划和普通三类各事件分别分配至对应随访时点形成整体试验流程。
3.3 数据采集与管理模块
该模块包含数据提交、数据监察和管理、数据提取三部分可实现 (1)按方案执行时间流创建受试者什么意思数据条目列表,根据不同受试者什么意思所处的试验阶段分别执行时点对应操作;(2)栠成MedDRA、WHO DDE术语编码及可配堂的药品字典资源在试验数据生成时即完成术語表述标准化;(3)以XML标准格式编辑数据核查规则,从数据质昼、逻辑合理性、时间序列准确性方面实现数据流实时核查;(4)集成源数据验证(SDV)、紸释及质疑管理从多角色层面确保试验数据的真实性、准确性和完整性;(5)以电子签名和操作痕迹稍查日志的方式追踪受试者什么意思状態及系统内每一步操作,保证试验的真实性和可溯游性
3.4 试验结果报告模块
(1)以仪表板(dash?board)和交互式图表的方式实时展现各阶段研究事件完成忣数据分布悄况;(2)可接入SpagoBI智能商务BI套件,申办方和项目监察员可在不导出试验数据的前提下通过数据图表实时追踪所属研 究项目进展悄况及早发现试验异常操作、受试者什么意思不良事件、异常或具有异常趋势的数据;(3)可根据耍求自定义导出数据栠,简化统计分析数据栠嘚确定及递交数据的整合;(4)可以多种格式(PDF/SAS/EXCEL/SPSS/TXT)生成受试者什么意思病例报告数据及注释CRF(annotated CRF),也可通过SAS服务器在线生成临床试验结果分析报告
eClinicaXY数据采栠平台以研究事件(如个体特征、实验室检查等)作为数据采集域单元将整体临床试验分解为顺序时间节点要索,其中研究事件由基于CDASH標准构建的eCRF模版文件自动生成分为时间相关重复事件、时间相关独立事件和累积性事件三类。每个研究事件附有特定的XML核查验证规则系统根据临床试验执行流程将各研究聿件分别安排至对应的执行时间点,通过特定“时间窗-研究事件”顺序组合的模式构建电子化临床试验過程。当试验项目创建完成并启动后eClinicaXY 数据采集平台以研究事件执行流的方式创建受试者什么意思数据条目列表,分别采集受试者什么意思各试验阶段产生的结果数据并整合成为符合CDISC递交标准的全局数据集合
eClinicaXY数据采集平台临床试验执行技术路线可分为如下儿步:(1)项目设置,项目管理员根据具体临床试验方案设定研究项目详细信息、受试者什么意思入组条件及分组、项目参数等数据 管理员根据方案CRF和数据管理计划编写eCRF源文件和XML数据核查文档,并以同名配对的方式导人系统项目管理员将生成的研究事件组合为试验执行流程,在系统内技术測试和小范围可接受测试通过后将研究项目状态设置为“有效”;(2)受试者什么意思入组各中心将受试者什么意思信息输人系统,待筛选唍成后系统按照预先设定的试验类型和随机化方法为受试者什么意思自动分配唯一标识(SUB?JID)通过“受试者什么意思唯一标识-无序随机号-治疗方案-尤序药物包装号”盲态联动的药号分离方式确保试验盲态的顺利实施;(3)试验数据录入,研究者或CRC根据每位受试者什么意思的試验进程将产生的研究数据以隔离双份录人的形式录人对应数据条目若首次录入出现逻辑错误或二次录入与首次录人不一致时会触发预設核查条件并在数据保存之前提醒操作者,循环直至所有数据核查无误若有疑问可随时通过交互应答系统向研究者发出质疑;(4)数据导出,待最后一例受试者什么意思完成试验且尤遗留质疑时数据管理员可根据数据库锁定清单锁定数据库并依照试验方案以CDISCODM 格式导出受试者什麼意思数据之后由统计程序员将其分割、重组为统计分析数据集和递交数据集。整体执行技术路线见图2
5 优势特点及实现效果
通过构建苻合国家相关法规及行业标准的质昼控制体系,依据方案将整体临床试验细化为节点要素并建立严谨、一致的核查文件不仅可以缩短数據清洗周期,而且可以在试验数据真实、完整的前提下及早发现异常或具有异常趋势的数据当前临床试验数据质昼问题主要体现在转录錯误、不完整、安全性不足及语义表达碎片化等方面[12],标准化数据采栠平台可以最大限度避免上述问题,确保数据质抵控制的ALCOA+ 原则(可归因莊易读性、同时性、原始性、准确性、完整性、一致性、持久性和可获得性)
5.1 数据完整性及真实性验证
传统以纸制CRF为数据媒介的临床试驗最大弊端在于仅能依靠参与人员自觉遵守GCP准则来确保试验数据的完整性和真实性,数据及相关文件的访问、修改无法得到有效的楷查追蹤标准化数据采集平台根据CDISC 数据框架建立通用临床试验数据模型,最大程度使临床试验实际产生的数据与需要递交的标准数据相匹配。在此基础上结合标准术语栠、MedDRA术语词典、XSL模板文档、XML和JQuery核查规则文件共同构建横向数据与纵向数据相结合的具有较强稳健性的eCRF库,直接在数据庫内部完成原始试验数据的核查、编码与映射确保递交数据的完整性与规范性。
此外标准化数据采集平台集成了基于身份标识密码技術(Identity-Based Cryptograph, IBC)的多层次用户权限和操作痕迹稽查功能,痕迹稽查业务对象模型为一个六元组A=(U,S,D,R,VB,VA),其中U为操作者,S为操作对象D为操作日期时间,R为操作目的VB为更新前值,VA为更新后值保证试验数据的安全性和可溯源性。
药物临床试验经常会发生数据录人错误直至统计分析时才发现的现象唎如收缩压为80mmHg 而舒张压为110nunHg。标准化数据采集平台的数据核查功能可在JQuery吓数据录人初步筛查和XML规则逻辑核查的基础上利用数据库中存在的函數依赖以及进一步自定义化的近似函数依赖作为数据质扯规则来约减半结构化数据清洗的复杂程度[13-14]
数据核查的主体对象主要为数据缺失忣冗余、事件数据逻辑一致性、正常值范围及临床意义判定、随机化及方案违背等。系统根据预先设定的XML校验规则文档对方案中规定的主要和次耍疗效指标、关键的安全性指标在数据录入初期或经标准化编码映射入库后进行100%校验复核。在监测到异常数据后及时向对应责任權限的平台操作人员提出警示并复核追踪分析异常数据变化悄况。
5,3 整体数据适应性决策
临床试验有效性和安全性数据流是一组面板数据序列将实时数据流在数据库中分割为原始数据区段,标准化映射完成后进一步按照目标字段的固有统计学特性建立描述其整体分布的可視化模型同时不断用新 采集到的数据段修正当前关联模型的拟合度并探索具备统计显著性的事件,以此分析临床试验的进展悄况对数據流中的异常和离群值俶出响应。通过对异常或具有异常趋势的特定时间及区间数据进行整体比较或与先期研究数据对比并由研究者从专業角度综合分析及早识别疗效数据分布趋势及安全性数据异转发生情况[15]。在试验数据标准化整合和全面质最管控的整体框架下对试验实施做出科学严谨的适应性决策(如样本昼再估计、适应随机化等)以便提前采取调整措施,在保护受试者什么意思权益的同时全面控制臨床试验整体执行质昼
真实、完整、可溯源的高质蜇临床研究数据对试验结果的可靠性和准确性起若至关重要的作用。现代化标准的临床试验数据管理已不再局限于传统简单的数据录入还包括通过严谨、一致的质昼控制措施确保数据的规范化与准确化[16]。融合了CDISC 标 准数据框架、MedDRA 术语词典、XML及JQuery数据核查文件等标准化文档的模型驱动架构与需求驱动架构相结合的标准化临床试验数据采集平台不仅具有源数据管悝统一规范化、数据编码动态联动、即时数据异常校验、数据安全生命周期可控等优势特点而且可实现临床试验执行过程中数据误录及時修正与异常数 据早期筛查等功能,以此辅助制药公司优化质昼控制资源配宜降低传统临床试验数据收集模式中因采集、编码、验证相互隔离而导致的质呈管控空泛化。标准化的临床试验数据采集平台同时搭配协同运行的组织环境、执行流程、人员配置和管控机制必将荿为未来临床试验数据管理的发展趋势。
欢迎留言你的看法、异见
生物统计/数据管理 数据库/IT等岗位推荐