哈佛著名的護士健康研究學習如何構建數據庫(二)?

上一期講了怎樣才是一個合格的,並可以長期使用的數據庫。那麼,下面就要說一說數據庫的構建過程了。

從某種意義上說,臨床科研就是在構建數據庫,從臨床設計到實施,再到數據的分析和文章的發表,數據庫就是貫穿始終的核心。

簡單歸納,數據庫的構建可以分為以下幾個步驟:

第一步

設立試驗目的:將決定數據庫中變量的種類和多少。如果設定的課題越狹窄,那麼收集的變量越有針對性,量也會相對少。而像前文提到的“護士健康研究”,因為是一個大的論題“導致女性主要慢性疾病的風險因素”,則必須收集相對較多的變量以供多方面的研究所需。

第二步

設計研究方案:包括臨床試驗設計、數據收集和存儲、生物樣品收集和儲存及數據庫的維護及更新等;

a)文件準備和審批(包括倫理審批,研究者手冊,知情同意書等);

b)試驗人群定義(包括入組人群定義、入排標準、疾病診斷標準等)。

人群的定義不是簡單的描述,而是融入於試驗設計的起初;人群的定義決定試驗的成敗,也將決定數據分析結果試用的範圍;

c)干預措施/暴露:主動的干預(試驗用藥,試驗手術)和暴露因素等;

d)生物樣品收集(收集方案和樣品檢測SOP);

e)試驗終點定義(試驗終點和長期隨訪終點)。

所有的這些信息,都需要設計專門的病例報告表(CRFs)進行信息的收集和儲存。

第三步

臨床試驗執行:從數據庫角度,需要數據錄入員根據試驗方案,主要是CRF的填表說明,將數據錄入到數據庫中;

- 傳統上,紙質CRFs的數據登記方式最為普遍。當需要填寫的問題較多,切較複雜時,紙質CRF較為方便和準確,但卻不利於多中心合作,需要很高的數據維護成本,也無法進行數據的實時查看和糾錯;

- 互聯網的發展,讓數據庫也有了新的方式。現在,越來越多的研究機構開始使用電子數據收集系統(EDC)進行數據的收集,這樣大大提高了醫院間的遠程合作,數據的彙總及監察。

第四步

數據整理,清理,數據分析和文章發表。

到此為止,為正常臨床試驗結束;如果需要建立長期的數據庫,則根據長期目標進行隨訪。

第五步

數據庫擴大效益:數據庫除了供構建者使用外,往往會吸引更多對其感興趣的智囊進行數據庫的二次開發。那麼一個好的數據庫描述變得非常重要。經驗告訴我們,一個完善的數據庫需要包含如下一些信息,才能吸引更多的科研愛好者,將數據庫變得更有價值。

1.研究描述:研究目的、研究人群、樣本量,甚至是最新發表成果等;

2.問卷描述:問卷描述,變量編碼,變量名稱及相關數據收集標準;

3.實驗數據:試驗變量信息等;

4.試驗樣本及ID記錄:血液,糞便,組織等;

5.樣本儲存條件;

6.生物標記物評價方法;

7.數據庫使用說明。

比如哈佛“護士健康研究”,就將數據庫的歷史,數據收集的過程,問卷信息及最新成果公佈在網站上,吸引非常多的外部合作者。只要你申請成為數據庫的使用者,還將收到更多跟數據庫相關的信息幫助數據庫。當初我使用的時候,根據我的方案還收到了相關的SAS code,真的是太受益了。

LinkLab預告

數據庫的構建是一個長期而漫長的過程,但是時間的積累是最大的財富。有了好的數據庫,就該談談怎麼利用了。有兩方面的使用,1)如何使用數據庫的數據;2)如何使用數據庫平臺。未來兩期我們將重點分享。

原作者： LinkLab

相關問題答案

Let us answer it!