Data Citation Index 評選流程

Web of Science 中的 Data Citation Index 評選和收錄政策

不論自願或因補助資金資助單位的政策規定等因素,人們製作以供使用的數位資料大量增加,因此更需要公開學術研究資料建立者的貢獻度並加以肯定。Web of Science 現已包含 Data Citation Index,其於 2012 年推出,可用於科學研究資料的檢索及探索,並將已發表的文獻與適當的引文計量互相連結。由於豐富數位網路資源大量增加,科睿唯安必須在這些資源與 Data Citation Index 評選收錄的資料之間取得平衡。本文說明 Data Citation Index 的收錄標準與程序。

科睿唯安秉持一貫追蹤出版業的創新發展趨勢,並與其共同堅持使命,讓學術社群注意到寶貴資料的存在。

 

評選

具有收錄資格的研究資料包括:儲存在獲認可儲存庫中的資料研究、資料集和軟體。

定義:

  • 資料儲存庫 (Data repository):存放資料研究的資料庫或合輯,以及可儲存並提供原始資料的資料集。其中的組成資料研究或個別資料集上會標註,以提供可用原始資料的內容。
  • 資料研究 (Data study):描述儲存庫中存放的研究或實驗,以及資料研究中已使用的相關聯資料或軟體(包括一段時間的系列或縱向研究)。資料研究可以是文獻中可引用的物件,其資料可能會附帶引用參考,以及首席研究人員、資金資訊、學科條款、地區涵蓋範圍等相關資訊。資料提供的詳盡程度因各儲存庫而異。
  • 資料集 (Data set):儲存庫提供的單一或具一致性的資料組合、資料檔案或軟體物件,其為合輯、資料研究或實驗的一部分。資料集可以是各種檔案格式和媒體類型:其可以是試算表、影像、影片、音訊、資料庫等數據型檔案。資料集可以是文獻中可引用的物件,其資料可包括附帶的引用參考,但通常這些資料集會沿用所歸屬之整體研究的資料。

 

評選流程

隨著存放庫的增加,科睿唯安會每週持續進行儲存庫的識別和評選工作。此外,我們也會不斷審核現有的涵蓋範圍。我們會監視目前所含的儲存庫,以確保儲存庫可供使用,並維持高水準以及與 Data Citation Index 產品的明確相關性。此處所述的儲存庫評選流程適用於 Data Citation Index 涵蓋的所有資源。

我們在評選是否收錄儲存庫時會考慮質與量等許多因素。包括儲存庫的基本出版標準、編輯內容水準、著作權的國際多元性及相關聯的引文資料,全都會納入考量。編輯人員不只依賴某一項因素,而是會結合資料並找出關連性,才能判斷儲存庫的整體優缺點。

科睿唯安執行評選的編輯都擁有負責領域的相關教育背景,並對自己審核的儲存庫資料瞭如指掌。

存放庫評選的主要評選依據如下:

  • 學科
  • 編輯內容水準和儲存庫屬性
  • 地區起源和涵蓋範圍

當某個儲存庫獲選收錄之後,我們會進行後續評選,以決定要提供哪些適當的資料元素供探索及引用。

 

基本存放庫發表標準

 

具持續性及穩定性

評選流程基本標準是儲存庫和其中存放的資料需具有持續性。儲存庫必須證實具有長效性,才能初步獲得 Data Citation Index 的收錄資格。科睿唯安也會審核是否持續存入新資料;因為穩定的新存入資料流量是證實資源目前仍相當活躍的指標。一般來說,儲存庫要保存完整的資料,而不應只存放資料及提供資料的遠端/外部來源網頁連結。這樣可確保值得信賴的資料引用,以落實引文計量和資料重複使用。資料出版流程的明確定義(包括資料提供者/建立者的隸屬機構等關係)最好都能清楚表明。一旦儲存庫獲取評選收錄時,所有存入的資料都會納入 Data Citation Index;我們只會將僅供參考而未存入的資料排除,而不會再進行子儲存庫評選。

 

資金聲明

Data Citation Index 的目標是推廣資料引用,並將資料與研究文獻互相連結。為了落實這個目標,我們會特別關注有顯示文獻起源並具備補助資金資訊的儲存庫。從歷史上來看,目前英文是科學的通用語言。因此,科睿唯安會把重心放在以英文發表資料的儲存庫,或至少必須能提供足夠英文描述性 (metadata) 資訊的儲存庫。Data Citation Index 有一部分收錄的儲存庫僅發表英文資料描述,而實際資料是以其他語言呈現。不過,長遠來看,對國際研究社群來說最重要的儲存庫都會以英文發表資料。對自然科學來說尤其是如此。此外,所有儲存庫都必須以拉丁字母顯示 metadata 資料和引用次數。

 

同儕審核

雖然對於已存入資料的同儕審核並沒有通用規定,但申請同儕審核流程也是一種儲存庫標準的指標,可代表顯示資料的整體品質,以及任何引用參考的完整性。建議在發表每個儲存庫、資料研究或資料集時,最好都包含支援所示研究的資金來源相關資訊。

 

資料年限

此外,科睿唯安必須制訂儲存庫和研究資料的長期保留和永續發展評定標準。我們不會限制存入資料的年限。由於我們提供的是多學科服務,各領域研究人員對「年代久遠」資料的態度和需求都是正面的。同樣地,在時效性方面也沒有限制。當資助專案結束時,已發表的寶貴研究成果日後可以不必更新,但仍可持續引用並在目前研究中重複使用,因為相較於對應的研究文章,資料出版可能會因作者及/或資助者所設的禁令而耽誤。

 

研究文獻的連結

為了提升資料引用的標準,並進一步衡量日漸增長的學術界影響力,如果資料儲存庫有顯示資料集與產生或重複使用這項資料的研究文獻相關起源,我們會優先考量。

同樣地,我們不只依賴某一項因素,而是會結合資料並找出關連性,才能評估儲存庫的整體優缺點。科睿唯安執行這類儲存庫評選的員工都擁有負責領域的相關高等學位教育背景。

 

編輯內容

科睿唯安會收錄下列三大學科領域的研究資料:理工科、社會科學和藝術與人文學科。不論多學科、跨學科或小眾學科的個別儲存庫都具有收錄資格。科睿唯安編輯群可快速取得的資料量非常龐大,每天都能觀察國際資料情勢,因此非常擅長識別新興主題和活躍領域。

 

國際多元化

雖然科睿唯安以提供資訊給國際讀者為目標,因此希望確保儲存庫的供稿作者、編輯、資料提供者和存入資料的國際多元性,但也會適當考量當地和地區的網路學術生態。所有儲存庫都會套用一致的評選標準,不論其地理涵蓋範圍為何(國際、國家、區域或機構)、為多學科或小眾學科。

 

資料引用與標準

雖然研究社群非常需要掌握資料的引用和歸屬情況,但目前標準仍不一致,研究文章中引用參考書目的資料亦不多見。為了落實這個目標,科睿唯安提供可用於每筆記錄的標準化引用格式,以鼓勵大家引用資料。為了決定引用格式,我們評估過數種提議的標準。科睿唯安採用 DataCite 引用標準,因為該標準廣受認可,並適用於各種資料類型和學科。

科睿唯安和研究社群非常重視資料引用及資料儲存庫內容與文獻的連結功能,因此如果儲存庫可提供引用存入資料的參考數據,或存入資料記錄引用的參考數據,即會優先考量。

 

推薦收錄儲存庫

若要推薦收錄特定的資料儲存庫,請將詳細資料傳送至 repository.submission@clarivate.com,並附上可供電子存取的 URL 等詳細資料。

 

參考資料:

Ball, A. & Duke, M. (2011).How to Cite Datasets and Link to Publications.DCC How-to Guides.
Edinburgh:Digital Curation Centre.
線上存取位置:http://www.dcc.ac.uk/resources/how-guides/cite-datasets

Borgman, C. L. (2008).Data, disciplines and scholarly publishing.Learned publishing 21 (1):29-38
doi:10.1087/095315108X254476
DataCite.Why Cite Data? http://www.datacite.org/whycitedata

Reilly, S., Schallier, W., Schrimpf, S., Smit, E., Wilkinson, M. (2011).Opportunities for Data Exchange Report on Integration of Data and Publications.
線上存取位置:http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODE-ReportOnIntegrationOfDataAndPublications-1_1.pdf