中國科學院文獻情報中心在長期的科研活動、數(shù)據(jù)加工、情報服務及網(wǎng)絡數(shù)據(jù)抓取中產(chǎn)生和積累了大量多科技服務領域、多層次的大數(shù)據(jù)信息,以及與科睿唯安、Springer、Elsevier、維普等數(shù)據(jù)庫商在元數(shù)據(jù)層面進行合作, 實現(xiàn)對其中的科技創(chuàng)新要素進行采集匯聚、知識抽取與知識計算,從基礎數(shù)據(jù)庫、領域知識庫與知識圖譜3 大層次創(chuàng)建了支撐科技創(chuàng)新的“科技大數(shù)據(jù)知識資源中心”(https://scholareye.las.ac.cn/), 為精準服務、知識圖譜、智能計算、智能情報提供不同階段及不同層次的數(shù)據(jù)支撐。截止到目前(2020年8月),建成了覆蓋各類實體數(shù)據(jù)4億,建成領域?qū)n}數(shù)據(jù)200多個,人才數(shù)據(jù)9000萬+,機構數(shù)據(jù)1100萬+,重要國家地區(qū)項目數(shù)據(jù)600萬+, 知識圖譜關系數(shù)據(jù)60.5億+。
從科研主體、科研活動、科研成果、科研裝置與科學數(shù)據(jù)五大維度設計了基礎數(shù)據(jù)資源建設模型,已經(jīng)建成了擁有專家學者、科研機構、學術期刊、資助機構、科研項目、學術會議、情報資訊、科技政策、論文、專利、報告、獲獎、專著、標準、軟著等10多種基礎數(shù)據(jù)資源。 同時該基礎數(shù)據(jù)資源庫也集成了NSTL 研制的STKOS(科技知識組織體系),其中規(guī)范概念達到65 萬+,規(guī)范術語達到230 萬+,覆蓋理工農(nóng)醫(yī)。
建成的基礎數(shù)據(jù)資源,從學科分類、產(chǎn)業(yè)分類、主題分類、STKOS 范疇分類進行深度標引,對于知識分類計算提供了基礎高質(zhì)量數(shù)據(jù);從機構名稱及學者名稱進行了自動規(guī)范。
通過集團引進開通網(wǎng)絡數(shù)據(jù)庫170余個,涵蓋1.9萬種外文電子期刊,1.8萬種中文電子期刊,18.4萬卷/冊外文電子圖書,35萬種中文電子圖書。數(shù)據(jù)庫包含全文數(shù)據(jù)庫、文摘數(shù)據(jù)庫、數(shù)值型數(shù)據(jù)庫和工具型數(shù)據(jù)庫等多種類型。
中國科學院文獻情報中心經(jīng)過長期的積累和建設,提供中國科學引文數(shù)據(jù)庫CSCD(http://sciencechina.cn/)、 中國科學院學位論文知識發(fā)現(xiàn)系統(tǒng)(http://dpaper.las.ac.cn/homeNew)、院士文庫(https://yswk.csdl.ac.cn/)、 古籍資源、中國科學院檔案(https://www.acas.ac.cn/)、中國科學院機構知識庫網(wǎng)格(IRGrid)(http://www.irgrid.ac.cn/)、 全球科學基金數(shù)據(jù)(http://infomonitor.las.ac.cn/skd/analyze)等特色資源服務。
中國科技云認證聯(lián)盟(CSTCloud)基于Shibboleth/OAuth2雙認證體系,實現(xiàn)中國科技云通行證(中國科學院用戶即郵箱賬號)統(tǒng)一登錄認證,訪問出版商數(shù)據(jù)服務平臺,中國科學院文獻情報中心基于該認證聯(lián)盟推出文獻獲取服務,有效支撐了中國科學院科研人員居家科研辦公。截止到目前,中國科技云認證聯(lián)盟已經(jīng)成功接入了包括中國知網(wǎng)、Web of Science、Elsevier、Springer等多家國內(nèi)外主要數(shù)據(jù)庫資源,有效支持中國科學院以及其他接入聯(lián)盟的科研用戶突破時間與空間的限制,在居家、差旅等非指定IP范圍內(nèi),通過ID身份認證方式隨時、隨地訪問本機構訂購開通的各類型國內(nèi)外數(shù)據(jù)庫資源。
中國科學院文獻情報中心通過“領域科技情報監(jiān)測服務云平臺”,在領域情報專家的參與下,建成了面向納米科技、集成電路、重大疾病、水污染、生物安全、先進制造等200多個領域?qū)n}門戶(http://stmcloud.las.ac.cn/), 有效支撐了市場研究人員、一線科研團隊、研究所圖書館員以及戰(zhàn)略情報分析人員的快速了解領域最新重要科技動態(tài),掌握同行或競爭對手的科技活動動向,發(fā)現(xiàn)領域重點及熱點主題, 把握領域發(fā)展概貌,輔助科技決策。該領域?qū)n}數(shù)據(jù)資源來自于國內(nèi)外相關機構網(wǎng)站,自動搜集、遴選、描述、組織和揭示各機構發(fā)布的重大新聞、研究報告、預算、資助信息、科研活動等。
國家數(shù)字科技文獻資源長期保存體系(National Digital Preservation Program, NDPP) 聯(lián)合國內(nèi)相關機構,系統(tǒng)、全面實施數(shù)字科技文獻資源,特別是外采數(shù)字科技文獻資源的本地化長期可靠保存,有效解決因自然災害、人為破壞、地緣政治等各種潛在危險導致數(shù)字資源在我國無法長期可靠利用等問題,為國家科技信息安全提供戰(zhàn)略保障。同時積極參與國家教育文化社會各領域所需的其他數(shù)字資源的長期保存。 點擊訪問>>
NDPP協(xié)作保存網(wǎng)絡由1個管理節(jié)點、若干保存節(jié)點構成。
目前已建設3個保存節(jié)點:
○ 中國科學院文獻情報中心 ○ 中國科學技術信息研究所 ○ 北京大學圖書館
各保存節(jié)點分別運行一套完整、獨立的保存服務系統(tǒng),包括數(shù)據(jù)攝入、保存管理、公共服務等子系統(tǒng)。
各保存節(jié)點通過向管理節(jié)點注冊加入到保存網(wǎng)絡中,并定期向管理節(jié)點同步數(shù)據(jù)。保存節(jié)點間可互為備份。
聯(lián)系人:吳振新
聯(lián)系郵箱:wuzx@mail.las.ac.cn
基于已經(jīng)構建的學術基礎數(shù)據(jù)庫,包括專家學者、科研機構、學術期刊、資助機構、科研項目、學術會議、情報資訊、科技政策、論文、專利、報告、獲獎、專著、標準、軟著等類型實體, 從學科分類、產(chǎn)業(yè)分類、主題分類、STKOS 范疇分類進行深度標引,從21類知識關系進行關聯(lián)組織,實現(xiàn)了學術知識圖譜的構建,其中知識實體達到4億+、知識關系60.5億+。 該學術知識圖譜已經(jīng)全面支撐中國科學院文獻情報中心新一代知識服務系統(tǒng),慧眼(https://scholareye.las.ac.cn/)、慧科研(https://scholarin.cn/ https://inst.scholarin.cn/) 以及科技大數(shù)據(jù)融合治理云服務(https://data.scholarin.cn/)。
同時基于該學術知識圖譜,創(chuàng)建了13個研究方向知識圖譜服務場景(http://kgview.las.ac.cn/),以3D可視化的形式揭示知識節(jié)點、知識關聯(lián)路徑、核心知識、離群知識點等。
綜合利用基于規(guī)則、深度學習及預訓練模型算法,研發(fā)了面向領域知識圖譜智能構建的方法體系及系列工具。實現(xiàn)了基于領域?qū)<覙俗⑿≌Z料數(shù)據(jù)集,即可快速智能構建領域知識圖譜,突破傳統(tǒng)純?nèi)斯嫿I域知識圖譜的工作模式。
從人工智能領域的科技文獻中,智能抽取研究問題、研究方法、研究數(shù)據(jù)與研究指標等細粒度知識,并形成了系列工具集。
從化學鍵能領域的科技文獻全文中,智能抽取科技文獻中化學鍵能科研指紋,包括化合物、溶液、方法、反應、PKA、PKA-VALUE以及關系的指紋自動識別。
面向用戶提供科學技術領域詞表。包括敘詞表、分類表、術語表、詞典等素材,涵蓋數(shù)學、物理、化學、天文、生物、環(huán)境等學科。 面向用戶提供特定領域知識組織體系建設。根據(jù)專業(yè)領域人員的需求,分析領域內(nèi)文獻內(nèi)容及特點,構建支持特定應用的詞表或本體。 可用于支撐精準檢索、文獻實體識別與標注、新知識關聯(lián)發(fā)現(xiàn)、趨勢分析與預測等知識服務。
濕地語義知識組織體系知識庫。通過數(shù)據(jù)采集、集成和構建形成濕地地名、植物、動物等的實體數(shù)據(jù)集,構建動植物、地理位置、研究機構、個人和文獻等組成的語義關系網(wǎng)絡,用以支撐濕地領域知識環(huán)境服務、動植物數(shù)據(jù)服務、濕地遙感監(jiān)測服務等。
人工智能領域知識組織體系。通過術語發(fā)現(xiàn)與提取、概念關系挖掘與整合等,構建人工智能領域的概念和術語組成的知識網(wǎng)絡,用以標記領域?qū)W術成果及研究人員,優(yōu)化學術成果相關平臺檢索查詢、數(shù)據(jù)挖掘的精準度等。
為大中型企業(yè)、研究院所等機構提供知識組織體系構建與優(yōu)化咨詢服務,具體涵蓋機構知識組織現(xiàn)狀調(diào)研、知識組織體系構建方法培訓、知識組織解決方案和原型系統(tǒng)建設等內(nèi)容,可有效支撐機構內(nèi)部實現(xiàn)各類基于語義的智能化應用,如精準知識推送、語義檢索、知識發(fā)現(xiàn)、知識抽取、智能問答等。
華為知識組織咨詢服務為華為提供知識組織整體解決方案,包括數(shù)據(jù)邏輯、業(yè)務邏輯、工具包、知識組織構建流程等建設方案,以支撐語義檢索、智能問答、精準知識推送等基于語義的智能化應用。
大科學裝置知識組織體系構建咨詢服務為中國科學院文獻情報中心提供大科學裝置知識組織體系構建解決方案,包括領域?qū)嶓w調(diào)研、領域模型構建、數(shù)據(jù)描述及采集規(guī)范設計、數(shù)據(jù)采集等內(nèi)容,為大科學裝置相關數(shù)據(jù)資源的結構化存儲、語義化檢索以及專題情報深度分析提供支持。
面向中國科學院各研究所提供編目服務,具體包括:承接所圖編目任務、編目業(yè)務培訓等相關服務。面向中國科學院內(nèi)向各研究所所圖老師進行館藏自動化系統(tǒng)培訓、答疑解惑等服務。
以API微服務模式,從多維度提供專家學者、科研機構、學術期刊、資助機構、科研項目、學術會議、情報資訊、科技政策、論文、專利、報告、獲獎、專著、標準、軟著等科技大數(shù)據(jù)數(shù)據(jù)資源。目前可以提供近4億科技大數(shù)據(jù)實體的實時檢索發(fā)現(xiàn)服務, 數(shù)據(jù)從宏觀上覆蓋理工農(nóng)醫(yī)四大領域;微觀上支撐從機構、主題及某一人等多個維度的大數(shù)據(jù)檢索發(fā)現(xiàn)服務。
面向?qū)<覍W者、科研機構、學術期刊、資助機構、科研項目、學術會議、情報資訊、科技政策、論文、專利、報告、獲獎、專著、標準、軟著等多元數(shù)據(jù),提供以下數(shù)據(jù)服務:一是提供用戶本地數(shù)據(jù)集的融合、規(guī)范與治理服務; 二是提供機構、學者、項目、期刊等數(shù)據(jù)的規(guī)范與豐富化服務;三是提供多元數(shù)據(jù)融合、規(guī)范與治理服務的工具;
提供按照機構維度進行自動匯聚科研機構科技成果數(shù)據(jù)、智能計算與描繪機構學術畫像以及機構當前布局情況及發(fā)展方向。同時可以實時提供該機構的研究人員數(shù)據(jù)(包括人員清單及對應的研究成果清單)、 科研基金項目數(shù)據(jù)、發(fā)表期刊論文數(shù)據(jù)(可以實時按照引用級別等維度進行統(tǒng)計)等數(shù)據(jù)。同時提供與支撐數(shù)據(jù)管理的云服務平臺,自動接收、管理與分析本機構的知識資產(chǎn)。
提供對您關注領域的國內(nèi)外相關機構網(wǎng)站的自動監(jiān)測采集、內(nèi)容提取、自動標簽、自動分類、重要度計算、實體抽取與統(tǒng)一知識組織描述,以API、數(shù)據(jù)集合包或者數(shù)據(jù)服務平臺等多種形式提供數(shù)據(jù)服務, 讓用戶快速了解領域?qū)n}最新重要科技動態(tài),掌握同行或競爭對手的科技活動動向,發(fā)現(xiàn)領域重點及熱點主題,把握領域發(fā)展概貌,輔助科技決策。目前已經(jīng)建立了200多個領域?qū)n}的實時監(jiān)測、采集與計算分析服務。
提供基于核心(WOS)論文集、全論文集、專利、基金項目等多類型數(shù)據(jù),面向情報分析人員,提供創(chuàng)建專題-專題知識組織-專題數(shù)據(jù)匯聚-專題數(shù)據(jù)清洗規(guī)范-專題情報分析的流程化與平臺化服務,并支持對本地數(shù)據(jù)集的導入與集成的一體化分析。
同時提供面向個性化科技情報需求的數(shù)據(jù)統(tǒng)計分析、知識內(nèi)容的提取與計算服務,快速向用戶提供情報分析數(shù)據(jù)。
提供定制化的數(shù)據(jù)產(chǎn)品服務,根據(jù)用戶需求,快速分析當前國內(nèi)外數(shù)據(jù)狀況,并制定數(shù)據(jù)定制和獲取方案,主要擅長的學科領域數(shù)據(jù)包括生物多樣性(植物、動物和菌物)、地學領域(地理和地質(zhì))、航空航天和經(jīng)濟產(chǎn)業(yè)類數(shù)據(jù)。數(shù)據(jù)類型包括期刊文獻(HTML和PDF)、圖書、音頻、視頻和科學數(shù)據(jù)等。
生物多樣性領域數(shù)據(jù)集:全球、亞洲和國內(nèi)的生物多樣性名錄、圖片、分布、文獻和測序數(shù)據(jù)的快速分析、定制、獲取、清洗和分析。
航空航天領域數(shù)據(jù)集:各國主要航天工程項目和開放技術資料文檔;主要航空技術服務公司名單及其產(chǎn)品和技術資料;登月計劃和登火計劃的樣品分析資料;在軌衛(wèi)星狀態(tài)和部分運維信息。
經(jīng)濟產(chǎn)業(yè)領域數(shù)據(jù)集:A股上市公司的基本資料和多年度財務數(shù)據(jù);科技園區(qū)、產(chǎn)業(yè)園區(qū)和園區(qū)企業(yè)的全國分布地圖;世界各國經(jīng)濟基本統(tǒng)計數(shù)據(jù)和歷年經(jīng)貿(mào)統(tǒng)計數(shù)據(jù)等。
提供定制化的數(shù)據(jù)咨詢解決方案,提供基于全球現(xiàn)狀數(shù)據(jù)和未來趨勢分析的咨詢服務。為科研單位、高校、政府機構、NGO組織等提供有關學科領域科學數(shù)據(jù)管理與應用的咨詢服務,具體包括科學數(shù)據(jù)的評估、科學數(shù)據(jù)共享服務、知識圖譜實踐、完整生命周期的科學數(shù)據(jù)管理流程(規(guī)劃、爬取、清洗、管理、分析和歸檔)。學科領域數(shù)據(jù)包括生物多樣性(植物、動物和菌物)、地學領域(地理和地質(zhì))、航空航天和經(jīng)濟產(chǎn)業(yè)領域的咨詢。
中國—東盟環(huán)境信息共享平臺建設咨詢:指導平臺設計的框架和主要功能,并對東盟各國的數(shù)據(jù)源進行遴選和整理,動態(tài)跟蹤分析環(huán)境輿情。
中國工程科技知識中心專業(yè)知識服務系統(tǒng)建設和運營咨詢:面向中國工程科技知識中心下的戰(zhàn)略性新興產(chǎn)業(yè)專業(yè)知識服務系統(tǒng)和航天工程專業(yè)知識服務系統(tǒng)的建設和指導工作,對科學數(shù)據(jù)的來源、處理、整合、關聯(lián)、分析揭示等方面提供長期咨詢支撐服務。
聯(lián)系人:許麗媛
聯(lián)系電話:010-82626611
聯(lián)系郵箱:xuly@mail.las.ac.cn