-
當前位置:首頁 > 創(chuàng)意學院 > 技術 > 專題列表 > 正文
元數據的定義是什么
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于元數據的定義是什么的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關鍵詞,就能返回你想要的內容,越精準,寫出的就越詳細,有微信小程序端、在線網頁版、PC客戶端
創(chuàng)意嶺作為行業(yè)內優(yōu)秀的企業(yè),服務客戶遍布全球各地,如需了解SEO相關業(yè)務請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、什么是元數據?(metadata)
元數據,就是描述數據的數據。好,本章完,請期待下一篇文章。
有時候我們經常能在CDISC文件中看到metadata,翻譯過來就是“元數據,源數據”,我感覺好像都可以,而且還偏向于“源數據”,源頭嘛,最原始的數據。但是了解過后,發(fā)現還是“元數據”可能更合適。
那么如何理解呢?請先看下面這一組數據:
09/02/21
這一組數據我相信大部分人都認為是日期,但是這是2021年9月2號還是2021年2月9號或者是09年2月21號呢?都有可能,放在不同國家,讀法不一樣,得出來的日期就不一樣。實際上我們根本不知道這些數據的具體含義,因為我們不知道這個日期遵循的格式標準是什么。
所以,為了使上面的日期含義變得明確,就需要對這三組數字進行描述,像下面這樣
這個描述就成為元數據,可以看到,這個描述對你的數據至關重要,它能保證別人看到你的數據后,知道是怎么回事,作用是什么,所以,元數據一般被稱為“數據的數據?!?/p>
CDISC已經為研究所需的數據(應采集的數據和對數據的描述或元數據)制定了標準,CDISC有兩類基礎標準:
一類是規(guī)定內容、數據、元數據和術語的標準,這就是define文件的作用,以前是提交define.pdf文件就好了,但現在隨著技術的發(fā)展,于是又出現了另一種標準,也就是第二類標準。
二類是數據操作模型(ODM)的傳輸標準,傳輸標準利用XML技術來傳輸數據,所以我們經常能看到CDISC文件中提到的define.xml。
不過最重要的還是要了解什么是元數據,也就是metadata,這樣就不會在看IG的時候被這些詞匯弄的糊里糊涂了。
-----------------------------------------
想知道大家的作息時間,像我的話一般10:30就睡了,然后每天差不多8個小時左右的睡眠,但是白天還是困成狗,這是為什么呢?是因為8小時定律給我造成的心里影響嗎?
但是有時候我明明睡了比8小時還久,還是沒有精神,所以我只能歸于是工作給我造成的影響,所以,人生之一大幸事就是找到自己喜歡并且熱愛的工作,在元氣滿滿中順便把錢掙了,而我們現在只是為了工作而工作(這也是人類必須經受的一個考驗吧)。
想想父母從以前那么艱苦的環(huán)境下一步步把我們拉扯大,真的很好奇她們是怎么挺過來的,是我們年青一代變得嬌氣了、弱不禁風了?我想其中一個原因就是以前他們信息閉塞,即使外面的人花天酒地她們也不知道,所以也沒有什么怨氣,所有的信息都是看著周圍人怎么樣,大家都過得不好,那就這樣一天是一天唄。
但是現在不一樣了,每每看到那些貪官貪污了多少錢,我去,我都會在腦海里想象這么多錢能不能把我的出租屋塞滿?然后想象床上都是錢,自己躺在錢海里,遨游,遨游.......
二、什么是元數據?它的作用及應用是什么?
元數據是對數據資源的描述,英文名稱是“Metadata”,通常被解釋為data about data,即關于數據的數據。元數據是信息共享和交換的基礎和前提,用于描述數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特征。隨著信息技術不斷發(fā)展,以及人們對信息共享的迫切需求,元數據技術被應用于更多的領域,如:在圖書館與信息界,元數據被定為提供關于信息資源或數據的一種結構化的數據,是對信息資源的結構化的描述;在數據倉庫領域中,元數據被 被定義為描述數據及其環(huán)境的數據;在軟件構造領域,元數據被定義為在程序中不是被加工的對象,而是通過其值的改變來改變程序的行為的數據。
三、【第一節(jié)】元數據概念及其作用
按照傳統(tǒng)的定義,元數據(Metadata)是關于數據的數據,任何文件系統(tǒng)中的數據都分數據與元數據,數據是指普通文件中的實際數據,而元數據指用來描述一個文件的特征的系統(tǒng)數據,諸如訪問權限、文件擁有者以及文件數據塊的分布信息(inode...)等等。在集群文件系統(tǒng)中,分布信息包括文件在磁盤上的位置以及磁盤在集群中的位置。用戶需要操作一個文件必須首先得到它的元數據,才能定位到文件的位置并且得到文件的內容或相關屬性。
比如:我們要訪問linux上一個文件,我們是不是要知道這個文件的路徑,文件名?如下圖:
從上面圖可以看到,我們我們訪問一個路徑 /home/hadoop/test
那么這個路徑就是這個目錄的一個元數據信息,當然目錄下面有三個文件,每個文件對應的權限rw,屬于哪個用戶,組,每個文件大小,創(chuàng)建時間,文件名這些都是這個目錄的元數據,而我們真實的數據就是在da.log,deal.py里的數據如下圖:
如果我們想知道上面這些表里要查詢數據,是不是需要寫sql:
select * from tb_ky
那么這樣查出來的數據就是保存在此表的真實數據
這張表的元數據也顯然可見,那就是
表名,表所在的庫,表中的字段名,字段類型,長度,是否為空,用的什么引摯,編碼等。
其實說為什么要用元數據,就是元數據能給我們帶來哪些作用,這樣的問題網上答案太多了,不同的行業(yè)有不同的觀點,就我們從大數據數據倉庫來說吧,一般的公司做數倉時,都會多層架構的搭建,比如普遍的 ODS,DWD DWE DM等這樣三四層的結構,那么上一層的數據要依賴與下層,這就可以看到我們的數據從最低層到最高層的有向流動。那么我們元數據就可以做下面的事了:
四、十六、什么是元數據?
謝海洋 王素娟 元數據,英文拼寫為Metadata,目前已被廣泛應用于各種信息資源的管理領域中。在檔案界,最早使用“元數據”的是美國的電子文件管理專家戴維?比爾曼,他在20世紀90年代初發(fā)表的有關電子文件管理方面的論文中首先使用了元數據這一術語。 元數據的概念目前在檔案界還沒有一個統(tǒng)一的定論,目前比較有代表性的描述有: 1.元數據是“關于數據的數據(Data about Data)”,其中,后一個Data是指被描述的信息資源,前一個Data則是指為理解該信息資源而存儲的有關信息,即元數據。這是元數據目前公認最為經典、通俗和簡潔的定義。 2.國際檔案理事會《電子文件管理指南》(1997)認為“元數據是關于文件的背景信息和結構的數據,是有關電子文件的技術性信息。” 3.《澳大利亞聯邦機構電子文件保管元數據標準》(1999)認為“文件保管元數據是關于電子文件背景的描述信息?!?4.英國國家檔案館《電子文件管理指南》(1999)認為“元數據是關于文件和文件集合的背景及其相互關系的結構化描述和編目數據?!?5.馮惠玲主編的《電子文件管理教程》認為元數據是“由電子文件系統(tǒng)自動記錄的關于文件形成時間、地點、人員、活動、文件系統(tǒng)、結構及內容方面的具體數據。” 6.“元數據可以理解為用來描述資源的屬性與特征的信息。”-劉家真《電子文件管理理論與實踐》,科學出版社2003年版。 7.“元數據是對數據對象規(guī)范描述所形成的數據集合,通過計算機可讀的開放語言來標記元數據,就能在系統(tǒng)間發(fā)現、交換、轉換和理解相應的數字對象,支持系統(tǒng)間互操作?!保瓘垥粤帧堕_放元數據機制:理念與原則》,《中國圖書館學報》2003年3期。 以上描述雖然表述各不相同,但我們可以發(fā)現一個共同點,即元數據主要是動態(tài)地描述電子文檔各種特征的信息數據集合,并且它能為分散的、由多種數字化資源有機構成的檔案信息體系提供整合的工具與紐帶。隨著研究的深入,我們對元數據的認識在逐步深化。 檔案工作人員為便于理解,可以簡單把電子文檔的元數據視為兩方面:一是“著錄信息或著錄數據”。其中,“元數據元素就是著錄項目,元數據格式就是著錄項目之間關系的結構化表示,元數據編碼就是著錄信息的編制?!保▌⒃侥稀秾﹄娮游募芾碓獢祿脑僬J識》,《檔案學通訊》2005年2期);二是電子文檔的內容、背景和結構等方面的信息。 國外學者將元數據喻為電子文件管理系統(tǒng)中的“血液”,足見元數據在數字檔案館電子文件管理中發(fā)揮著舉足輕重的作用。元數據的作用主要可以概括為以下幾方面: 1.元數據能協(xié)助數字檔案館構建信息檢索機制。元數據具有動態(tài)跟蹤功能,能夠即時動態(tài)地獲取電子文件管理的各項信息。在數字檔案館的海量信息庫中,借助元數據,可以快速發(fā)現并獲取特定的信息單元。 2.元數據能維護信息的識別與讀取。電子文件所攜帶的元數據信息可以完整地記錄電子文件的原始狀態(tài),能夠系統(tǒng)地映射出電子文件的信息內容、背景和結構等;還能夠映射出電子文件的生成環(huán)境和行政管理環(huán)境。只有在獲取數據對象的同時也獲取這些元數據信息,被檢索到的數據單元才是可理解的、可讀的。 3.元數據能保障電子文件的真實性與憑證性。元數據系統(tǒng)能夠跟蹤記錄電子文件從產生那一刻起的載體、設備及所用技術的變遷史以及使用干預該文件的整個歷史過程,即不論載體、設備、技術如何更新換代,不論使用者、使用人數的多少都全部作為歷史數據保存下來,記錄備案。這些為數字信息單元真實性和憑證性提供了重要的佐證。
以上就是關于元數據的定義是什么相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內容。
推薦閱讀: