-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 營銷推廣 > 專題列表 > 正文
文本關(guān)鍵詞提?。ㄎ谋娟P(guān)鍵詞提取算法)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于文本關(guān)鍵詞提取的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器
問友Ai官網(wǎng):https://ai.de1919.com。
本文目錄:
論文中的關(guān)鍵詞怎么提取
關(guān)鍵詞是對文章核心內(nèi)容的強(qiáng)調(diào)和突出,一般選取關(guān)鍵詞可以從以下兩個方向去著手。一是從文章的題目、摘要、各級標(biāo)題和正文反復(fù)強(qiáng)調(diào)的內(nèi)容中選取。二是從文章的研究背景、研究對象、研究問題、核心研究內(nèi)容、研究目的、研究視角理論、研究方法、核心研究結(jié)論等等中選取。
什么是關(guān)鍵詞:關(guān)鍵詞是從論文題目、摘要和正文選擇中選擇最能表達(dá)出論文主題特色的專業(yè)名詞術(shù)語。
使用關(guān)鍵詞的目的:關(guān)鍵詞的標(biāo)引是便于了解論文的主要內(nèi)容,是標(biāo)引人員選擇主題詞、建立數(shù)據(jù)庫和文獻(xiàn)檢索的依據(jù)。關(guān)鍵詞的正確使用是便于讀者進(jìn)行檢索和引用、保證學(xué)術(shù)成果傳播的重要內(nèi)容,因此本文將談?wù)剬W(xué)術(shù)論文寫作如何選取關(guān)鍵詞。關(guān)鍵詞是為了用于數(shù)據(jù)庫對文章進(jìn)行整理歸檔和后來學(xué)者進(jìn)行檢索和篩選。當(dāng)我們在檢索文獻(xiàn)時,最先看到的是完整的論文標(biāo)題、摘要和關(guān)鍵詞,是不需要購買數(shù)據(jù)庫訪問權(quán)限下就可以獲取的信息。其主要目的對于讀者來說就是為了方便讀者進(jìn)行檢索和篩選。讀者可以通過閱讀論文標(biāo)題、摘要和關(guān)鍵詞決定要不要下載全文進(jìn)行閱讀和引用。
提取關(guān)鍵詞的方法
方法是:概括-分層-提取
一.概括:概括文章內(nèi)容的主旨大意,將文章進(jìn)行劃分,使其結(jié)構(gòu)清晰,提煉核心思想。
二.分層:根據(jù)概括所得,進(jìn)行分層,找出中心句。中心句起到承上啟下及總覽全文的作用,承接上文,為下文的內(nèi)容做鋪墊,渲染氛圍,烘托情緒,深化中心,升華主旨。
三.提取:抓住中心句的主要信息,探究其本質(zhì),進(jìn)行關(guān)鍵詞提取。
相關(guān)例子:
經(jīng)濟(jì)保持中高速增長,在提高發(fā)展平衡性、包容性、可持續(xù)性的基礎(chǔ)上,到二〇二〇年國內(nèi)生產(chǎn)總值和城鄉(xiāng)居民人均收入比二〇一〇年翻一番,產(chǎn)業(yè)邁向中高端水平,消費對經(jīng)濟(jì)增長貢獻(xiàn)明顯加大,戶籍人口城鎮(zhèn)化率加快提高。農(nóng)業(yè)現(xiàn)代化取得明顯進(jìn)展,人民生活水平和質(zhì)量普遍提高,我國現(xiàn)行標(biāo)準(zhǔn)下農(nóng)村貧困人口實現(xiàn)脫貧,貧困縣全部摘帽,解決區(qū)域性整體貧困。國民素質(zhì)和社會文明程度顯著提高。生態(tài)環(huán)境質(zhì)量總體改善。各方面制度更加成熟更加定型,國家治理體系和治理能力現(xiàn)代化取得重大進(jìn)展。
關(guān)鍵詞:城鎮(zhèn)化,脫貧,現(xiàn)代化
論文中的關(guān)鍵詞怎么提取
關(guān)于論文的關(guān)鍵詞的提取按以下方法提?。?span style="display:none">AfD創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司
1.論文的關(guān)鍵詞數(shù)量在3-8個,位于“提要”的左下方。為了滿足文獻(xiàn)標(biāo)引或檢索工作的要求,關(guān)鍵詞的選取具有一定的規(guī)范性。它包括主題詞和自由詞2個部分。
主題詞是專門為文獻(xiàn)的標(biāo)引或檢索而從自然語言的主要詞匯中挑選出來并加以規(guī)范了的詞或詞組;自由詞則是未規(guī)范化的即還未收入主題詞表中的詞或詞組。在確定主題詞時,要對論文進(jìn)行主題分析,依照標(biāo)引和組配規(guī)則轉(zhuǎn)換成主題詞表中的規(guī)范詞語。
2.論文的標(biāo)題通常開門見山,直接說明了論文所敘述的內(nèi)容,所以截取標(biāo)題中的一個或幾個中心詞可以直接作為論文關(guān)鍵詞。比如“老年人用藥安全性及原則”就可以提取出“老年人”、“合理用藥”等關(guān)鍵詞。
3.一篇論文中出現(xiàn)頻率最高的詞絕大多數(shù)的時候都可以直接拿來做關(guān)鍵詞。但要注意的是,因為論文字?jǐn)?shù)多,信息量大,有時候高頻詞較多。這時要注意篩選,抓住主要矛盾??梢詫Ω哳l詞進(jìn)行一個大致的排序,選取前幾位。同時在關(guān)鍵詞排列的時候也要根據(jù)與論文的相關(guān)性依次排列。
關(guān)鍵詞怎么提取
在巨量的信息面前,很多信息是我們無法全面接收,因此我們需要從中篩選出一些我們感興趣的或者有代表性的信息進(jìn)行接收。那么這一個過程就是關(guān)鍵詞提取技術(shù)。如果我們可以準(zhǔn)確的將所有的文檔都用幾個簡單的關(guān)鍵詞描述,那么我們便可以通過關(guān)鍵詞了解一篇文章的內(nèi)容,這將會提高信息獲取到效率。想要在海量的信息里提取出我們所需要的信息,就需要學(xué)會如何提取關(guān)鍵詞。
一,TF-IDF算法(Term Frequency-Inverse Document Frequency,詞頻-逆文檔頻次算法)是一種基于統(tǒng)計的計算方法,常用于評估在一個文檔集中一個詞對某份文檔的重要程度。這種思想是符合關(guān)鍵詞抽取的需求,一個詞語對文檔越重要,那么是關(guān)鍵詞的概率就越大,所以通常將TF-IDF算法應(yīng)用在關(guān)鍵詞提取中。
二,在上述的TF-IDF算法中,都需要基于一個現(xiàn)成的語料庫,主題模型的關(guān)鍵詞提取算法則是需要通過對大規(guī)模文檔學(xué)習(xí),發(fā)現(xiàn)文檔的隱含主題。
三,而TextRank算法則是可以脫離語料庫的基礎(chǔ),僅對單篇文檔進(jìn)行分析就可以提取該文檔的關(guān)鍵詞。這也是TextRank算法的重要特點。TextRank算法的基本思想源于Google的PageRank算法。因此這里需要先了解下PageRank算法。
以上就是關(guān)于文本關(guān)鍵詞提取相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
居家庭院景觀設(shè)計說明范文(私家庭院景觀設(shè)計文本)
美溪包裝設(shè)計公司哪家好(美溪包裝設(shè)計公司哪家好一點)