-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
文章提取關(guān)鍵詞訓(xùn)練(文章提取關(guān)鍵詞軟件)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于文章提取關(guān)鍵詞訓(xùn)練的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來(lái)看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請(qǐng)撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、如何使用word提取文章中的關(guān)鍵詞
1.點(diǎn)擊word“開始”菜單最右側(cè)的“查找”。
2.出現(xiàn)“查找”對(duì)話框,填寫需要查找的內(nèi)容,點(diǎn)擊“確定”。
3.反復(fù)點(diǎn)擊“查找下一處”,即可在文中依次找到相同的內(nèi)容,也可點(diǎn)擊“閱讀突出提示”下拉菜單中的“全部突出顯示”,將文中所有相同的內(nèi)容突出顯示。
4.需要替換文中內(nèi)容時(shí)候,點(diǎn)擊“開始”菜單最右側(cè)的“替換”,出現(xiàn)“查找和替換”對(duì)話框,依次填寫需要查找的內(nèi)容和需要替換為的內(nèi)容,點(diǎn)擊“全部替換”,文中所有相同的內(nèi)容即可同時(shí)完成替換。
5.若點(diǎn)擊“替換”則每點(diǎn)擊一次,軟件會(huì)替換一次,然后自動(dòng)尋找下一處相同的內(nèi)容,反復(fù)點(diǎn)擊,即可完成對(duì)文檔中所有相同內(nèi)容的替換。
二、語(yǔ)言應(yīng)用題:如何提煉關(guān)鍵詞
首先,對(duì)材料進(jìn)行認(rèn)真閱讀,全面分析,弄清該文段的主要內(nèi)容盡可能多的從題名和正文的主要段落中抽取與主題概念一致的詞或詞組。也就是將文中次要的、修飾性的、解釋性文字刪除,而保留主要的、關(guān)鍵的、實(shí)質(zhì)的詞語(yǔ)。
例如:提取下面一段話的主要信息,在方框內(nèi)寫出三個(gè)關(guān)鍵詞。
今天中國(guó)獨(dú)特而強(qiáng)烈的愛國(guó)主義熱情,直接源于“鴉片戰(zhàn)爭(zhēng)”以來(lái)的民族生存危機(jī)。在開放時(shí)代,中國(guó)與世界的關(guān)系發(fā)生了巨大變化,中國(guó)不但擺脫了民族生存危機(jī),而且成為全球化競(jìng)爭(zhēng)中的最大受益者之一。中國(guó)離不開世界,世界也離不開中國(guó)。這是的愛國(guó)主義應(yīng)當(dāng)注入性的因子和意識(shí)。它不再應(yīng)當(dāng)僅是一種內(nèi)聚型的強(qiáng)烈感情,不應(yīng)當(dāng)是封閉的、種族的、排外的,而應(yīng)當(dāng)具有理性、深沉的意識(shí),即開放的世界觀、積極的進(jìn)取心、普世的價(jià)值觀念。
關(guān)鍵詞:-- -- --答案:開放時(shí)代 愛國(guó)主義 深沉理性
其次,從原文段中提取的詞語(yǔ)可能很多,對(duì)所選的詞語(yǔ)予以排序、挑選,看體哪些詞可以體現(xiàn)中心內(nèi)容,真正做到去粗取精、去偽求真。只有準(zhǔn)確涵蓋材料的整體內(nèi)容,體現(xiàn)材料本質(zhì)特性的詞語(yǔ)才符合要求。
例如:提取下面一段話的主要信息,寫出三個(gè)關(guān)鍵詞。
教育部、公安部國(guó)家安全監(jiān)督管理總局組成檢查組,近日對(duì)河北、河南、遼寧、重慶中小學(xué)安全和管理工作情況進(jìn)行了聯(lián)合檢查,發(fā)現(xiàn)中小學(xué)校安全工作狀況有了很大好轉(zhuǎn),但仍存在一些問題。如學(xué)體育運(yùn)動(dòng)場(chǎng)地普遍緊張,部分農(nóng)村中小學(xué)校辦學(xué)條件困難,學(xué)生食堂、宿舍等設(shè)施條件較差,亟需當(dāng)?shù)卣扇∮行Т胧┘哟笸度胗枰越鉀Q;有的學(xué)校教學(xué)樓或?qū)W生宿舍疏散通道不暢,存在安全隱患;部分學(xué)校食堂尤其是農(nóng)村學(xué)校食堂管理不到位,安全隱患較多。
關(guān)鍵詞:-- -- --答案: 中小學(xué) 安全工作 存在問題
通過(guò)以上分析,我們可以總結(jié)出幾點(diǎn)解題思路,即不妨遵循的三個(gè)基本原則:
第一:整體性原則。所謂整體性即是指答題者所提取的詞語(yǔ)必須包含整個(gè)語(yǔ)段的主旨,避免出現(xiàn)過(guò)寬或過(guò)窄的錯(cuò)誤。而這些涵蓋主要信息的關(guān)鍵詞有無(wú)或是否齊全,將成為評(píng)分的重要依據(jù)。比如下面這段文字:
本報(bào)北京2月23日訊 記者吳兢報(bào)道:由建設(shè)部起草的《建筑節(jié)能管理?xiàng)l例》(征求意見稿)正在互聯(lián)網(wǎng)上向全國(guó)公開征求意見,目前已收到了數(shù)十封電子郵件積極參與討論。該條例要求新建住宅必須執(zhí)行節(jié)能標(biāo)準(zhǔn),并注重使用可再生能源;同時(shí)要求審計(jì)政府辦公樓的耗能情況,并根據(jù)審計(jì)結(jié)果予以整改。
能源趨緊,立法提速。1月1日起,《可再生能源法》及與之配套的9部規(guī)定陸續(xù)施行,相關(guān)的專項(xiàng)資金管理辦法和稅收優(yōu)惠規(guī)定正在制定;1月24日,經(jīng)國(guó)務(wù)院批準(zhǔn),一個(gè)由15家單位組成的《能源法》起草組正式成立,拉開立法序幕;北京等地也將為節(jié)約能源制定地方性法規(guī)……這些法律規(guī)定正在為節(jié)能開道,為新能源保駕。
不難看出這個(gè)語(yǔ)段中的關(guān)鍵信息是:“能源”、“立法”、“提速”,所以我們有理由把它作為關(guān)鍵詞。
第二:代入反饋原則。所謂代入反饋是指把選出的關(guān)鍵詞帶入原文段,看是否與題干要求相符合 ,要點(diǎn)是否齊全,是否字?jǐn)?shù)超限等。考生找到所謂的關(guān)鍵詞僅是其中的一個(gè)環(huán)節(jié),并不意味著找到了正確答案。因?yàn)榇祟愒囶}答案
唯一性,這就要求考生在尋找時(shí)要小心謹(jǐn)慎。再如下面這個(gè)例子:
本報(bào)雅加達(dá)2月4日電 記者管克江報(bào)道:菲律賓首都馬尼拉東部的一家體育館今天早上發(fā)生嚴(yán)重踩踏事故,造成至少88人死亡、340多人受傷 據(jù)此間媒體報(bào)道,約近萬(wàn)名菲律賓群眾4日早上聚集在該體育館門口,等候當(dāng)?shù)匾患译娨暸_(tái)發(fā)放一場(chǎng)電視娛樂節(jié)目的入場(chǎng)券,幸運(yùn)觀眾將可獲得約合1.9萬(wàn)美元的大獎(jiǎng)。 事故發(fā)生后,菲律賓副總統(tǒng)到現(xiàn)場(chǎng)視察,要求軍警加緊救助遇難者。目前警方正對(duì)事故原因進(jìn)行調(diào)查。據(jù)報(bào)道,有關(guān)方面已取消了演出計(jì)劃?!度嗣袢?qǐng)?bào)》 (2006年02月05日 )
閱讀該段文字我們找到了這三個(gè)關(guān)鍵詞;“馬尼拉 ”、“發(fā)生”、“踩塌事故”仔細(xì)分析這三個(gè)詞發(fā)現(xiàn)它們是一個(gè)句子的“主、謂、賓”。 如果把它們稍加連綴,又成為一句話新聞。反饋原文,忠實(shí)原意,彼此印證,準(zhǔn)確無(wú)誤。
第三:數(shù)量達(dá)標(biāo)原則。既然有定詞語(yǔ)數(shù)量的要求,那么超過(guò)這個(gè)限定是要扣分的。試題所限定的詞語(yǔ)數(shù)量通常是參照最佳答案設(shè)定的,對(duì)答題應(yīng)有一定的暗示作用。
第四:次序固定原則。即是考生所選擇的關(guān)鍵詞在填入答案欄時(shí),位置和次序不能顛倒混亂。因?yàn)樗x的詞語(yǔ)按照正確語(yǔ)序應(yīng)是一個(gè)主謂賓單句,如果次序顛倒語(yǔ)意就可能發(fā)生變化,這樣即使所選詞語(yǔ)是正確的,但次序錯(cuò)了,也是要扣分的。
總之,“準(zhǔn)確提取關(guān)鍵詞 ”之所以高考命題者的青睞,是因?yàn)樗梢匀娴臋z測(cè)考生的信息篩選能力、概括能力和語(yǔ)言表達(dá)能力。在今后的高考復(fù)習(xí)中,應(yīng)該引起語(yǔ)文教師的高度重視。
三、如何提取文章的關(guān)鍵詞
文章關(guān)鍵詞一般會(huì)出現(xiàn)在題目,首尾段和段中,在大概了解文章大意后,從首尾段、題目中找出最合適的可以概括文章大意的詞,那么這個(gè)詞就是關(guān)鍵詞
四、用Py做文本分析5:關(guān)鍵詞提取
關(guān)鍵詞指的是原始文檔的和核心信息,關(guān)鍵詞提取在文本聚類、分類、自動(dòng)摘要等領(lǐng)域中有著重要的作用。
針對(duì)一篇語(yǔ)段,在不加人工干預(yù)的情況下提取出其關(guān)鍵詞
無(wú)監(jiān)督學(xué)習(xí)——基于詞頻
思路1:按照詞頻高低進(jìn)行提取
思路2:按照詞條在文檔中的重要性進(jìn)行提取
IF-IDF是信息檢索中最常用的一種文本關(guān)鍵信息表示法,其基本的思想是如果某個(gè)詞在一篇文檔中出現(xiàn)的頻率高,并且在語(yǔ)料庫(kù)中其他文檔中很少出現(xiàn),則認(rèn)為這個(gè)詞具有很好的類別區(qū)分能力。
TF:Term Frequency,衡量一個(gè)term在文檔中出現(xiàn)得有多頻繁。平均而言出現(xiàn)越頻繁的詞,其重要性可能就越高??紤]到文章長(zhǎng)度的差異,需要對(duì)詞頻做標(biāo)準(zhǔn)化:
IDF:Inverse Document Frequency,逆文檔概率,用于模擬在該語(yǔ)料的實(shí)際使用環(huán)境中,目標(biāo)term的重要性。
TF-IDF:TF*IDF
優(yōu)點(diǎn):
(1)jieba
(2)sklearn
(3)gensim
前面介紹的TF-IDF屬于無(wú)監(jiān)督中基于詞頻的算法,TextRank算法是基于圖形的算法。
TextRank算法的思想來(lái)源于PageRank算法:
和基于詞頻的算法相比,TextRank進(jìn)一步考慮了文檔內(nèi)詞條間的語(yǔ)義關(guān)系。
參考資料:
Python數(shù)據(jù)分析--玩轉(zhuǎn)文本挖掘
以上就是關(guān)于文章提取關(guān)鍵詞訓(xùn)練相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
免費(fèi)文章生成器軟件(免費(fèi)文章生成器軟件下載)
文章生成器手機(jī)版app蘋果(文章生成器手機(jī)版app蘋果版)
免費(fèi)b站推廣網(wǎng)站有哪些(免費(fèi)b站推廣網(wǎng)站有哪些視頻)
百度賬號(hào)出售平臺(tái)(百度賬號(hào)出售平臺(tái)反購(gòu)輩)