-
當前位置:首頁 > 創(chuàng)意學院 > 技術 > 專題列表 > 正文
關鍵詞提取技術的目前現(xiàn)狀(關鍵詞提取技術的目前現(xiàn)狀和趨勢)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于關鍵詞提取技術的目前現(xiàn)狀的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務客戶遍布全球各地,如需了解SEO相關業(yè)務請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、人工提取關鍵詞與計算機提取關鍵詞有什么不同?
人工提取關鍵詞更加靈活多變,而計算機提取關鍵詞比較死板,是根據(jù)一定規(guī)律來提取的。
二、論文中的關鍵詞怎么提取
關鍵詞是對文章核心內(nèi)容的強調和突出,一般選取關鍵詞可以從以下兩個方向去著手。一是從文章的題目、摘要、各級標題和正文反復強調的內(nèi)容中選取。二是從文章的研究背景、研究對象、研究問題、核心研究內(nèi)容、研究目的、研究視角理論、研究方法、核心研究結論等等中選取。
什么是關鍵詞:關鍵詞是從論文題目、摘要和正文選擇中選擇最能表達出論文主題特色的專業(yè)名詞術語。
使用關鍵詞的目的:關鍵詞的標引是便于了解論文的主要內(nèi)容,是標引人員選擇主題詞、建立數(shù)據(jù)庫和文獻檢索的依據(jù)。關鍵詞的正確使用是便于讀者進行檢索和引用、保證學術成果傳播的重要內(nèi)容,因此本文將談談學術論文寫作如何選取關鍵詞。關鍵詞是為了用于數(shù)據(jù)庫對文章進行整理歸檔和后來學者進行檢索和篩選。當我們在檢索文獻時,最先看到的是完整的論文標題、摘要和關鍵詞,是不需要購買數(shù)據(jù)庫訪問權限下就可以獲取的信息。其主要目的對于讀者來說就是為了方便讀者進行檢索和篩選。讀者可以通過閱讀論文標題、摘要和關鍵詞決定要不要下載全文進行閱讀和引用。
三、數(shù)學建模論文中的關鍵詞怎樣提取?
正確選取和標引關鍵詞,既有利于論文被檢索,也有利于擴大該成果的利用率,其作用不可小覷。那么如何提取,請看以下總結。
一、化學分子式不可作關鍵詞,而應用化學名稱
如應用“氯化鈉”,而不可用“Nacl”。通??s寫詞也不可作關鍵詞,“HBsAg”應標引為“乙型肝炎病毒表面抗原”,但已普遍使用的縮寫詞除外,如DNA、CT等。
切忌隨便縮寫關鍵詞,比如,將再生障礙性貧血寫作“再障”,將肺源性心臟病寫作“肺心病”,將肩關節(jié)周圍炎寫作“肩周炎”等,都是不符合名詞術語規(guī)范的。還有的使用藥品的商品名,如“都可喜”“胃復安”等也是不符合規(guī)范的。
二、不宜用過長的句子成分來代替關鍵詞
關鍵詞之間固然可相互組配,但詞與詞之間大多是孤立的,語法上無關聯(lián)。因此用過長的句子成分來代替關鍵詞是不宜的,也不符合盡量用規(guī)范的檢索語言來標引關鍵詞的原則。
在醫(yī)學論文中不應將諸如“眼眶良性淋巴組織增生性疾病”“肝炎后肝硬化”等作為關鍵詞,而應把它們分別改為“淋巴組織增生病;眼眶”“慢性肝炎;肝硬化”。
三、選好首標詞
首標詞是表達文章主題最核心的關鍵詞,它是數(shù)個關鍵詞第一個標引的詞,它的選擇是否準確,直接關系到關鍵詞標引的質量和影響到醫(yī)學文獻檢索的速度和準確度。如果認為選取關鍵詞只要選全就可以是不妥的,選詞排序應有主有次,主次明確。
醫(yī)學論文標題是高度概括精煉而成,通常包含研究目的、研究對象、實驗方法和技術。標題中的專業(yè)詞匯在很大程度上概括了主題的含義,所以首先可以考慮從標題中選取首標詞。
當論文篇名中的概念寫得過大或過小時,首標詞的選取就不能局限在標題的范圍內(nèi),應進一步在論文的摘要中選擇。
醫(yī)學論文在標引數(shù)個關鍵詞時,因標題中經(jīng)常將研究對象或實驗(手術)方法排列在前,故以研究對象、實驗方法和診斷與治療手段作首標詞的較多見,這是錯誤的。
例如,“兒童過敏性紫癜108例臨床分析”一文的首標詞應為“過敏性紫癜”,而不應為“兒童”;“超聲中頻電療法治療顳下頜關節(jié)病的療效觀察”一文的首標詞應為“顳下頜關節(jié)病”,而不應為“超聲療法”。
四、詞性宜實不宜虛
關鍵詞的標引從詞語的意義上講,應該是具體、實在的。應盡量避免用抽象、空洞的詞來做關鍵詞,因為缺乏針對性的標引是無效標引。
例如“外科治療小兒先天性髖脫位的手術指征”的關鍵詞:先天性髖脫位、小兒、外科治療、手術指征,“外科治療”和“手術指征”均為無實質性內(nèi)容的關鍵詞,應刪去,補充一個具體手術方法“髖臼成形術”做關鍵詞。
再比如,“產(chǎn)科急癥子宮切除29例臨床分析”關鍵詞:產(chǎn)科、急癥子宮切除、并發(fā)癥、臨床分析,正確標引應改為“胎盤粘連、宮縮乏力、子宮破裂”(病因),“產(chǎn)后出血”(結果),“子宮全切術”(手術方式)。
五、專指性規(guī)則
一個關鍵詞最好只表達一個主題概念,這樣不容易產(chǎn)生歧義。例如,“癌前病變”這一詞組就不適合作為關鍵詞,因為它不具備專指性。
我們知道,“肝硬化”是肝癌的癌前病變,“慢性萎縮性胃炎”是胃癌的癌前病變,“乳腺纖維性增生”是乳癌的癌前病變,“潰瘍性結腸炎”是腸癌的癌前病變。僅標一個“癌前病變”,不清楚到底指的是哪一種癌癥。
關鍵詞在論文標題中的出現(xiàn)率一般在85%以上,在摘要中的出現(xiàn)率為90%,只有10%~15%的關鍵詞從正文中選標。最成功的關鍵詞標引,是這組關鍵詞包括了該篇文章的全部信息,至少應準確表達文章的中心內(nèi)容和研究主題。
但不容樂觀的是,很多人圖省事兒,不進行全文閱讀和主題分析,僅根據(jù)文題草率選擇幾個詞充作關鍵詞。筆者的體會是,選取和標引關鍵詞,要以全文為依據(jù),以結論和摘要為重點,以標題為首選,避免誤標、漏標和復標的情況發(fā)生。
投稿作者可登陸http://www.ncbi.nlm.nih.gov/mesh網(wǎng)站從美國國立醫(yī)學圖書館的MeSH數(shù)據(jù)庫中選取關鍵詞,其中文譯名可參照中國醫(yī)學科學院信息研究所編譯的《醫(yī)學主題詞注釋字順表》。
四、情感解析技術現(xiàn)在能做到什么?
情感解析技術實質上也就是人工智能中的自然語言處理技術中的一種。
也許前兩年我還很難回答你這個問題,不過隨著機器學習技術、硬件迭代等因素這兩年人工智能得到了極大的發(fā)展,自然語言處理也就有了越來越多地實用價值。
在正式回答你的問題之前,我們先要明白,作為人工智能技術基礎的機器學習,其最重要的就是需要有充分大的樣本數(shù)據(jù)進行訓練,即需要先給機器一些已知“情感”的語言數(shù)據(jù),才可以獲取最終的解析引擎。這一點尤為重要,因為這決定了能產(chǎn)生使用價值的領域一定存在著易獲取、易分析的語言數(shù)據(jù)才行。當然同時又要對顧客/消費者的情感反饋有著積極地需求。
以這兩個為條件,那么結果顯而易見了:
1、對話機器人。諸如微軟小冰、蘋果siri等。非常容易理解,因為“對話”本身就是語言數(shù)據(jù)之間的溝通,而情感數(shù)據(jù)作為從語言數(shù)據(jù)中提煉出來的附加價值信息,對智能對話機器人的“人性化”來說當然是有百利而無一弊。而且,對于這些大企業(yè)來說,巨量的語言數(shù)據(jù)也相當容易獲取。
3、情緒客服質檢。這是一個很容易被忽略的行業(yè),但是確實人工智能情感解析最直接最有效的應用之一。試想一下,客服質檢需要做的是什么工作:判斷客服人員工作是否到位……傳統(tǒng)的客服質檢只能通過堆疊人力的方式,主觀、抽樣判斷。而現(xiàn)有的所謂“客服質檢”系統(tǒng)也只不過是關鍵詞提取、匹配,根本不是質檢。但是情緒解析的出現(xiàn)徹底改變了這一狀況,其實也不難理解,因為判斷客服工作最直接的指標不就是顧客的“滿意程度”嘛,而通過情緒解析獲取的顧客通話或文本輸入中的“情感狀態(tài)及變化趨勢”不就滿足了這一條件。唯一的一個問題就是這需要很強的情緒解析實踐能力,對準確率和技術基礎有著很高的要求,故目前為止也只有很少幾家諸如語憶科技等提供商才有這樣的技術。但事實上,客服質檢一定會是最需要情緒解析的細分行業(yè)之一。
2、各種評論分析。這點也不難理解,在當今電商消費已經(jīng)變成主流的網(wǎng)絡時代,電商上會產(chǎn)生海量的評論數(shù)據(jù)。在以前,由于評論量不多,且是非結構化數(shù)據(jù),文本處理能力又有限,導致品牌方們很難從中獲取有用的信息,從而有巨量的評論數(shù)據(jù)被浪費。但是如今已經(jīng)不一樣了,像以上所提到的一些優(yōu)秀的引擎提供商,不僅可以從評論中提取關鍵詞、還能通過情緒解析明白用戶的滿意程度。一些上文提到的供應商有的還能做到對特定關鍵詞的觀點提取。這些都能幫助甲方從評論中挖掘非常有價值的消費者洞察。不難想象,一旦技術成熟,像評論一樣的非結構化數(shù)據(jù)作為用戶想法的直接傳遞,其價值將會遠超那些“瀏覽量”“互動率”等結構化數(shù)據(jù)……
……
除此之外,還有如書籍分析歸類、教育輔導優(yōu)化、歌詞臺詞總結等等很多應用場景,只不過有些商業(yè)價值不明顯的領域仍然需要大膽的創(chuàng)新者去研究和開拓。不過無論如何,在這個人工智能興起的時代,情緒解析仍處于朝陽時代,還具備著極大的潛力等待被挖掘~
以上就是關于關鍵詞提取技術的目前現(xiàn)狀相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
瀏覽器被禁止安裝應用權限怎么改(瀏覽器被禁止安裝應用權限怎么改不了)