-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 營(yíng)銷推廣 > 專題列表 > 正文
python自動(dòng)生成作文(python自動(dòng)寫作文)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于python自動(dòng)生成作文的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來(lái)看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁(yè)版、PC客戶端和批量生成器
問友Ai官網(wǎng):https://ai.de1919.com。
本文目錄:
python將指定文本中的字符串替換后,生成新的文本文件。
Python替換某個(gè)文本中的字符串,然后生成新的文本文檔,代碼如下:
import?osos.chdir('D:\')???????#?跳到D盤
if?not?os.path.exists('test1.txt'):?#?看一下這個(gè)文件是否存在
exit(-1)?????????????????????????#不存在就退出
lines?=?open('test1.txt').readlines()??#打開文件,讀入每一行
fp?=?open(''test2.txt','w')??#打開你要寫得文件test2.txt
for?s?in?lines:
#?replace是替換,write是寫入
fp.write(?s.replace('love','hate').replace('yes','no'))????
fp.close()??#?關(guān)閉文件
如何用Python玩轉(zhuǎn)TF-IDF之尋找相似文章并生成摘要
應(yīng)用1:關(guān)鍵詞自動(dòng)生成
核心思想是對(duì)于某個(gè)文檔中的某個(gè)詞,計(jì)算其在這個(gè)文檔中的標(biāo)準(zhǔn)化TF值,然后計(jì)算這個(gè)詞在整個(gè)語(yǔ)料庫(kù)中的標(biāo)準(zhǔn)化IDF值。在這里,標(biāo)準(zhǔn)化是說對(duì)原始的計(jì)算公式進(jìn)行了一些變換以取得更好的衡量效果,并避免某些極端情況的出現(xiàn)。這個(gè)詞的TF-IDF值便等于TF*IDF。對(duì)于這個(gè)文檔中的所有詞計(jì)算它們的TF-IDF值,并按照由高到低的順序進(jìn)行排序,由此我們便可以提取我們想要的數(shù)量的關(guān)鍵詞。
TF-IDF的優(yōu)點(diǎn)是快捷迅速,結(jié)果相對(duì)來(lái)說比較符合實(shí)際情況。缺點(diǎn)是當(dāng)一篇文檔中的兩個(gè)詞的IDF值相同的時(shí)候,出現(xiàn)次數(shù)少的那個(gè)詞有可能更為重要。再者,TF-IDF算法無(wú)法體現(xiàn)我詞的位置信息,出現(xiàn)位置靠前的詞與出現(xiàn)位置靠后的詞,都被視為重要性相同,這是不正確的。存在的解決辦法是對(duì)文章的第一段和每段的第一句話給予比較大的權(quán)重。
應(yīng)用2:計(jì)算文本相似度
明白了對(duì)于每個(gè)詞,如何計(jì)算它的TF-IDF值。那么計(jì)算文本相似度也輕而易舉。我們已經(jīng)計(jì)算了文章中每個(gè)詞的TF-IDF值,那么我們便可以將文章表征為詞的TF-IDF數(shù)值向量。要計(jì)算兩個(gè)文本的相似度,只需要計(jì)算余弦即可,余弦值越大,兩個(gè)文本便越相似。
應(yīng)用3:自動(dòng)摘要
2007年,美國(guó)學(xué)者的論文<A Survey on Automatic Text Summarization>總結(jié)了目前的自動(dòng)摘要算法,其中很重要的一種就是詞頻統(tǒng)計(jì)。這種方法最早出自1958年IBM公司一位科學(xué)家的論文<The Automatic Creation of Literature Abstracts>。這位科學(xué)家認(rèn)為,文章的信息都包含在句子中,有的句子包含的信息多,有的句子包含的信息少。自動(dòng)摘要就是找出那些包含信息最多的句子。那么句子的信息量怎么衡量呢?論文中采用了關(guān)鍵詞來(lái)衡量。如果包含的關(guān)鍵詞越多,就說明這個(gè)句子越重要,這位科學(xué)家提出用Cluster的來(lái)表示關(guān)鍵詞的聚集。所謂簇,就是包含多個(gè)關(guān)鍵詞的句子片段。
以第一個(gè)圖為例,其中的cluster一共有7個(gè)詞,其中4個(gè)是關(guān)鍵詞。因此它的重要性分值就等于(4*4)/7=2.3。然后,找出包含cluster重要性分值最高的句子(比如5句),把它們合在一起,就構(gòu)成了這篇文章的自動(dòng)摘要。具體實(shí)現(xiàn)可以參見<Mining the Social Web: Analyzing Data from Facebook, Twitter, LinkedIn, and Other Social Media Sites>(O'Reilly, 2011)一書的第8章,Python代碼見github。這種算法后來(lái)被簡(jiǎn)化,不再區(qū)分cluster,只考慮句子包含的關(guān)鍵詞。偽代碼如下。
Summarizer(originalText, maxSummarySize):// 計(jì)算文本的詞頻,生成一個(gè)列表,比如[(10,'the'), (3,'language'), (8,'code')...]
wordFrequences = getWordCounts(originalText)
// 過濾掉停用詞,列表變成[(3, 'language'), (8, 'code')...]
contentWordFrequences = filtStopWords(wordFrequences)
// 按照詞頻的大小進(jìn)行排序,形成的列表為['code', 'language'...]
contentWordsSortbyFreq = sortByFreqThenDropFreq(contentWordFrequences)
// 將文章分成句子
sentences = getSentences(originalText)
// 選擇關(guān)鍵詞首先出現(xiàn)的句子
setSummarySentences = {}
foreach word in contentWordsSortbyFreq:
firstMatchingSentence = search(sentences, word)
setSummarySentences.add(firstMatchingSentence)
if setSummarySentences.size() = maxSummarySize:
break
// 將選中的句子按照出現(xiàn)順序,組成摘要
summary = ""
foreach sentence in sentences:
if sentence in setSummarySentences:
summary = summary + " " + sentence
return summary
類似的算法已經(jīng)被寫成了工具,比如基于Java的Classifier4J庫(kù)的SimpleSummariser模塊、基于C語(yǔ)言的OTS庫(kù)、以及基于classifier4J的C#實(shí)現(xiàn)和python實(shí)現(xiàn)。
Python 程序有什么好的自動(dòng)從注釋生成文檔的方法
用Sphinx以win32系統(tǒng)為例,最簡(jiǎn)單的安裝方式是在Dos下輸入如下代碼
pip install -U sphinx
安裝好了之后,用最簡(jiǎn)單的半自動(dòng)生成API文檔的方式進(jìn)行
例如:你的python安裝在C:python27, 想要給flask包自動(dòng)制作文檔,制作完成的文檔放在C:python_docflask的文件夾
代碼如下:
sphinx-apidoc -F -o C:python_docflask C:python27libsite-packages
(此處-o應(yīng)緊跟輸出文件夾,不然會(huì)產(chǎn)生一個(gè)-F的文件夾,多謝@Hyacz)
然后進(jìn)入C:python_docflask文件夾
cd C:python_docflask
此文件夾下有一個(gè)make.bat文件,再執(zhí)行一下
make html
然后就能在_buildhtml文件夾中看到生成好的文檔了,還支持查找的功能
以上就是關(guān)于python自動(dòng)生成作文相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
shopyy獨(dú)立站(shopyy和shopify的區(qū)別)
python編程網(wǎng)頁(yè)版(python編程網(wǎng)頁(yè)版mac)
四年級(jí)作文優(yōu)秀作文(四年級(jí)優(yōu)秀作文精選)
品牌設(shè)計(jì)設(shè)計(jì)公司(品牌設(shè)計(jì)設(shè)計(jì)公司排名)