-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 十大排名 > 專(zhuān)題列表 > 正文
排行榜書(shū)名號(hào)(書(shū)名號(hào) 直排)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于排行榜書(shū)名號(hào)的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。
開(kāi)始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫(xiě)出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶(hù)端
官網(wǎng):https://ai.de1919.com,如需相關(guān)業(yè)務(wù)請(qǐng)撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、九鍵的公怎么打
九鍵怎么打您好!親 1、首先點(diǎn)擊輸入框調(diào)出鍵盤(pán),在彈出的鍵盤(pán)上邊選擇鍵盤(pán)小圖標(biāo),然后選擇拼音九宮格。2、練習(xí)打字,以你們好為例。在拼音鍵左側(cè)是精確的拼音,如果顯示的不是我們需要的字,可選擇正確的拼音?!澳恪笔怯衝i拼音,所以按拼音順序,點(diǎn)擊46。“們”是有men拼音,所以按拼音順序,點(diǎn)擊636。“好”字是有hao拼音,按拼音順序點(diǎn)擊42。3、現(xiàn)在可以看到鍵盤(pán)上方準(zhǔn)確的出現(xiàn)在鍵盤(pán)上方,點(diǎn)擊這三個(gè)文字,就準(zhǔn)確完成了輸入。4、如果聯(lián)想出來(lái)的文字不是需要的文字,可以點(diǎn)擊文字右側(cè)向右書(shū)名號(hào)按鈕。5、可以看到有很多字可以選擇。6、點(diǎn)擊鍵盤(pán)左下角的符字按鈕,可以打開(kāi)符號(hào)鍵盤(pán),有常用到序號(hào)共九種可以選擇。7、點(diǎn)擊左下角的返回可返回九宮格鍵盤(pán)。按鈕“123”可以打開(kāi)數(shù)字鍵盤(pán),123右側(cè)的按鈕為空格鍵,中/英為中文英文切換。

問(wèn)題還沒(méi)解決?快來(lái)咨詢(xún)專(zhuān)業(yè)答主~
九鍵怎么打
在線
2663位答主在線答
服務(wù)保障
專(zhuān)業(yè)
響應(yīng)快
馬上提問(wèn)
40345人對(duì)答主服務(wù)作出評(píng)價(jià)
回答切中要害老師態(tài)度很好回答專(zhuān)業(yè)迅速回答很耐心認(rèn)真大平臺(tái)保障,服務(wù)好回答切中要害老師態(tài)度很好回答專(zhuān)業(yè)迅速回答很耐心認(rèn)真大平臺(tái)保障,服務(wù)好
搶首贊
分享評(píng)論
鍵盤(pán)小鍵盤(pán)-京東電腦辦公排行榜,趕快了解一下!

萌可兒 mini迷你小鍵盤(pán)數(shù)字鍵盤(pán)筆記本外接鍵盤(pán)財(cái)務(wù)會(huì)計(jì)辦公專(zhuān)用女生可愛(ài)2.4G無(wú)線接收器 黑紅混彩
¥79.9 元

萌可兒 mini迷你小鍵盤(pán)數(shù)字鍵盤(pán)筆記本外接鍵盤(pán)財(cái)務(wù)會(huì)計(jì)辦公專(zhuān)用女生可愛(ài)2.4G無(wú)線接收器 藍(lán)色混彩
¥79.9 元

萌可兒 mini迷你小鍵盤(pán)數(shù)字鍵盤(pán)筆記本外接鍵盤(pán)財(cái)務(wù)會(huì)計(jì)辦公專(zhuān)用女生可愛(ài)2.4G無(wú)線接收器 綠色混彩
¥79.9 元

萌可兒 mini迷你小鍵盤(pán)數(shù)字鍵盤(pán)筆記本外接鍵盤(pán)財(cái)務(wù)會(huì)計(jì)辦公專(zhuān)用女生可愛(ài)2.4G無(wú)線接收器 檸檬黃混彩
¥79.9 元

USB小鍵盤(pán)2鍵復(fù)制粘貼ctrl一鍵密碼多組合鍵自定義快捷鍵osu音游改鍵JEQLO 黑色 紅軸
¥52 元
京東廣告
10大鍵盤(pán)排行榜-京東電腦辦公,十大性?xún)r(jià)比排行榜,鉅惠送不停!

櫻桃(CHERRY)STREAM有線鍵盤(pán)輕音辦公商務(wù)家用磨砂質(zhì)感十大功能按鍵鍵盤(pán)黑色
¥189 元

櫻桃(CHERRY)STREAM有線鍵盤(pán)輕音辦公商務(wù)家用磨砂質(zhì)感十大功能按鍵鍵盤(pán)黑色
¥199 元

櫻桃(CHERRY)STREAM有線鍵盤(pán)輕音辦公商務(wù)家用磨砂質(zhì)感十大功能按鍵鍵盤(pán)白色
¥189 元

櫻桃(CHERRY)STREAM有線鍵盤(pán)輕音辦公商務(wù)家用磨砂質(zhì)感十大功能鍵盤(pán)白色
¥199 元

悅磁 真機(jī)械鍵盤(pán)104鍵吃雞電競(jìng)游戲朋克筆記本臺(tái)式電腦通用辦公打字有線發(fā)光背光LOL鍵盤(pán)鼠標(biāo)鍵鼠套裝 黑色混光黑軸-旋鈕朋克版【二十種燈效 電鍍圓鍵】
¥149 元
京東廣告
九鍵怎么打

生活老師小貝
服務(wù)態(tài)度好
您好親親,1、首先點(diǎn)擊輸入框調(diào)出鍵盤(pán),在彈出的鍵盤(pán)上邊選擇鍵盤(pán)小圖標(biāo),然后選擇拼音九宮格。2、練習(xí)打字,以你們好為例。在拼音鍵左側(cè)是精確的拼音,如果顯示的不是我們需要的字,可選擇正確的拼音。3、現(xiàn)在可以看到鍵盤(pán)上方準(zhǔn)確的出現(xiàn)在鍵盤(pán)上方,點(diǎn)擊這三個(gè)文字,就準(zhǔn)確完成了輸入。4、如果聯(lián)想出來(lái)的文字不是需要的文字,可以點(diǎn)擊文字右側(cè)向右書(shū)名號(hào)按鈕。5、可以看到有很多字可以選擇。6、點(diǎn)擊鍵盤(pán)左下角的符字按鈕,可以打開(kāi)符號(hào)鍵盤(pán),有常用到序號(hào)共九種可以選擇。7、點(diǎn)擊左下角的返回可返回九宮格鍵盤(pán)。按鈕“123”可以打開(kāi)數(shù)字鍵盤(pán),123右側(cè)的按鈕為空格鍵,中/英為中文英文切換。
二、求歷屆快樂(lè)女聲、男聲排名
1、2004年超級(jí)女聲:冠軍:安又琪,亞軍:王緹,季軍:張含韻。
2、2005年超級(jí)女聲:冠軍:李宇春,亞軍:周筆暢,季軍:張靚穎。
3、2006年超級(jí)女聲:冠軍:尚雯婕,亞軍:譚維維,季軍:劉力揚(yáng)。
4、2007年快樂(lè)男聲:冠軍:陳楚生,亞軍:蘇醒,季軍:魏晨。
5、2009年快樂(lè)女聲:冠軍:江映蓉,亞軍:李霄云,季軍:黃英。
6、2010年快樂(lè)男聲:冠軍:李煒;亞軍:劉心;季軍:武藝。
7、2011年快樂(lè)女聲:冠軍:段林希,亞軍:洪辰,季軍:劉忻。
8、2013年快樂(lè)男聲:冠軍:華晨宇,亞軍:歐豪,季軍:白舉綱。
9、2016年超級(jí)女聲:冠軍:史兆怡,亞軍:方圓,季軍:張曉鈺。
10、2017年快樂(lè)男聲:冠軍:魏巡,亞軍:養(yǎng)雞,季軍:尹毓恪。
擴(kuò)展資料:
相關(guān)冠軍人物介紹:
1、安又琪
安又琪,中國(guó)內(nèi)地流行樂(lè)女歌手、影視演員,畢業(yè)于北京電影學(xué)院。代表作品:《你好,周杰倫》、《有你陪著我》、《談情說(shuō)愛(ài)》、《因瞰朵》、《Miss安》、《大愛(ài)Crazy Love》等。
2、李宇春
李宇春,中國(guó)流行女歌手、演員、詞曲創(chuàng)作人、演唱會(huì)導(dǎo)演。代表作品:《下個(gè)路口見(jiàn)》、《和你一樣》、《再不瘋狂我們就老了》、《野蠻生長(zhǎng)》等。
3、尚雯婕
尚雯婕,中國(guó)內(nèi)地女歌手、演員、音樂(lè)人。代表作品:《最終信仰》、《Big up》 、《鹿 be free》、《single boy》等。
三、簡(jiǎn)書(shū)用戶(hù)畫(huà)像 之 如何挖掘用戶(hù)的電影喜好
我在 《爬取百萬(wàn)頁(yè)面 分析用戶(hù)畫(huà)像》 中分析了用戶(hù)的書(shū)籍喜好,這里繼續(xù)嘗試通過(guò)影評(píng)文章的抓取、內(nèi)容清洗、影評(píng)句子提取,建立機(jī)器學(xué)習(xí)情緒預(yù)測(cè)模型,挖掘分析用戶(hù)對(duì)流行電影的喜好。
涉及的NLP(自然語(yǔ)言處理)知識(shí)點(diǎn):
涉及的ML(機(jī)器學(xué)習(xí))知識(shí)點(diǎn):
電影的拍攝成本高、票價(jià)也不低,消費(fèi)者投入的關(guān)注度和觀看成本高(最終的投入成本是包括注意力投入、金錢(qián)投入、時(shí)間投入和感情投入)。
簡(jiǎn)單算下觀看一部電影的成本(步驟):先看下預(yù)告內(nèi)容,做下同期上映電影的比較,覺(jué)得導(dǎo)演、演員陣容都不錯(cuò),下定決心要看了,跟男/女友/老婆 /老公/基友/閨密做推薦,推薦成功后去選座買(mǎi)票,觀影當(dāng)天說(shuō)不定還得先吃個(gè)飯,飯后乖乖的在影院呆上90分鐘(關(guān)鍵時(shí)刻還得憋尿),觀影結(jié)束后指不定還得來(lái)個(gè)夜宵、開(kāi)個(gè)房間探討下人生什么的。。。
讀一本書(shū)的成本(步驟):1.打開(kāi)書(shū)/電子閱讀器/手機(jī);2. 讀!
這樣對(duì)比看一部電影比讀一本書(shū)的投入成本高多了!
因此觀眾給出的反饋?zhàn)匀灰脖葧?shū)籍會(huì)強(qiáng)烈一些,特別是滿(mǎn)懷期待看完卻發(fā)現(xiàn)是一部爛片,有種上當(dāng)受騙的感覺(jué)。
因此對(duì)電影光是通過(guò)詞頻作為喜好度是不夠的,用戶(hù)可能反復(fù)的在罵呢。
所以需要引入多一個(gè)分析的因子:情緒。用戶(hù)提及某個(gè)電影時(shí)的情緒是怎么樣的,是積極愉悅、還是負(fù)面憤怒,加上這個(gè)才能有效判定用戶(hù)對(duì)電影或者某個(gè)事物的喜好。
在豆瓣上,用戶(hù)的評(píng)分就是最直接的情緒數(shù)值:5力薦,4推薦,3還行,2較差,1很差。
但在這類(lèi)寫(xiě)作平臺(tái)上,發(fā)布文章時(shí)是沒(méi)有一個(gè)選項(xiàng)來(lái)填寫(xiě)分?jǐn)?shù),也沒(méi)提供選擇心情的選項(xiàng)。
“所言即其所思”,這是普遍人性。每個(gè)用戶(hù)寫(xiě)下的文字表達(dá)想法,在字里行間都會(huì)不經(jīng)意的使用一些情緒用詞來(lái)表達(dá),這些便是我可以獲取的“原始數(shù)據(jù)”。
精準(zhǔn)推薦!用戶(hù)談?wù)摰枚嗟臇|西未必是TA所喜愛(ài)的,也許是TA痛恨的(比如說(shuō)前任)。如果用戶(hù)在自己大力差評(píng)某部電影的文章底部看到另一部相似爛片的推薦,推薦文案還寫(xiě)著“親,我猜你還喜歡看這些”,估計(jì)這用戶(hù)會(huì)有種吃了蒼蠅剛吐出來(lái)發(fā)現(xiàn)迎面又飛來(lái)幾只的感覺(jué)。
通過(guò)用戶(hù)在討論某事物時(shí)上下文的情緒分析,來(lái)判斷對(duì)該事物的喜惡,將預(yù)測(cè)結(jié)果加入對(duì)事物的打分計(jì)算中,最后得出一個(gè)可量化、可計(jì)算的分?jǐn)?shù)值,便是一個(gè)精準(zhǔn)推薦系統(tǒng)的需要解決的問(wèn)題。
理論上只需要一句話:要識(shí)別出文章中提及的電影,以及作者對(duì)該電影的評(píng)論,是好評(píng)還是差評(píng),作為文章作者對(duì)該電影的喜惡,并根據(jù)評(píng)論的情緒強(qiáng)烈程度轉(zhuǎn)化為喜惡程度即可。
那實(shí)際上,就要解決以下問(wèn)題:
下面逐一細(xì)說(shuō)。
我采集了上幾個(gè)比較受歡迎的電影專(zhuān)題以及一個(gè)大V帳號(hào)文章(數(shù)據(jù)截止至采集數(shù)據(jù)時(shí)):
但由于對(duì)專(zhuān)題頁(yè)面加了訪問(wèn)限制,每個(gè)專(zhuān)題只能訪問(wèn)到最新的200個(gè)列表頁(yè)面,因而每個(gè)專(zhuān)題可獲取2~3000篇文章,以此作為抽樣數(shù)據(jù)樣本。
要分析對(duì)電影的評(píng)價(jià),首先就要獲取到文章中提到電影名稱(chēng)有哪些,最簡(jiǎn)單的匹配規(guī)則便是提取書(shū)名號(hào) 《》 內(nèi)的內(nèi)容。
而實(shí)際獲取到的電影名稱(chēng)真可謂“臟亂差”,有電影名、書(shū)籍名、文章名等,有些電影名稱(chēng)會(huì)用縮寫(xiě)引用(如《變1》、《復(fù)聯(lián)》、《生化危機(jī)4/5/6》),或者中英文混合在一起(如《機(jī)器人總動(dòng)員(wall-e)》),甚至還有錯(cuò)漏別字(如《那些年,我們一起追過(guò)的女孩》,多了個(gè)“過(guò)”字),以及包含中英文特殊標(biāo)點(diǎn)空白符號(hào)等,例如:
因此需要進(jìn)行一輪“數(shù)據(jù)大清洗”,我使用如下清洗策略:
其中“電影專(zhuān)用詞典”,是通過(guò)采集了 「貓眼 影片總票房排行榜」 2000~2017年間上榜的所有電影,約有3000+部,如圖:
再根據(jù)文章中所收集到的電影名稱(chēng)的候選文本,抓取「豆瓣網(wǎng)」的官方電影名字(遭遇了豆瓣業(yè)內(nèi)聞名的反爬策略就不多說(shuō)了),合并去重后約有8400多部??匆谎鄄虐l(fā)現(xiàn)好多電影連聽(tīng)都沒(méi)聽(tīng)過(guò),有些電影名稱(chēng)還挺有趣,以后有時(shí)間還可以做下電影名稱(chēng)的分析。
為了解決錯(cuò)別字,我通過(guò)文本相似性算法,在電影專(zhuān)用詞典里找出與之最相似名稱(chēng)。
知名的相似算法有不少,如:
經(jīng)過(guò)簡(jiǎn)單比較,我選擇了其中表現(xiàn)最好的 jaro_winkler_distance
運(yùn)用到文章內(nèi)容上,可得到相似電影名稱(chēng),感覺(jué)效果還可以:
構(gòu)建一個(gè)Pipeline用于提取頁(yè)面中電影名稱(chēng),對(duì)單個(gè)頁(yè)面測(cè)試效果如下:
運(yùn)用到所有頁(yè)面上:
至此完成了電影名稱(chēng)的提取、清洗,得出每篇文章提及的電影名稱(chēng),如圖:
判斷一篇文章的情緒,最簡(jiǎn)單的做法是通過(guò)提取所有情緒詞來(lái)統(tǒng)計(jì)下詞頻及其權(quán)重可得到一個(gè)粗糙的結(jié)果,但這樣的結(jié)果對(duì)“影評(píng)”類(lèi)文章不是很準(zhǔn)確。
根據(jù)觀察,一篇電影評(píng)論文章中,往往會(huì)有大段的電影情節(jié)描述,然后夾雜一兩句評(píng)論。而有些電影本身劇情就是比較負(fù)面、陰暗的(如災(zāi)難片類(lèi)的),但影片本身質(zhì)量很高(如《釜山行》,豆瓣評(píng)分8.2),如果文章內(nèi)容包含大量的劇情描述,那么得到關(guān)鍵詞會(huì)偏向于負(fù)面情緒,并不能用于表達(dá)出作者對(duì)電影的喜好情緒。
因此我使用了這樣的提取策略:
評(píng)論句子提取的結(jié)果示例如下:
這樣的策略對(duì)有些內(nèi)容不是很適用,例如這樣的標(biāo)題:《同樣是豆瓣9.2分,它或許比《摔跤吧!爸爸》更深》,這是典型的“借勢(shì)營(yíng)銷(xiāo)”型文案,文章內(nèi)容中推介的是另外一部韓國(guó)電影《熔爐》,而時(shí)下《摔跤吧!爸爸》正熱,標(biāo)題中帶上這個(gè)會(huì)更吸引用戶(hù)點(diǎn)擊。
另外一個(gè)思路是對(duì)文章進(jìn)行摘要提取,然后對(duì)摘要進(jìn)行情緒識(shí)別。而對(duì)于文章的主題提取,可以使用在ML算法中的用于解決 主題模型 問(wèn)題的算法(如LDA),但不確定是否適合影評(píng)這種混合了大量劇情描述的文章內(nèi)容。
得到相關(guān)評(píng)論文本后,便可對(duì)文本進(jìn)行分詞及情緒識(shí)別,這里有兩種做法,一是使用帶有情緒情感度的專(zhuān)業(yè)詞典,配合專(zhuān)有算法;另外一種是使用機(jī)器學(xué)習(xí)算法。
一開(kāi)始我使用了大連理工大學(xué)的《大連理工情感詞匯本體庫(kù)》,是目前最權(quán)威的中文情緒詞典,共含有情感詞共計(jì)27466個(gè),包含了詞語(yǔ)的詞性種類(lèi)、情感類(lèi)別、情感強(qiáng)度及極性等信息,例如:
中文情感詞匯本體的情感分類(lèi)體系是在國(guó)外比較有影響的Ekman的6大類(lèi)情感分類(lèi)體系的基礎(chǔ)上構(gòu)建的。在Ekman的基礎(chǔ)上,詞匯本體加入情感類(lèi)別“好”對(duì)褒義情感進(jìn)行了更細(xì)致的劃分。最終詞匯本體中的情感共分為7大類(lèi)21小類(lèi),如圖:
把情感詞典加入分詞詞典,對(duì)候選每個(gè)句子進(jìn)行分詞,得出情感詞組,并累加每個(gè)情感詞的強(qiáng)度值作為句子的情感值。
但經(jīng)過(guò)測(cè)試后,發(fā)現(xiàn)預(yù)測(cè)效果并不理想,究其原因發(fā)現(xiàn)是情感詞典中命中的詞語(yǔ)太少,在句子中得不到相關(guān)詞語(yǔ),也就無(wú)法判斷情感極性和強(qiáng)度。
使用情感詞典的測(cè)試結(jié)果:
而專(zhuān)業(yè)詞典的擴(kuò)展需要專(zhuān)業(yè)領(lǐng)域知識(shí),擴(kuò)展起來(lái)很困難,我目前沒(méi)找到更新的專(zhuān)業(yè)詞典,國(guó)內(nèi)這塊的資料相當(dāng)匱乏,而國(guó)外有個(gè)知名的SentiWordNet庫(kù),中文NLP研究的難度系數(shù)可想而知。
鑒于情感詞典的資源限制,決定嘗試使用機(jī)器學(xué)習(xí)來(lái)對(duì)文本做正、負(fù)面情緒預(yù)測(cè)。
1). 構(gòu)建分詞詞典:
分詞需要構(gòu)建專(zhuān)用領(lǐng)域的詞典,這樣得到的分詞結(jié)果才會(huì)更精確。
因?yàn)橹恍枰姓?fù)情感類(lèi)別、不需要有情感強(qiáng)度及極性等信息,我使用了網(wǎng)絡(luò)上公開(kāi)的一些情感詞典,:
合并、清洗和去重后,最終構(gòu)建出了 14000+ 個(gè)詞的積極情緒詞典, 18000+ 個(gè)詞的消極情緒詞典。
積極詞典:
消極詞典:
2). 準(zhǔn)備訓(xùn)練語(yǔ)料
從網(wǎng)上搜集到幾個(gè)帶有積極、消極的標(biāo)注的評(píng)論語(yǔ)料數(shù)據(jù)集,分別包含了書(shū)籍、DVD、音樂(lè)、購(gòu)物領(lǐng)域的各有4000條評(píng)論,如下圖:
可惜沒(méi)找到中文影評(píng)相關(guān)的語(yǔ)料,但找到 國(guó)外英文的影評(píng)語(yǔ)料 ,對(duì),英文資料很豐富。。。
3). 訓(xùn)練模型
由于是文本型特征,分類(lèi)算法上選擇了 樸素貝葉斯 ,把數(shù)據(jù)分為2份,一半訓(xùn)練,另一半做測(cè)試。
使用 jieba 分詞工具,對(duì)文本進(jìn)行分詞得到候選詞組,把得到的詞組作為特征輸入來(lái)訓(xùn)練情緒預(yù)測(cè)模型。
訓(xùn)練后的模型測(cè)試結(jié)果如下:
訓(xùn)練后的模型在書(shū)籍、音樂(lè)、影碟及購(gòu)物評(píng)論的語(yǔ)料上都有不錯(cuò)的效果。
在提取出的影評(píng)短句上測(cè)試:
又是“無(wú)聊”、“又俗又傻”而一個(gè)“但”字就反轉(zhuǎn)了情緒,真是難為分類(lèi)器了:
經(jīng)過(guò)反復(fù)對(duì)比實(shí)驗(yàn),發(fā)現(xiàn)語(yǔ)料的質(zhì)量決定了模型的精度,而語(yǔ)料的擴(kuò)展對(duì)比擴(kuò)展專(zhuān)業(yè)詞典卻容易多了。例如幾年前都沒(méi)有“ 因吹斯汀 ”這些網(wǎng)絡(luò)流行詞,更不知道它代表是正面情緒,以后只要不斷更新相關(guān)領(lǐng)域的語(yǔ)料庫(kù)來(lái)重新訓(xùn)練則可得到更精確的模型。
俗話說(shuō)“是騾子是馬拉出來(lái)遛遛”。
得到一個(gè)預(yù)測(cè)情緒的模型后,便可對(duì)影評(píng)文章進(jìn)行預(yù)測(cè),但預(yù)測(cè)的結(jié)果是否準(zhǔn)確?準(zhǔn)確率又有多高?這又是個(gè)問(wèn)題。
每當(dāng)事情陷入停滯,我就會(huì)想起日本漫畫(huà)大師安達(dá)充說(shuō)過(guò)“當(dāng)故事情節(jié)發(fā)展不下去的時(shí)候,加入一個(gè)新角色,是最簡(jiǎn)單的做法”。
這時(shí)需要祭出一個(gè)“旁證”了。這所謂的“旁證”,也就是目前大家比較認(rèn)可的電影評(píng)分網(wǎng)站——豆瓣網(wǎng)。
大家都知道豆瓣網(wǎng)上的電影用戶(hù)通過(guò)打星(5力薦,4推薦,3還行,2較差,1很差),轉(zhuǎn)換得出的10分制的評(píng)分,我們可簡(jiǎn)單把1 4.9分視作負(fù)面評(píng)價(jià)、5 10分視作正面評(píng)價(jià),沒(méi)有分?jǐn)?shù)的視作中性評(píng)價(jià)。再把豆瓣的評(píng)價(jià)結(jié)果視作大部分人認(rèn)同的結(jié)果,當(dāng)然這樣肯定是有偏差的。
大膽假設(shè),小心求證,先試試看吧。
根據(jù)電影名詞典再次去抓取豆瓣網(wǎng)上的電影信息,這次包含了電影分?jǐn)?shù)::
使用獲取到的電影專(zhuān)題『電影院』文章內(nèi)容測(cè)試,結(jié)果如下:
1048篇中,豆瓣評(píng)分結(jié)果與模型預(yù)測(cè)符合的有974篇,準(zhǔn)確率是92.9%,WOW!真的這么準(zhǔn)嗎?
看下詳細(xì)結(jié)果,豆瓣評(píng)分是正面的有1022條,預(yù)測(cè)對(duì)了973篇,例如:
而豆瓣評(píng)分是負(fù)面的有28條記錄,而模型只預(yù)測(cè)出1篇是負(fù)面的:
真的是模型預(yù)測(cè)錯(cuò)了嗎?
從負(fù)面例子中抽樣看看模型分解的結(jié)果:
評(píng)論《麻煩家族》(豆瓣評(píng)分4.8)的:
從自動(dòng)摘要出來(lái)的句子來(lái)看,實(shí)際上文章作者表現(xiàn)出正面情緒,模型預(yù)測(cè)為正面,預(yù)測(cè)正確 😊。
再看評(píng)論同一部電影的另外一個(gè)文章的評(píng)論:
作者顯然是給了個(gè)差評(píng),但模型給了出的預(yù)測(cè)是正面,預(yù)測(cè)錯(cuò)誤 😞。
負(fù)例的預(yù)測(cè)準(zhǔn)確率低,有兩個(gè)原因,一個(gè)是豆瓣評(píng)分正負(fù)標(biāo)準(zhǔn)的閥值設(shè)定不夠精準(zhǔn),二是訓(xùn)練數(shù)據(jù)不平衡。
之前使用的閥值策略是:“簡(jiǎn)單把1 4分視作負(fù)面評(píng)價(jià)、5 10分視作正面評(píng)價(jià),沒(méi)有分?jǐn)?shù)的視作中性評(píng)價(jià)”。
我猜測(cè)在4~5分這個(gè)區(qū)間應(yīng)該是灰度地帶,正負(fù)面評(píng)論都會(huì)有。為了驗(yàn)證這個(gè)猜想,使用獲取到的所有豆瓣電影分?jǐn)?shù),導(dǎo)入數(shù)據(jù)分析工具中,排除掉沒(méi)有分?jǐn)?shù)的條目后得到6500+條電影數(shù)據(jù),其中最低是2.1,最高是9.7。
查看評(píng)分分布的直方圖與比例餅圖:
調(diào)整區(qū)間閥值,把 2.1-4.9 劃分為一個(gè)區(qū)間,系統(tǒng)自動(dòng)分成了3組分值:
發(fā)現(xiàn)5分以下電影僅占12%。
從評(píng)分分布結(jié)果看,在上大部分人寫(xiě)文章是針對(duì)高分(好評(píng))電影為主,低分(差評(píng))電影的文章數(shù)量很少,從提取出來(lái)的數(shù)據(jù)量看,兩者比率約為100:3。
訓(xùn)練數(shù)據(jù)不平衡導(dǎo)致正例過(guò)擬合,而負(fù)例欠擬合。
要解決數(shù)據(jù)不平衡問(wèn)題,可以重新采樣訓(xùn)練集。有兩種方法使不平衡的數(shù)據(jù)集來(lái)建立一個(gè)平衡的數(shù)據(jù)集——欠采樣和過(guò)采樣,解釋如下:
由于訓(xùn)練數(shù)據(jù)不多,我使用了 過(guò)采樣 中的自舉方案。我將另外一個(gè)的電影專(zhuān)題『影視天堂』中模型預(yù)測(cè)結(jié)果與豆瓣評(píng)分結(jié)果一致的內(nèi)容作為訓(xùn)練數(shù)據(jù)集來(lái)強(qiáng)化訓(xùn)練模型:
然后再對(duì)電影專(zhuān)題『電影院』測(cè)試一次:
負(fù)例的準(zhǔn)確率改善了一些些,這說(shuō)明效果是有的,以后只需繼續(xù)獲取到新的數(shù)據(jù)再“喂”給模型,模型預(yù)測(cè)結(jié)果會(huì)越來(lái)越精準(zhǔn)。
至此,得到一個(gè)不算成熟的電影情緒預(yù)測(cè)模型,可以用來(lái)做一些有趣的統(tǒng)計(jì)分析了。
將『影視天堂』專(zhuān)題的分析結(jié)果在數(shù)據(jù)分析工具上進(jìn)行數(shù)據(jù)可視化展示,得到一個(gè)「長(zhǎng)尾圖」:
從報(bào)表中可得到這些信息:
注1:嚴(yán)格來(lái)說(shuō)《歡樂(lè)頌》不是電影而是電視劇作品,在用豆瓣網(wǎng)的數(shù)據(jù)構(gòu)建電影詞典時(shí)我沒(méi)有做嚴(yán)格區(qū)分
注2:專(zhuān)題的數(shù)據(jù)獲取是在5月份完成的,以及專(zhuān)題的最新收錄文章有訪問(wèn)限制,無(wú)法獲取到舊的文章,因此得到的當(dāng)時(shí)熱門(mén)影視作品的影評(píng),從而呈現(xiàn)出信息跟當(dāng)時(shí)熱播作品比較相關(guān)
再對(duì)先前獲取到的 1萬(wàn)個(gè)用戶(hù)的近60萬(wàn)篇文章內(nèi)容 ,運(yùn)行相應(yīng)的Pipeline進(jìn)行電影情緒數(shù)據(jù)的提取。
可視化數(shù)據(jù)后得到圖表:
現(xiàn)在可以看看,上用戶(hù)給予好評(píng)的電影有哪些,使用「詞云圖」展示如下:
用戶(hù)給予差評(píng)的電影有哪些:
現(xiàn)在也可以精準(zhǔn)了解每一個(gè)用戶(hù)的電影口味了,以 『毒舌電影 - 』 為例子:
注3:本文發(fā)表時(shí)上“毒舌電影”經(jīng)歷過(guò)被封事件后已改名為“Sir電影”;專(zhuān)題“影視天堂”已改名為“電影”
以后做電影個(gè)性化推薦可就不要推薦錯(cuò)了 😉。
四、現(xiàn)在最流行的歌曲都有哪些?
(都是精選精挑的好聽(tīng)歌曲)
李玖哲《想太多》,《你好嗎》,《圍墻》,《退后》,《快點(diǎn)來(lái)愛(ài)我》
潘瑋柏《玩酷》,《愛(ài)不離》
周蕙《學(xué)會(huì)》
唐禹哲《最?lèi)?ài)還是你》,《吻到一公里之外》,《愛(ài)我》
蘇打綠《無(wú)與倫比的美麗》
蔡景佑《我可以》
歷娜
灰色幸福
張惠妹《如果你也聽(tīng)說(shuō)》
張韶涵《不想懂得》
陶喆:《普通朋友》《自導(dǎo)自演的悲劇》《黑色柳丁》《寂寞的季節(jié)》
張靚穎:《個(gè)人秘密》
蔡依林/陶喆:《今天你要嫁給我》
F.I.R:《天天夜夜》
容祖兒:《愛(ài)情復(fù)興》
王心凌:《彩虹的微笑》
花兒樂(lè)隊(duì):《我的果汁分你一半》
蔡依林:《乖乖牌》
蔡健雅:《Beautiful
Love》
古巨基:《愛(ài)得太遲》
何潔:《發(fā)光體》
陳綺貞《旅行的意義》
周筆暢《別愛(ài)我像愛(ài)個(gè)朋友》
周杰倫&溫嵐《屋頂》
五月天《溫柔》
TANK《給我你的愛(ài)》《三國(guó)戀》.
如果你也聽(tīng)說(shuō)
張惠妹
月牙灣
f.i.r
↑
玩酷
潘瑋柏
↑
G大調(diào)的悲傷
張靚穎
↓
酷愛(ài)
張敬軒
↓
新專(zhuān)輯《酷愛(ài)》
出神入化
飛輪海
↑
窮開(kāi)心
花兒樂(lè)隊(duì)
↓
特務(wù)J
蔡依林
↑
蔡依林一貫的風(fēng)格,熟悉的那段前奏
1
百度網(wǎng)友點(diǎn)評(píng)
愛(ài)的期限
薛之謙
純音樂(lè)
Kiss
The
Rain
神秘園之歌
天空之城
再見(jiàn)警察
卡農(nóng)
夏日香氣
迷情仙境
Tears
dream
catcher
被遺忘的天使
我在那一角落患過(guò)傷風(fēng)
很流行的韓日歌曲
rain-sadtango
李孝利
TOC
TOC
TOC
李孝利
不要愛(ài)上他
所以
冰淇淋
MC夢(mèng)
愛(ài)情過(guò)后
勁舞歌曲
30次左右
question
ha,yoo
sun
i
believe
勁舞歌曲
堅(jiān)持
us
never
say
goodbye
u
superjunior
聽(tīng)我說(shuō)
papaya
不能遺忘你
tonight,i
feel
close
to
you
倉(cāng)木麻衣&孫燕姿
我的人
sg
wannabe
試著說(shuō)
WaWa
2年零2月
fod
一個(gè)人/兩個(gè)人/只有你
蔡妍
花樣
松隆子
Come
on/飛機(jī)
烏龜
relove
徐智英
最流行的英文歌:
I'm
Gonna
Getcha
Good!--Shania
Twain
<一定要聽(tīng)這首哦>
Never
Had
A
Dream
Come
True--S
Club
7
最近開(kāi)始聽(tīng)這首歌的,太好聽(tīng)了
Any
Man
Of
Mine--Shania
Twain
還有這個(gè)
My
name
is
--Emimem阿姆的經(jīng)典之作
Happy
Boys
&
Girls---Aqua
他\她們的歌很活潑
Barbie
Girl--Aqua
When
You
Say
Nothing
At
All--Alison
Krauss細(xì)心品味,我很喜歡這首歌的
Candy
Shop--50
Cent
相信很多人聽(tīng)過(guò)吧
Back
to
you--Bryan
Adams
The
Power
Of
Love--Celine
Dion
yellow--coldplay
I
COULD
BE
THE
ONE--Donna
Lewis
聲音很甜
Without
Me--Eminem
又一首阿姆的經(jīng)典之作
Don't
Turn
Off
the
Light--Enrique
Iglesias
Any
one
Of
Us--Gareth
Gates
經(jīng)典
American
Idiot--Green
Day
朋克樂(lè),我很喜歡
Boulevard
of
Broken
Dreams--Green
Day
Moonlight
Shadow
--Groove
Coverage
Yesterday
Yes
A
Day--Jane
Birkin
Because
You
Live--Jesse
McCartney
人又帥歌又好
When
You
Believe--Mariah-Carey
很多地方介紹這首經(jīng)典的
Nothing
gonna
chang
my
love
for
you
We
Will
Rock
You--Queen
搖滾中的經(jīng)典
better
man--Robbie
Williams
第一首:Stand
第二首:peerless
第三首:floorfiller
第四首:sosforlove(又名:愛(ài)情求救號(hào))
第五首:hey-oh
第六首:OneForDaMoney
第七首:Ein
Kleines
Lied
第八首:la
isla
alizee
第九首:groove
coverage
第十首:LET'S
TALK
ABOUT
A
MAN
第十一首:Human
Sacrifice
第十二首:Wet
Wet
Wet
第十三首:
冰河時(shí)代2
第十四首:i
saw
you
walking
in
the
rain
第十五首:You`re
Not
Gonna
Score
第十六首:Self
Control
Laura
Bran
第十七首:doo
be
di
boy
第十八首:dreams
come
true
``
第十九首:I
Saw
You
Walking
In
The
Rain
``
第二十首:sound
of
my
dream
``
DJ舞曲:
TIME
TO
ROCK
舞曲大帝國(guó)
大爆炸
lalalove
Its Ok
i'm
gonna
getcha
good
!
仙尼亞
唐恩
辛巴達(dá)
皇冠一刻鐘
AU堅(jiān)持
ARE
YOU
DJ
talala
walking
in
the
sun
one
for
da
money
move
somethin
do
somethin
Close
to
You
Radio
Jay
Delano
DJ
Let
s
Talk
About
A
Man
La
Club
king
chipz
in
black
我敢保證一定很好聽(tīng),只選好聽(tīng)的,不選多的,樓主聽(tīng)下吧。好聽(tīng)記得加分哦!謝謝
以上就是關(guān)于排行榜書(shū)名號(hào)相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢(xún),客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
漢朝小說(shuō)排行榜(漢朝小說(shuō)排行榜前十名)