HOME 首頁
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運(yùn)營
CASE 服務(wù)案例
NEWS 熱點(diǎn)資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    人工智能預(yù)測(cè)算法(人工智能預(yù)測(cè)算法實(shí)例)

    發(fā)布時(shí)間:2023-03-12 22:42:26     稿源: 創(chuàng)意嶺    閱讀: 98        問大家

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于人工智能預(yù)測(cè)算法的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。

    ChatGPT國內(nèi)免費(fèi)在線使用,能給你生成想要的原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等

    你只需要給出你的關(guān)鍵詞,它就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁版、PC客戶端,官網(wǎng):https://ai.de1919.com

    本文目錄:

    人工智能預(yù)測(cè)算法(人工智能預(yù)測(cè)算法實(shí)例)

    一、"如何評(píng)估利用人工智能算法進(jìn)行股票選購的有效性和可靠性?"

    評(píng)估利用人工智能算法進(jìn)行股票選購的有效性和可靠性需要考慮以下幾個(gè)方面:

    1.數(shù)據(jù)質(zhì)量:所用的數(shù)據(jù)是否經(jīng)過有效篩選和清洗,并且數(shù)據(jù)是否全面、真實(shí)、可靠。

    2.算法準(zhǔn)確性:所使用的人工智能算法是否準(zhǔn)確,并且是否在歷史數(shù)據(jù)上測(cè)試過。

    3.實(shí)驗(yàn)設(shè)計(jì):選擇一定的歷史數(shù)據(jù)進(jìn)行訓(xùn)練,并對(duì)訓(xùn)練結(jié)果進(jìn)行評(píng)估,同時(shí)對(duì)實(shí)際應(yīng)用效果進(jìn)行跟蹤和評(píng)估。

    4.投資策略評(píng)估:評(píng)估算法給出的股票選購是否符合投資策略,并能否獲得可接受的投資回報(bào)。

    5.風(fēng)險(xiǎn)管理:評(píng)估算法能否有效地管理投資風(fēng)險(xiǎn),限制投資損失。

    需要注意的是,股票市場(chǎng)存在著復(fù)雜的變化和波動(dòng),尤其是外部政策因素的干擾,因此人工智能算法無法百分百準(zhǔn)確預(yù)測(cè)股市變化,只能提供參考,投資者需要結(jié)合個(gè)人判斷和市場(chǎng)情況進(jìn)行投資決策。

    二、人工智能算法?

    算法就分很多類,這里拿“合一”來作為介紹,為了應(yīng)用推理規(guī)則(比如取式假言推理),推理系統(tǒng)必須能夠判斷兩個(gè)表達(dá)式何時(shí)相同,也就是這兩個(gè)表達(dá)式何時(shí)匹配。在命題演算中,這是顯而易見的:兩個(gè)表達(dá)式是匹配的當(dāng)且僅當(dāng)它們?cè)谡Z句構(gòu)成上相同。在謂詞演算中,表達(dá)式中變量的存在使匹配兩個(gè)語句的過程變得復(fù)雜。全稱例化允許用定義域中的項(xiàng)來替換全稱量化變量。這需要一個(gè)決策處理來判斷是否可以使變量替換產(chǎn)生的兩個(gè)或更多個(gè)表達(dá)式相同〈通常是為了應(yīng)用推理規(guī)則)。合一是一種判斷什么樣的替換可以使產(chǎn)生的兩個(gè)謂詞演算表達(dá)式匹配的算法。我們?cè)谏?一節(jié)中已經(jīng)看到了這個(gè)過程,VX( man(X)=mortal(X))中的×替換成了man( socrates)中的 soc-rates。合一和像假言推理這樣的推理規(guī)則允許我們對(duì)一系列邏輯斷言做出推理。為了做到這一點(diǎn),必須把邏輯數(shù)據(jù)庫表示為合適的形式。這種形式的一個(gè)根本特征是要求所有的變量都是全稱量化的。這樣便允許在計(jì)算替代時(shí)有完全的自由度。存在量化變量可以從數(shù)據(jù)庫語句中消除,方法是用使這個(gè)語句為真的常量來替代它們。如,可以把3× parent( X, tom)替代為表達(dá)式parent( bob, tom)或parent( mary , tom) ,假定在當(dāng)前解釋下bob和 mary是tom的雙親。消除存在量化變量的處理會(huì)因這些替換的值可能依賴于表達(dá)式中的其他變量而變得復(fù)雜。

    三、人工智能的數(shù)據(jù)、算法和處理,三者缺一不可

            有人認(rèn)為,數(shù)據(jù)就宛如人工智能的汽油,重點(diǎn)應(yīng)該是干凈的數(shù)據(jù)、數(shù)據(jù)科學(xué)和對(duì)數(shù)據(jù)含義的深刻理解。

            有些人說,沒有來龍去脈的數(shù)據(jù)是沒有意義的,這些數(shù)據(jù)的來龍去脈可以是其他數(shù)據(jù)、模型/算法或處理流程。

            讓我們以一種簡潔的方式探究這些人工智能的要素,以發(fā)現(xiàn)每種視角的優(yōu)點(diǎn)。

    數(shù)據(jù)

            數(shù)據(jù)是起點(diǎn),因?yàn)樗欠浅S杏玫馁Y產(chǎn)。

            不管真假,人們都認(rèn)為數(shù)據(jù)承載著知識(shí),而利用這些知識(shí)將有利于那些善于研究數(shù)據(jù)的人。

            對(duì)人工智能來說,從數(shù)據(jù)開始,并通過從中學(xué)習(xí)來利用優(yōu)勢(shì),是有意義的。在數(shù)據(jù)量大、速度快的時(shí)代,使用數(shù)據(jù)來訓(xùn)練人工智能十分便捷。

            企業(yè)在商業(yè)智能方面有著悠久的歷史,很多工作都圍繞著數(shù)據(jù)展開。對(duì)于人工智能來說也沒什么不同。

            原始數(shù)據(jù)一般通過數(shù)據(jù)采集獲得,隨后的數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注相當(dāng)于對(duì)數(shù)據(jù)進(jìn)行加工,然后輸送到人工智能算法和模型里進(jìn)行調(diào)用。

            人工智能訓(xùn)練所用的數(shù)據(jù)如果沒有保證足夠的多樣化和無偏性,就有可能產(chǎn)生人為的”AI偏見”等問題。

            國內(nèi)的京東眾智、百度眾包、覺醒向量等都是專注于AI數(shù)據(jù)的智能眾包平臺(tái)。

    算法

            理解算法相對(duì)于自然環(huán)境下的靜態(tài)數(shù)據(jù)的優(yōu)勢(shì)是很重要的。

            事實(shí)上,組織可以通過優(yōu)化其業(yè)務(wù)的算法獲得優(yōu)勢(shì)。找到合適的公式、統(tǒng)計(jì)模型或預(yù)測(cè)是真正的商業(yè)藝術(shù)。

            這些算法受到組織的保護(hù),通常被認(rèn)為是成功的秘密武器。

            雖然它們依賴于干凈的數(shù)據(jù),但數(shù)學(xué)或邏輯中隱含的規(guī)則才是許多行業(yè)的真正區(qū)別所在。

            如果沒有精算師和他們寶貴的算法,保險(xiǎn)業(yè)將何去何從?人工智能也不例外。

            機(jī)器學(xué)習(xí)的常用算法包括決策樹、隨機(jī)森林算法、邏輯回歸、SVM、樸素貝葉斯、K最近鄰算法、K均值算法、Adaboost算法、神經(jīng)網(wǎng)絡(luò)、馬爾可夫。

            人工智能的算法按照模型訓(xùn)練方式和解決任務(wù)的不同可以分為好幾類,其中需要考慮的因素包括數(shù)據(jù)本身的數(shù)量、質(zhì)量和特點(diǎn),具體業(yè)務(wù)場(chǎng)景中的問題,計(jì)算時(shí)間及精度要求等。

    處理過程

            正確的步驟或任務(wù)、適當(dāng)?shù)姆绞綄?duì)于取得的結(jié)果質(zhì)量是至關(guān)重要的。

            無論處理過程(process)是靜態(tài)的、可重復(fù)的,還是動(dòng)態(tài)的、緊急的,都沒有區(qū)別。

            知道下一步的最佳行動(dòng)是獲得最佳業(yè)務(wù)結(jié)果的關(guān)鍵。

            好的處理過程就是在正確的時(shí)間使用正確的數(shù)據(jù)和算法。

            由于流程的精確性,業(yè)務(wù)結(jié)果肯定是準(zhǔn)確的,并且可以通過使用各種形式的監(jiān)督的透明反饋周期進(jìn)行適當(dāng)?shù)恼{(diào)整。

    三者缺一不可?

            真正的結(jié)論是,要想獲得長期的成功,你需要這三者。人們可以先從其中一個(gè)要素開始,接著添加其他要素。

            隨著機(jī)器學(xué)習(xí)逐漸展現(xiàn)出其威力,許多人工智能項(xiàng)目都是從數(shù)據(jù)開始的。

            但隨著人工智能的發(fā)展,算法和處理過程也將成為不可忽視的要素。

            基于數(shù)據(jù)的人工智能目前運(yùn)行良好,隨著問題的復(fù)雜性和范圍的擴(kuò)大,算法和處理流程的重要性將會(huì)凸顯。

            如同三角形需要三條邊來穩(wěn)定形狀,人工智能也將需要全部的三要素來完善自身。

    來源(今日頭條)

    四、生活中的人工智能之搜索和推薦算法

    姓名:陳心語  學(xué)號(hào):21009102266 書院:海棠1號(hào)書院

    轉(zhuǎn)自: 人工智能在搜索中的應(yīng)用_u014033218的專欄-CSDN博客

    人工智能在搜索的應(yīng)用和實(shí)踐_qq_40954115的博客-CSDN博客

    【嵌牛導(dǎo)讀】日常生活中的搜索和推薦算法也與人工智能有所關(guān)聯(lián),讓我們一起來看看吧!

    【嵌牛鼻子】人工智能運(yùn)用于搜索和推薦算法。

    【嵌牛提問】人工智能在搜索和推薦算法中有什么運(yùn)用呢?

    【嵌牛正文】

    智能交互

    智能交互有三個(gè)方面的這部分組成,第一個(gè)就是Query推薦,這是比較古老的課題;第二個(gè)做智能導(dǎo)購,這是現(xiàn)在正在做的一個(gè)原形,后面我會(huì)講為什么做智能導(dǎo)購;第三個(gè)內(nèi)容的展示和個(gè)性化的創(chuàng)意。就是說你把商品怎么展示給用戶,也是我們認(rèn)為是交互的一部分。

    第一個(gè)是Query推薦,這個(gè)問題怎么來抽象呢?Query推薦是一個(gè)用戶當(dāng)前Query下面我們?cè)趺赐扑]其它Query,這是我們相關(guān)搜索一樣的。我們推薦這樣的一個(gè)Query以后,如果用戶一旦點(diǎn)了其中的一個(gè)Query,用戶的狀態(tài)就會(huì)發(fā)生變化,從當(dāng)前的Query跳到另外一個(gè)Query,這是用戶狀態(tài)的變化。第二個(gè)就是說我們?cè)趺丛u(píng)價(jià)我們推薦的Query的好壞,它由幾部分組成,一個(gè)Query有沒有被點(diǎn),第二個(gè)就是說推薦Query里面,它的SRP頁會(huì)不會(huì)點(diǎn),因?yàn)镼uery推薦本質(zhì)上不是Query推薦做的最好就是最好的,它是說最終要在搜索SRP用戶有沒有買,有沒有點(diǎn)擊,這才是做的好的,這是第二個(gè)收益。還有一個(gè)更加間接的,通過Query推,這個(gè)狀態(tài)轉(zhuǎn)到下一個(gè)狀態(tài)以后,這個(gè)里面還會(huì)推其它Query,還會(huì)有其它點(diǎn)擊,這個(gè)時(shí)候也是個(gè)間接推薦。如果我不推Query就不能到這個(gè)狀態(tài),不到狀態(tài)不會(huì)有這個(gè)Query,不會(huì)有這個(gè)收益。我們了解,這就是典型的一個(gè)馬爾科夫決策過程,我們是用強(qiáng)化學(xué)習(xí)來做的,Actions就是我們的Query list,根據(jù)用戶和當(dāng)前Query推薦其他Query,狀態(tài)就是User + Query,收益就是包括推薦Query擊,還有一個(gè)間接收益,間接收益通過bellman 公式可以算出來,這就是一個(gè)DQN的強(qiáng)化學(xué)習(xí)項(xiàng)目。

    智能導(dǎo)購

    現(xiàn)在的搜索呈現(xiàn)的問題就是說,如果去看搜索的Query都是一些品類詞、品牌詞、型號(hào)詞或者屬性詞。假定用戶他知道買什么再來搜索搜,但是有各很大的東西用戶不知道買什么嗎?智能導(dǎo)購就是做做一個(gè)類似智能導(dǎo)購機(jī)器人的產(chǎn)品,引導(dǎo)用戶怎么搜,用戶也可以主動(dòng)問,獲取知識(shí)或購物經(jīng)驗(yàn)。這是后臺(tái)的算法的一個(gè)原形,不久后會(huì)上線。

    智能內(nèi)容

    因?yàn)樘詫毜纳唐罚u家為了適應(yīng)我們的引擎,做了大量的SEO,里面都是羅列熱門的關(guān)健詞,導(dǎo)致問題淘寶的標(biāo)題沒什么差異,都寫的差不多,看標(biāo)題也不知道什么東西,或者知道但里面沒有很多特色的內(nèi)容。我們做智能內(nèi)容很重要的出發(fā)點(diǎn)是怎么從商品的評(píng)價(jià)、詳情頁、屬性里面挖出一些比較有賣點(diǎn),或者商品比較有特色的東西展示給用戶,讓用戶更好的了解商品,這是第一個(gè)。第二個(gè)淘寶上面還有類似商品聚合的,比如清單,生成一個(gè)清單,怎么給清單生成一個(gè)比較好的導(dǎo)入的描述,讓用戶描述這個(gè)清單干什么。這里面主要做了這兩個(gè)事情。具體怎么做的?一個(gè)會(huì)生成一些Topic,比如行業(yè)運(yùn)營加上我們挖的一些點(diǎn),比如像手機(jī)一般大家關(guān)注點(diǎn)會(huì)是手機(jī)的性價(jià)比,拍照是不是清晰,還有速度是不是快,是不是發(fā)熱什么的,這是用戶關(guān)注的興趣點(diǎn)。然后它會(huì)根據(jù)這個(gè)商品會(huì)選擇一個(gè)興趣點(diǎn),通過Seq2seq生成短文本。

    語義搜索

    我們的商品屬性基本上是比較標(biāo)準(zhǔn)化的,因?yàn)檫@里淘寶有一個(gè)這樣的商品庫,非標(biāo)準(zhǔn)化的內(nèi)容是沒法上傳的。導(dǎo)致的問題是我們的商品內(nèi)容相對(duì)來說是比較規(guī)范化的,但是用戶的輸入的Query不是這樣的,比如我這里舉一些例子,比如一個(gè)新品有各種表達(dá),2017新品,2017冬季新品,是吧?新品,有很多的表達(dá)。所以就是從從用戶的需求跟商品的內(nèi)容,就存在了一個(gè)語義的Gap。還有我們經(jīng)常舉例,比如三口之家用的電飯鍋,很多這種語義的問題,這個(gè)語義從語義角度解決語義Match的事情。

    大概會(huì)有這么幾個(gè)方面。比如一個(gè)就是意圖的理解,還有意圖的Mapping,比如大容量冰箱,首先知道大的是跟冰箱的容量相關(guān)的,冰箱是個(gè)類目,最后要Mapping到人的冰箱,把‘大’改寫成一個(gè)容量大于多少升,類目是冰箱這樣才能夠比較好的解決我們這個(gè)搜索的這個(gè)召回的問題。 第二個(gè)語義理解,這里面包括Query和商品都要做語義理解,比如通過image tagging計(jì)算從圖片里面抽取很多文本的語義標(biāo)簽補(bǔ)充到商品文本索引中。 第三個(gè)就是現(xiàn)在有這個(gè)端到端的深度學(xué)習(xí)技術(shù)來直接學(xué)Query和商品的Similarity,通過端到端的深度學(xué)習(xí)技術(shù)來做語義的召回和語義的相關(guān)性。

    智能匹配

    主要就是講個(gè)性化,做個(gè)性化的首要就是個(gè)性化數(shù)據(jù)。個(gè)性化本質(zhì)上就是說以用戶為中心構(gòu)建用戶的標(biāo)簽,用戶的行為,還有用戶的偏好,再通過這些數(shù)據(jù)找到,去Match到商品,比如說你看過相似商品,典型的協(xié)同過濾,還有你偏好的品牌的其它商品。那就是基于這些經(jīng)歷了一個(gè)以用戶為中心的電商圖譜,這里面還加了一些輔助的數(shù)據(jù),比如商品的相似度,店鋪之間的相似度,這樣構(gòu)建了我們這樣的叫電商圖譜。

    個(gè)性化召回與向量化召回

    召回是這樣的,首先從咱們的電商圖譜里取出用戶的信息,包括比如說年齡性別,還有當(dāng)?shù)販囟仁嵌嗌?,還有行為足跡等等之類的,社交現(xiàn)在沒用了,因?yàn)檫@是幾年前社交特別火,什么都要摻和一下,其實(shí)社交,信息的社交到電商其實(shí)風(fēng)馬牛不相及的領(lǐng)域,沒有任何價(jià)值。所以現(xiàn)在好友這東西幾乎沒有用。因?yàn)椴煌琎uery中,用戶信息重要性是不一樣的,我們根據(jù)上下文會(huì)做用戶信息的篩選或者排序,會(huì)找出比較重要的信息做個(gè)性化召回。以上是淘寶商品索引結(jié)構(gòu),傳統(tǒng)的搜索關(guān)鍵字是通過搜索關(guān)鍵字召回,而個(gè)性化商品索引,除了Query還會(huì)有商品簇,簇與簇之間的關(guān)系,品牌店鋪等等之類的,會(huì)加很多個(gè)性化的特征做召回,通過這種帶的好處是召回的結(jié)果跟用戶是直接相關(guān)的,就召回這一步帶來個(gè)性化。

    但是這種基于行為召回還是存在一個(gè)問題的。最重要的問題它的泛化能力會(huì)比較差。最典型的比如說你通過協(xié)同過濾來做,如果兩個(gè)商品,沒有用戶同時(shí)看過的話,這兩個(gè)商品你認(rèn)為他們相似度是零,這個(gè)結(jié)論是錯(cuò)的,但是如果通過協(xié)同過濾就有這個(gè)問題。我們今年實(shí)現(xiàn)了向量化召回,包括兩步:一個(gè)是Similarity learning,通過這個(gè)深度學(xué)習(xí)做端到端的Similarity learning,就會(huì)把這個(gè)我們的User 和Item會(huì)變成一個(gè)向量;第二步就是做向量化召回,比如層次聚類,隨機(jī)游走,learning to hash等,這樣的話就是說會(huì)極大的提升召回的深度。

    個(gè)性化工作

    在個(gè)性化領(lǐng)域其實(shí)最重要的一個(gè)核心的問題就是怎么去理解用戶,怎么感知用戶和預(yù)測(cè)用戶行為及偏好。

    首先是數(shù)據(jù),用戶在淘寶有兩個(gè)中類型重要的基本信息:一個(gè)是用戶標(biāo)簽,比如年齡、性別、職業(yè)等;第二是用戶足跡,比如 點(diǎn)過,買過的商品,店鋪等;

    其次是用戶感知要和搜索上下文相關(guān),即這個(gè)用戶的表征和要用戶搜索意圖相關(guān);

    第三是搜索有很多差異化的任務(wù),比如用戶消費(fèi)能力的預(yù)估, User到Item的CTR預(yù)估和用戶購物狀態(tài)預(yù)估等,是為每個(gè)任務(wù)做個(gè)端到端的深度學(xué)習(xí)模型還是用統(tǒng)一的用戶表征來完成不同的Task?如果每一個(gè)任務(wù)都做端到端深度學(xué)習(xí)會(huì)有很多問題,比如離線和在線的性能開銷會(huì)大很多,或部分任務(wù)樣本太少。

    如圖是用戶感知深度模型,輸入X是用戶的點(diǎn)擊行為序列,下一步是embedding,embedding完以后,通過LSTM把用戶行為序列做embedding,因?yàn)樵谒阉饔脩舾兄蚎uery相關(guān),所以加入query 的 attention層,選擇和當(dāng)前query有關(guān)系的行為,表征完是Multi-task learning 網(wǎng)絡(luò)。整個(gè)這個(gè)網(wǎng)絡(luò)的參數(shù)大概有一百億個(gè)參數(shù),我在雙11我們還實(shí)現(xiàn)了在線學(xué)習(xí)。

    算法包括智能交互、語義搜索、智能匹配和搜索策略四個(gè)方向。

    智能交互

    商品搜索就是帶交互的商品推薦,用戶通過關(guān)鍵字輸入搜索意圖,引擎返回和搜索意圖匹配的個(gè)性化推薦結(jié)果,好的交互技術(shù)能夠幫助到用戶更好的使用搜索引擎,目前搜索的交互主要是主動(dòng)關(guān)鍵字輸入和關(guān)鍵字推薦,比如搜索框中的默認(rèn)查詢?cè)~和搜索結(jié)果中的文字鏈等,推薦引擎根據(jù)用戶搜索歷史、上下文、行為和狀態(tài)推薦關(guān)鍵字。和商品推薦的區(qū)別是,關(guān)鍵字推薦是搜索鏈路的中間環(huán)節(jié),關(guān)鍵字推薦的收益除了關(guān)鍵字的點(diǎn)擊行為外,還需要考慮對(duì)整個(gè)購物鏈路的影響,包括在推薦關(guān)鍵字的后續(xù)行為中是否有商品點(diǎn)擊、加購和成交或跳轉(zhuǎn)到另外一個(gè)關(guān)鍵字的后繼行為,這是一個(gè)典型的強(qiáng)化學(xué)習(xí)問題,action 是推薦的關(guān)鍵字候選集合,狀態(tài)是用戶當(dāng)前搜索關(guān)鍵詞、上下文等,收益是搜索引導(dǎo)的成交。除了被動(dòng)的關(guān)鍵字推薦,我們也在思考搜索中更加主動(dòng)的交互方式,能夠做到像導(dǎo)購員一樣的雙向互動(dòng),主動(dòng)詢問用戶需求,挑選個(gè)性化的商品和給出個(gè)性化的推薦理由,目前我們已經(jīng)在做智能導(dǎo)購和智能內(nèi)容方向的技術(shù)原型及論證,智能導(dǎo)購在技術(shù)上主要是借鑒對(duì)話系統(tǒng),通過引導(dǎo)用戶和引擎對(duì)話與關(guān)鍵字推薦方式互為補(bǔ)充,包括自然語言理解,對(duì)話策略,對(duì)話生成,知識(shí)推理、知識(shí)問答和商品搜索等模塊,功能主要包括:a. 根據(jù)用戶搜索上下文生成引導(dǎo)用戶主動(dòng)交互的文本,比如搜索“奶粉”時(shí),會(huì)生成“您寶寶多大?0~6個(gè)月,6個(gè)月到1歲….”引導(dǎo)文案,提示用戶細(xì)化搜索意圖,如果用戶輸入“3個(gè)月”后,會(huì)召回相應(yīng)段位的奶粉,并在后續(xù)的搜索中會(huì)記住對(duì)話狀態(tài)“3個(gè)月”寶寶和提示用戶“以下是適合3個(gè)月寶寶的奶粉”,b. 知識(shí)導(dǎo)購,包含提高售前知識(shí)問答或知識(shí)提示,比如“3個(gè)月寶寶吃什么奶粉” 回答“1段”,目前對(duì)話技術(shù)還不太成熟,尤其是在多輪對(duì)話狀態(tài)跟蹤、知識(shí)問答和自動(dòng)評(píng)價(jià)幾個(gè)方面,但隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和生成對(duì)抗學(xué)習(xí)等技術(shù)在NLP、對(duì)話策略、閱讀理解等領(lǐng)域的應(yīng)用,越來越多的訓(xùn)練數(shù)據(jù)和應(yīng)用場(chǎng)景,domain specific 的對(duì)話技術(shù)未來幾年應(yīng)該會(huì)突飛猛進(jìn);智能內(nèi)容生成,包括生成或輔助人工生成商品和清單的“賣點(diǎn)”,短標(biāo)題和文本摘要等,讓淘寶商品表達(dá)更加個(gè)性化和多元化。

    語義搜索

    語義搜索主要是解決關(guān)鍵字和商品內(nèi)容之間的語義鴻溝,比如搜索“2~3周歲寶寶外套”,如果按照關(guān)鍵字匹配召回結(jié)果會(huì)遠(yuǎn)小于實(shí)際語義匹配的商品。語義搜索的范圍主要包括:a. query tagging和改寫,比如新品,年齡,尺碼,店鋪名,屬性,類目等搜索意圖識(shí)別和歸一化,query tagging模型是用的經(jīng)典的序列標(biāo)注模型 bi-lstm + CRF,而標(biāo)簽分類(歸一化) 作為模型另外一個(gè)任務(wù),將序列標(biāo)注和分類融合在一起學(xué)習(xí);b. query 改寫,主要是計(jì)算query之間相似度,把一個(gè)query改寫成多個(gè)語義相似的query,通常做法是先用不同改寫策略生成改寫候選query集合,比如詞替換、向量化后top k、點(diǎn)擊商品相似度等,然后在用ltr對(duì)后續(xù)集合排序找出合適的改寫集合,模型設(shè)計(jì)和訓(xùn)練相對(duì)簡單,比較難的是如何構(gòu)建高質(zhì)量的訓(xùn)練樣本集合,線上我們用bandit 的方法探測(cè)部分query 改寫結(jié)果的優(yōu)劣,離線則用規(guī)則和生成對(duì)抗網(wǎng)絡(luò)生成一批質(zhì)量較高的樣本; c. 商品內(nèi)容理解和語義標(biāo)簽,通過商品圖片,詳情頁,評(píng)價(jià)和同義詞,上下位詞等給商品打標(biāo)簽或擴(kuò)充商品索引內(nèi)容,比如用 image tagging技術(shù)生成圖片的文本標(biāo)簽豐富商品內(nèi)容,或者更進(jìn)一步用直接用圖片向量和文本向量融合,實(shí)現(xiàn)富媒體的檢索和查詢;d. 語義匹配,經(jīng)典的DSSM 模型技術(shù)把query 和商品變成向量,用向量內(nèi)積表達(dá)語義相似度,在問答或閱讀理解中大量用到多層LSTM + attention 做語義匹配,同樣高質(zhì)量樣本,特別是高質(zhì)量負(fù)樣本很大程度上決定了模型的質(zhì)量,我們沒有采樣效率很低的隨機(jī)負(fù)采樣,而是基于電商知識(shí)圖譜,通過生成字面相似但不相關(guān)的query及相關(guān)文檔的方法生成負(fù)樣本。從上面可以看到query tagging、query相似度、語義匹配和語義相關(guān)性是多個(gè)目標(biāo)不同但關(guān)聯(lián)程度非常高的任務(wù),下一步我們計(jì)劃用統(tǒng)一的語義計(jì)算框架支持不同的語義計(jì)算任務(wù),具體包括1. 開發(fā)基于商品內(nèi)容的商品表征學(xué)習(xí)框架,為商品內(nèi)容理解,內(nèi)容生成,商品召回和相關(guān)性提供統(tǒng)一的商品表征學(xué)習(xí)框架,重點(diǎn)包括商品標(biāo)題,屬性,詳情頁和評(píng)價(jià)等文本信息抽取,圖像特征抽取和多模信號(hào)融合;2. query 表征學(xué)習(xí)框架,為query 類目預(yù)測(cè),query改寫,query 推薦等提供統(tǒng)一的表征學(xué)習(xí)框架,重點(diǎn)通過多個(gè)query 相似任務(wù)訓(xùn)練統(tǒng)一的query表征學(xué)習(xí)模型;3. 語義召回,語義相關(guān)性等業(yè)務(wù)應(yīng)用模型框架。語義搜索除了增加搜索結(jié)果相關(guān)性,提升用戶體驗(yàn)外,也可以一定程度上遏制淘寶商品標(biāo)題堆砌熱門關(guān)鍵詞的問題。

    智能匹配

    這里主要是指個(gè)性化和排序。內(nèi)容包括:a. ibrain (深度用戶感知網(wǎng)絡(luò)),搜索或推薦中個(gè)性化的重點(diǎn)是用戶的理解與表達(dá),基于淘寶的用戶畫像靜態(tài)特征和用戶行為動(dòng)態(tài)特征,我們基于multi-modals learning、multi-task representation learning以及LSTM的相關(guān)技術(shù),從海量用戶行為日志中直接學(xué)習(xí)用戶的通用表達(dá),該學(xué)習(xí)方法善于“總結(jié)經(jīng)驗(yàn)”、“觸類旁通”,使得到的用戶表達(dá)更基礎(chǔ)且更全面,能夠直接用于用戶行為識(shí)別、偏好預(yù)估、個(gè)性化召回、個(gè)性化排序等任務(wù),在搜索、推薦和廣告等個(gè)性化業(yè)務(wù)中有廣泛的應(yīng)用場(chǎng)景,感知網(wǎng)絡(luò)超過10B個(gè)參數(shù),已經(jīng)學(xué)習(xí)了幾千億次的用戶行為,并且會(huì)保持不間斷的增量學(xué)習(xí)越來越聰明; b. 多模學(xué)習(xí),淘寶商品有文本、圖像、標(biāo)簽、id 、品牌、類目、店鋪及統(tǒng)計(jì)特征,這些特征彼此有一定程度的冗余和互補(bǔ),我們利用多模學(xué)習(xí)通過多模聯(lián)合學(xué)習(xí)方法把多維度特征融合在一起形成統(tǒng)一的商品標(biāo)準(zhǔn),并多模聯(lián)合學(xué)習(xí)中引入self-attention實(shí)現(xiàn)特征維度在不同場(chǎng)景下的差異,比如女裝下圖片特征比較重要,3C下文本比較重要等;c. deepfm,相對(duì)wide & deep 模型,deepfm 增加了特征組合能力,基于先驗(yàn)知識(shí)的組合特征能夠應(yīng)用到深度學(xué)習(xí)模型中,提升模型預(yù)測(cè)精度;d. 在線深度排序模型,由于行為類型和商品重要性差異,每個(gè)樣本學(xué)習(xí)權(quán)重不同,通過樣本池對(duì)大權(quán)重樣本重復(fù)copy分批學(xué)習(xí),有效的提升了模型學(xué)習(xí)穩(wěn)定性,同時(shí)通過融合用戶狀態(tài)深度ltr模型實(shí)現(xiàn)了千人千面的排序模型學(xué)習(xí);e. 全局排序,ltr 只對(duì)單個(gè)文檔打分然后按照ltr分?jǐn)?shù)和打散規(guī)則排序,容易導(dǎo)致搜索結(jié)果同質(zhì)化,影響總頁效率,全局排序通過已知排序結(jié)果做為上下文預(yù)測(cè)下一個(gè)位置的商品點(diǎn)擊概率,有效提升了總頁排序效率;f. 另外工程還實(shí)現(xiàn)了基于用戶和商品向量的向量召回引擎,相對(duì)倒排索引,向量化召回泛化能力更強(qiáng),對(duì)語義搜索和提高個(gè)性化匹配深度是非常有價(jià)值的。以上實(shí)現(xiàn)了搜索從召回、排序特征、排序模型、個(gè)性化和重排的深度學(xué)習(xí)升級(jí),在雙11無線商品搜索中帶來超過10% (AB-Test)的搜索指標(biāo)提升。

    智能決策

    搜索中個(gè)性化產(chǎn)品都是成交最大化,導(dǎo)致的問題是搜索結(jié)果趨同,浪費(fèi)曝光,今年做的一個(gè)重要工作是利用多智能體協(xié)同學(xué)習(xí)技術(shù),實(shí)現(xiàn)了搜索多個(gè)異構(gòu)場(chǎng)景間的環(huán)境感知、場(chǎng)景通信、單獨(dú)決策和聯(lián)合學(xué)習(xí),實(shí)現(xiàn)聯(lián)合收益最大化,而不是此消彼長,在今年雙11中聯(lián)合優(yōu)化版本帶來的店鋪內(nèi)和無線搜索綜合指標(biāo)提升12% (AB-Test),比非聯(lián)合優(yōu)化版本高3% (AB-Test)。

    性能優(yōu)化

    在深度學(xué)習(xí)剛起步的時(shí)候,我們意識(shí)到深度模型inference 性能會(huì)是一個(gè)瓶頸,所以在這方面做了大量的調(diào)研和實(shí)驗(yàn),包括模型壓縮(剪枝),低秩分解,量化和二值網(wǎng)絡(luò),由于缺少相應(yīng)的指令集和硬件支持,最終只在個(gè)別場(chǎng)景下上線,期待支持低精度矩陣計(jì)算和稀疏矩陣計(jì)算的硬件早日出現(xiàn)。

    未來計(jì)劃

    通用用戶表征學(xué)習(xí)。前面介紹的DUPN 是一個(gè)非常不錯(cuò)的用戶表征學(xué)習(xí)模型,但基于query 的attention 只適合搜索,同時(shí)缺少基于日志來源的attention,難以推廣到其他業(yè)務(wù),在思考做一個(gè)能夠適合多個(gè)業(yè)務(wù)場(chǎng)景的用戶表征模型,非搜索業(yè)務(wù)做些簡單fine tuning 就能取得比較好的效果;同時(shí)用戶購物偏好受季節(jié)和周期等影響,時(shí)間跨度非常大,最近K個(gè)行為序列假設(shè)太簡單,我們?cè)谒伎寄軌蜃鰈ife-long learning 的模型,能夠?qū)W習(xí)用戶過去幾年的行為序列;搜索鏈路聯(lián)合優(yōu)化。從用戶進(jìn)入搜索到離開搜索鏈路中的整體優(yōu)化,比如 搜索前的query 引導(dǎo)(底紋),搜索中的商品和內(nèi)容排序,搜索后的 query推薦(錦囊)等場(chǎng)景;跨場(chǎng)景聯(lián)合優(yōu)化。今年搜索內(nèi)部主搜索和店鋪內(nèi)搜索聯(lián)合優(yōu)化取得了很好的結(jié)果,未來希望能夠拓展在更多大流量場(chǎng)景,提高手淘的整體購物體驗(yàn);多目標(biāo)聯(lián)合優(yōu)化。搜索除了成交外,還需要承擔(dān)賣家多樣性,流量公平性,流量商業(yè)化等居多平臺(tái)和賣家的訴求,搜索產(chǎn)品中除了商品搜索外還有“穹頂”,“主題搜索”,“錦囊”,“內(nèi)容搜索”等非商品搜索內(nèi)容,不同搜索目標(biāo)和不同內(nèi)容(物種)之間的聯(lián)合優(yōu)化未來很值得深挖。

    以上就是關(guān)于人工智能預(yù)測(cè)算法相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。


    推薦閱讀:

    關(guān)于人工智能的書有哪些(關(guān)于人工智能的書有哪些書籍)

    人工智能應(yīng)用技術(shù)就業(yè)方向(人工智能應(yīng)用技術(shù)就業(yè)方向女生)

    人工智能寫小說軟件(人工智能寫小說網(wǎng)站)

    怎么查看主播封號(hào)了(怎么查看主播封號(hào)了多久)

    人物形象設(shè)計(jì)燒錢嗎(人物形象設(shè)計(jì)貴不貴)