HOME 首頁(yè)
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運(yùn)營(yíng)
CASE 服務(wù)案例
NEWS 熱點(diǎn)資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    人工智能十大算法(編程的50種基礎(chǔ)算法)

    發(fā)布時(shí)間:2023-04-13 23:57:06     稿源: 創(chuàng)意嶺    閱讀: 89        

    大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于人工智能十大算法的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。

    開(kāi)始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等

    只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端

    官網(wǎng):https://ai.de1919.com。

    創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請(qǐng)撥打電話175-8598-2043,或添加微信:1454722008

    本文目錄:

    人工智能十大算法(編程的50種基礎(chǔ)算法)

    一、人工智能中的算法種類

    SVM算法,粒子群算法,免疫算法,種類太多了,各種算法還有改進(jìn)版,比如說(shuō)遺傳神經(jīng)網(wǎng)絡(luò)。從某本書(shū)上介紹,各種算法性能、效力等各不同,應(yīng)依據(jù)具體問(wèn)題選擇算法。

    二、人工智能方面有哪些算法

    模式識(shí)別需要非常好的概率論,數(shù)理統(tǒng)計(jì);另外會(huì)用到少量矩陣代數(shù),隨機(jī)過(guò)程和高數(shù)中的一些運(yùn)算,當(dāng)然是比較基礎(chǔ)的;如果要深入的話恐怕需要學(xué)泛函,但是一般情況下不需要達(dá)到這種深度。神經(jīng)網(wǎng)絡(luò),遺傳算法等智能算法在模式識(shí)別有非常重要的應(yīng)用,但是一般不需要學(xué)習(xí)計(jì)算機(jī)學(xué)科的人工智能,我們控制有一個(gè)交叉學(xué)科叫做智能控制是講這些的,智能控制不需要什么基礎(chǔ),有中學(xué)數(shù)學(xué)的集合和對(duì)空間有一點(diǎn)點(diǎn)的了解就足夠了,模糊數(shù)學(xué)的基礎(chǔ)是包含在這門學(xué)科里的。

    三、頂級(jí)專家解讀達(dá)摩院2019十大科技趨勢(shì),算法創(chuàng)新讓AI更智能

    計(jì)算是變革的源頭

    傳統(tǒng)時(shí)代的計(jì)算始終在馮諾伊曼架構(gòu)約束下發(fā)展,但人工智能的到來(lái)正在挑戰(zhàn)馮諾依曼架構(gòu),而摩爾定律也接近失效,新型芯片以及新的計(jì)算機(jī)架構(gòu)已經(jīng)成為整個(gè)行業(yè)研究重心。達(dá)摩院認(rèn)為,計(jì)算體系結(jié)構(gòu)正在被重構(gòu),基于FPGA、ASIC等計(jì)算芯片的異構(gòu)計(jì)算架構(gòu)正在對(duì)以CPU為核心的通用計(jì)算發(fā)起沖擊。

    “通過(guò)推高通用芯片的性能來(lái)征服一切的方式已經(jīng)失效?!?中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員陳天石對(duì)此評(píng)論說(shuō),“學(xué)術(shù)界和工業(yè)界都把目光投向了更加專用的處理器架構(gòu),并且一直在期待新器件引發(fā)的新的架構(gòu)演進(jìn)?!?

    杜克大學(xué)副教授、IEEE Fellow陳怡然也表示,目前學(xué)術(shù)界的研究重心在一些更為革命性的架構(gòu)研究,例如內(nèi)存計(jì)算、非馮諾依曼架構(gòu)、神經(jīng)形態(tài)計(jì)算等。而佛羅里達(dá)大學(xué)杰出教授、IEEE Fellow李濤則指出,計(jì)算體系結(jié)構(gòu)的變革將主導(dǎo)和引領(lǐng)ICT領(lǐng)域的持續(xù)創(chuàng)新和發(fā)展,這將是未來(lái)產(chǎn)業(yè)界的核心競(jìng)爭(zhēng)力。

    在人工智能領(lǐng)域,GPU無(wú)疑是最受企業(yè)以及開(kāi)發(fā)者追捧的芯片。但達(dá)摩院認(rèn)為,數(shù)據(jù)中心的AI訓(xùn)練場(chǎng)景下,計(jì)算和存儲(chǔ)之間數(shù)據(jù)搬移已成為瓶頸,AI專用芯片將挑戰(zhàn)GPU的絕對(duì)統(tǒng)治地位。

    “對(duì)于訓(xùn)練場(chǎng)景來(lái)說(shuō),計(jì)算量要求非常高,需要存儲(chǔ)和處理的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于之前常見(jiàn)的應(yīng)用,AI專用計(jì)算架構(gòu)是最佳選擇?!?清華大學(xué)微納電子系副系主任尹首一對(duì)達(dá)摩院的這一觀點(diǎn)表示認(rèn)可。

    根據(jù)達(dá)摩院的判斷,AI專用芯片的應(yīng)用將成為趨勢(shì)。在2018年的杭州云棲大會(huì)上,阿里巴巴曾宣布首款A(yù)I芯片AliNPU將于2019年應(yīng)用于城市大腦和自動(dòng)駕駛等云端數(shù)據(jù)場(chǎng)景中。陳天石指出,“AI芯片可以靈活高效地支持視覺(jué)、語(yǔ)音和自然語(yǔ)言處理,甚至傳統(tǒng)的機(jī)器學(xué)習(xí)應(yīng)用,將在數(shù)據(jù)中心場(chǎng)景發(fā)揮重要作用?!?/p>

    算法的創(chuàng)新讓 AI 更加智能

    1950年,人工智能之父圖靈提出著名的圖靈測(cè)試用以檢驗(yàn)人工智能能力,即如果有超過(guò)30%的測(cè)試者不能確定被測(cè)試者是人還是機(jī)器人,則認(rèn)為是通過(guò)測(cè)試。

    圖靈提出的猜想可能將會(huì)很快實(shí)現(xiàn)。達(dá)摩院認(rèn)為,在未來(lái),人類可能無(wú)法辨別人工智能生成的語(yǔ)音和真人語(yǔ)音,具備語(yǔ)音交互能力的公共設(shè)施將會(huì)越來(lái)越多,甚至在一些特定對(duì)話測(cè)試中機(jī)器可以通過(guò)圖靈測(cè)試。

    西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院教授謝磊對(duì)此表示,“聲音合成技術(shù)在某些方面已經(jīng)可以媲美人聲,并將會(huì)拉動(dòng)‘耳朵經(jīng)濟(jì)’的爆發(fā),各種‘AI聲優(yōu)’ 將上崗,為大家提供聽(tīng)覺(jué)盛宴。”

    人工智能行業(yè)的迅速發(fā)展與深度學(xué)習(xí)帶來(lái)的突破高度相關(guān),但僅靠深度學(xué)習(xí)要實(shí)現(xiàn)通用人工智能仍然困難重重。達(dá)摩院認(rèn)為,結(jié)合深度學(xué)習(xí)的圖神經(jīng)網(wǎng)絡(luò)將讓機(jī)器成為具備常識(shí)、具有理解、認(rèn)知能力的AI。

    杜克大學(xué)統(tǒng)計(jì)學(xué)院終身教授David Dunson對(duì)此評(píng)論說(shuō),“結(jié)合了深度學(xué)習(xí)的圖計(jì)算方法將實(shí)現(xiàn)推薦系統(tǒng)的變革性改進(jìn),為用戶提供更有趣和更合適的產(chǎn)品,同時(shí)改善整體用戶體驗(yàn)?!?

    過(guò)去兩年,城市大腦成為 社會(huì) 熱詞。達(dá)摩院認(rèn)為,2019年,人工智能將在城市大腦技術(shù)和應(yīng)用的研發(fā)中發(fā)揮更大作用,未來(lái)越來(lái)越多的城市將擁有大腦。

    中國(guó)城市規(guī)劃設(shè)計(jì)院院長(zhǎng)楊保軍認(rèn)為,“城市大腦將不再是單一領(lǐng)域或是單項(xiàng)要素的智慧,而是全局聯(lián)動(dòng)、多源交融的智慧。”同濟(jì)大學(xué)智能交通運(yùn)輸系統(tǒng)研究中心主任楊曉光則表示,“新一代城市智能管理、智能服務(wù)與智能決策將幫助人類最大程度地預(yù)防和綜合治理城市病?!?/p>

    連接萬(wàn)物的 5G 催生更多應(yīng)用場(chǎng)景

    過(guò)去幾年,5G的熱度并不遜于人工智能。5G構(gòu)建的不僅是一張人聯(lián)網(wǎng),它將會(huì)成為連接萬(wàn)物的紐帶。

    達(dá)摩院在此次十大 科技 趨勢(shì)中提到,5G將催生超高清視頻、AR/VR等場(chǎng)景的成熟。中國(guó)信通院副總工、工信部信息通信經(jīng)濟(jì)專家委員會(huì)秘書(shū)長(zhǎng)陳金橋?qū)Υ嗽u(píng)論說(shuō),“5G將掀開(kāi)數(shù)據(jù)資源作為生產(chǎn)力的大幕,一個(gè)基于泛在高速連接的智能 社會(huì) 必將形成。”

    車路協(xié)同將會(huì)是5G與人工智能兩大技術(shù)交融的典型場(chǎng)景。達(dá)摩院認(rèn)為,車路協(xié)同技術(shù)路線會(huì)加快無(wú)人駕駛的到來(lái),并且將在固定線路公交、無(wú)人配送、園區(qū)微循環(huán)等商用場(chǎng)景將快速落地。

    單純依靠“單車智能”的方式革新 汽車 存在諸多限制,例如傳感器部署的成本高,感知系統(tǒng)以及決策系統(tǒng)的可靠性低等?!败嚶穮f(xié)同的優(yōu)勢(shì)在于,可降低單車系統(tǒng)在定位方案部署上的成本,并且可以實(shí)現(xiàn)更好的感知與決策?!?中科院自動(dòng)化研究所研究員趙冬斌如此表示。

    四、生活中的人工智能之搜索和推薦算法

    姓名:陳心語(yǔ)  學(xué)號(hào):21009102266 書(shū)院:海棠1號(hào)書(shū)院

    轉(zhuǎn)自: 人工智能在搜索中的應(yīng)用_u014033218的專欄-CSDN博客

    人工智能在搜索的應(yīng)用和實(shí)踐_qq_40954115的博客-CSDN博客

    【嵌牛導(dǎo)讀】日常生活中的搜索和推薦算法也與人工智能有所關(guān)聯(lián),讓我們一起來(lái)看看吧!

    【嵌牛鼻子】人工智能運(yùn)用于搜索和推薦算法。

    【嵌牛提問(wèn)】人工智能在搜索和推薦算法中有什么運(yùn)用呢?

    【嵌牛正文】

    智能交互

    智能交互有三個(gè)方面的這部分組成,第一個(gè)就是Query推薦,這是比較古老的課題;第二個(gè)做智能導(dǎo)購(gòu),這是現(xiàn)在正在做的一個(gè)原形,后面我會(huì)講為什么做智能導(dǎo)購(gòu);第三個(gè)內(nèi)容的展示和個(gè)性化的創(chuàng)意。就是說(shuō)你把商品怎么展示給用戶,也是我們認(rèn)為是交互的一部分。

    第一個(gè)是Query推薦,這個(gè)問(wèn)題怎么來(lái)抽象呢?Query推薦是一個(gè)用戶當(dāng)前Query下面我們?cè)趺赐扑]其它Query,這是我們相關(guān)搜索一樣的。我們推薦這樣的一個(gè)Query以后,如果用戶一旦點(diǎn)了其中的一個(gè)Query,用戶的狀態(tài)就會(huì)發(fā)生變化,從當(dāng)前的Query跳到另外一個(gè)Query,這是用戶狀態(tài)的變化。第二個(gè)就是說(shuō)我們?cè)趺丛u(píng)價(jià)我們推薦的Query的好壞,它由幾部分組成,一個(gè)Query有沒(méi)有被點(diǎn),第二個(gè)就是說(shuō)推薦Query里面,它的SRP頁(yè)會(huì)不會(huì)點(diǎn),因?yàn)镼uery推薦本質(zhì)上不是Query推薦做的最好就是最好的,它是說(shuō)最終要在搜索SRP用戶有沒(méi)有買,有沒(méi)有點(diǎn)擊,這才是做的好的,這是第二個(gè)收益。還有一個(gè)更加間接的,通過(guò)Query推,這個(gè)狀態(tài)轉(zhuǎn)到下一個(gè)狀態(tài)以后,這個(gè)里面還會(huì)推其它Query,還會(huì)有其它點(diǎn)擊,這個(gè)時(shí)候也是個(gè)間接推薦。如果我不推Query就不能到這個(gè)狀態(tài),不到狀態(tài)不會(huì)有這個(gè)Query,不會(huì)有這個(gè)收益。我們了解,這就是典型的一個(gè)馬爾科夫決策過(guò)程,我們是用強(qiáng)化學(xué)習(xí)來(lái)做的,Actions就是我們的Query list,根據(jù)用戶和當(dāng)前Query推薦其他Query,狀態(tài)就是User + Query,收益就是包括推薦Query擊,還有一個(gè)間接收益,間接收益通過(guò)bellman 公式可以算出來(lái),這就是一個(gè)DQN的強(qiáng)化學(xué)習(xí)項(xiàng)目。

    智能導(dǎo)購(gòu)

    現(xiàn)在的搜索呈現(xiàn)的問(wèn)題就是說(shuō),如果去看搜索的Query都是一些品類詞、品牌詞、型號(hào)詞或者屬性詞。假定用戶他知道買什么再來(lái)搜索搜,但是有各很大的東西用戶不知道買什么嗎?智能導(dǎo)購(gòu)就是做做一個(gè)類似智能導(dǎo)購(gòu)機(jī)器人的產(chǎn)品,引導(dǎo)用戶怎么搜,用戶也可以主動(dòng)問(wèn),獲取知識(shí)或購(gòu)物經(jīng)驗(yàn)。這是后臺(tái)的算法的一個(gè)原形,不久后會(huì)上線。

    智能內(nèi)容

    因?yàn)樘詫毜纳唐?,賣家為了適應(yīng)我們的引擎,做了大量的SEO,里面都是羅列熱門的關(guān)健詞,導(dǎo)致問(wèn)題淘寶的標(biāo)題沒(méi)什么差異,都寫的差不多,看標(biāo)題也不知道什么東西,或者知道但里面沒(méi)有很多特色的內(nèi)容。我們做智能內(nèi)容很重要的出發(fā)點(diǎn)是怎么從商品的評(píng)價(jià)、詳情頁(yè)、屬性里面挖出一些比較有賣點(diǎn),或者商品比較有特色的東西展示給用戶,讓用戶更好的了解商品,這是第一個(gè)。第二個(gè)淘寶上面還有類似商品聚合的,比如清單,生成一個(gè)清單,怎么給清單生成一個(gè)比較好的導(dǎo)入的描述,讓用戶描述這個(gè)清單干什么。這里面主要做了這兩個(gè)事情。具體怎么做的?一個(gè)會(huì)生成一些Topic,比如行業(yè)運(yùn)營(yíng)加上我們挖的一些點(diǎn),比如像手機(jī)一般大家關(guān)注點(diǎn)會(huì)是手機(jī)的性價(jià)比,拍照是不是清晰,還有速度是不是快,是不是發(fā)熱什么的,這是用戶關(guān)注的興趣點(diǎn)。然后它會(huì)根據(jù)這個(gè)商品會(huì)選擇一個(gè)興趣點(diǎn),通過(guò)Seq2seq生成短文本。

    語(yǔ)義搜索

    我們的商品屬性基本上是比較標(biāo)準(zhǔn)化的,因?yàn)檫@里淘寶有一個(gè)這樣的商品庫(kù),非標(biāo)準(zhǔn)化的內(nèi)容是沒(méi)法上傳的。導(dǎo)致的問(wèn)題是我們的商品內(nèi)容相對(duì)來(lái)說(shuō)是比較規(guī)范化的,但是用戶的輸入的Query不是這樣的,比如我這里舉一些例子,比如一個(gè)新品有各種表達(dá),2017新品,2017冬季新品,是吧?新品,有很多的表達(dá)。所以就是從從用戶的需求跟商品的內(nèi)容,就存在了一個(gè)語(yǔ)義的Gap。還有我們經(jīng)常舉例,比如三口之家用的電飯鍋,很多這種語(yǔ)義的問(wèn)題,這個(gè)語(yǔ)義從語(yǔ)義角度解決語(yǔ)義Match的事情。

    大概會(huì)有這么幾個(gè)方面。比如一個(gè)就是意圖的理解,還有意圖的Mapping,比如大容量冰箱,首先知道大的是跟冰箱的容量相關(guān)的,冰箱是個(gè)類目,最后要Mapping到人的冰箱,把‘大’改寫成一個(gè)容量大于多少升,類目是冰箱這樣才能夠比較好的解決我們這個(gè)搜索的這個(gè)召回的問(wèn)題。 第二個(gè)語(yǔ)義理解,這里面包括Query和商品都要做語(yǔ)義理解,比如通過(guò)image tagging計(jì)算從圖片里面抽取很多文本的語(yǔ)義標(biāo)簽補(bǔ)充到商品文本索引中。 第三個(gè)就是現(xiàn)在有這個(gè)端到端的深度學(xué)習(xí)技術(shù)來(lái)直接學(xué)Query和商品的Similarity,通過(guò)端到端的深度學(xué)習(xí)技術(shù)來(lái)做語(yǔ)義的召回和語(yǔ)義的相關(guān)性。

    智能匹配

    主要就是講個(gè)性化,做個(gè)性化的首要就是個(gè)性化數(shù)據(jù)。個(gè)性化本質(zhì)上就是說(shuō)以用戶為中心構(gòu)建用戶的標(biāo)簽,用戶的行為,還有用戶的偏好,再通過(guò)這些數(shù)據(jù)找到,去Match到商品,比如說(shuō)你看過(guò)相似商品,典型的協(xié)同過(guò)濾,還有你偏好的品牌的其它商品。那就是基于這些經(jīng)歷了一個(gè)以用戶為中心的電商圖譜,這里面還加了一些輔助的數(shù)據(jù),比如商品的相似度,店鋪之間的相似度,這樣構(gòu)建了我們這樣的叫電商圖譜。

    個(gè)性化召回與向量化召回

    召回是這樣的,首先從咱們的電商圖譜里取出用戶的信息,包括比如說(shuō)年齡性別,還有當(dāng)?shù)販囟仁嵌嗌?,還有行為足跡等等之類的,社交現(xiàn)在沒(méi)用了,因?yàn)檫@是幾年前社交特別火,什么都要摻和一下,其實(shí)社交,信息的社交到電商其實(shí)風(fēng)馬牛不相及的領(lǐng)域,沒(méi)有任何價(jià)值。所以現(xiàn)在好友這東西幾乎沒(méi)有用。因?yàn)椴煌琎uery中,用戶信息重要性是不一樣的,我們根據(jù)上下文會(huì)做用戶信息的篩選或者排序,會(huì)找出比較重要的信息做個(gè)性化召回。以上是淘寶商品索引結(jié)構(gòu),傳統(tǒng)的搜索關(guān)鍵字是通過(guò)搜索關(guān)鍵字召回,而個(gè)性化商品索引,除了Query還會(huì)有商品簇,簇與簇之間的關(guān)系,品牌店鋪等等之類的,會(huì)加很多個(gè)性化的特征做召回,通過(guò)這種帶的好處是召回的結(jié)果跟用戶是直接相關(guān)的,就召回這一步帶來(lái)個(gè)性化。

    但是這種基于行為召回還是存在一個(gè)問(wèn)題的。最重要的問(wèn)題它的泛化能力會(huì)比較差。最典型的比如說(shuō)你通過(guò)協(xié)同過(guò)濾來(lái)做,如果兩個(gè)商品,沒(méi)有用戶同時(shí)看過(guò)的話,這兩個(gè)商品你認(rèn)為他們相似度是零,這個(gè)結(jié)論是錯(cuò)的,但是如果通過(guò)協(xié)同過(guò)濾就有這個(gè)問(wèn)題。我們今年實(shí)現(xiàn)了向量化召回,包括兩步:一個(gè)是Similarity learning,通過(guò)這個(gè)深度學(xué)習(xí)做端到端的Similarity learning,就會(huì)把這個(gè)我們的User 和Item會(huì)變成一個(gè)向量;第二步就是做向量化召回,比如層次聚類,隨機(jī)游走,learning to hash等,這樣的話就是說(shuō)會(huì)極大的提升召回的深度。

    個(gè)性化工作

    在個(gè)性化領(lǐng)域其實(shí)最重要的一個(gè)核心的問(wèn)題就是怎么去理解用戶,怎么感知用戶和預(yù)測(cè)用戶行為及偏好。

    首先是數(shù)據(jù),用戶在淘寶有兩個(gè)中類型重要的基本信息:一個(gè)是用戶標(biāo)簽,比如年齡、性別、職業(yè)等;第二是用戶足跡,比如 點(diǎn)過(guò),買過(guò)的商品,店鋪等;

    其次是用戶感知要和搜索上下文相關(guān),即這個(gè)用戶的表征和要用戶搜索意圖相關(guān);

    第三是搜索有很多差異化的任務(wù),比如用戶消費(fèi)能力的預(yù)估, User到Item的CTR預(yù)估和用戶購(gòu)物狀態(tài)預(yù)估等,是為每個(gè)任務(wù)做個(gè)端到端的深度學(xué)習(xí)模型還是用統(tǒng)一的用戶表征來(lái)完成不同的Task?如果每一個(gè)任務(wù)都做端到端深度學(xué)習(xí)會(huì)有很多問(wèn)題,比如離線和在線的性能開(kāi)銷會(huì)大很多,或部分任務(wù)樣本太少。

    如圖是用戶感知深度模型,輸入X是用戶的點(diǎn)擊行為序列,下一步是embedding,embedding完以后,通過(guò)LSTM把用戶行為序列做embedding,因?yàn)樵谒阉饔脩舾兄蚎uery相關(guān),所以加入query 的 attention層,選擇和當(dāng)前query有關(guān)系的行為,表征完是Multi-task learning 網(wǎng)絡(luò)。整個(gè)這個(gè)網(wǎng)絡(luò)的參數(shù)大概有一百億個(gè)參數(shù),我在雙11我們還實(shí)現(xiàn)了在線學(xué)習(xí)。

    算法包括智能交互、語(yǔ)義搜索、智能匹配和搜索策略四個(gè)方向。

    智能交互

    商品搜索就是帶交互的商品推薦,用戶通過(guò)關(guān)鍵字輸入搜索意圖,引擎返回和搜索意圖匹配的個(gè)性化推薦結(jié)果,好的交互技術(shù)能夠幫助到用戶更好的使用搜索引擎,目前搜索的交互主要是主動(dòng)關(guān)鍵字輸入和關(guān)鍵字推薦,比如搜索框中的默認(rèn)查詢?cè)~和搜索結(jié)果中的文字鏈等,推薦引擎根據(jù)用戶搜索歷史、上下文、行為和狀態(tài)推薦關(guān)鍵字。和商品推薦的區(qū)別是,關(guān)鍵字推薦是搜索鏈路的中間環(huán)節(jié),關(guān)鍵字推薦的收益除了關(guān)鍵字的點(diǎn)擊行為外,還需要考慮對(duì)整個(gè)購(gòu)物鏈路的影響,包括在推薦關(guān)鍵字的后續(xù)行為中是否有商品點(diǎn)擊、加購(gòu)和成交或跳轉(zhuǎn)到另外一個(gè)關(guān)鍵字的后繼行為,這是一個(gè)典型的強(qiáng)化學(xué)習(xí)問(wèn)題,action 是推薦的關(guān)鍵字候選集合,狀態(tài)是用戶當(dāng)前搜索關(guān)鍵詞、上下文等,收益是搜索引導(dǎo)的成交。除了被動(dòng)的關(guān)鍵字推薦,我們也在思考搜索中更加主動(dòng)的交互方式,能夠做到像導(dǎo)購(gòu)員一樣的雙向互動(dòng),主動(dòng)詢問(wèn)用戶需求,挑選個(gè)性化的商品和給出個(gè)性化的推薦理由,目前我們已經(jīng)在做智能導(dǎo)購(gòu)和智能內(nèi)容方向的技術(shù)原型及論證,智能導(dǎo)購(gòu)在技術(shù)上主要是借鑒對(duì)話系統(tǒng),通過(guò)引導(dǎo)用戶和引擎對(duì)話與關(guān)鍵字推薦方式互為補(bǔ)充,包括自然語(yǔ)言理解,對(duì)話策略,對(duì)話生成,知識(shí)推理、知識(shí)問(wèn)答和商品搜索等模塊,功能主要包括:a. 根據(jù)用戶搜索上下文生成引導(dǎo)用戶主動(dòng)交互的文本,比如搜索“奶粉”時(shí),會(huì)生成“您寶寶多大?0~6個(gè)月,6個(gè)月到1歲….”引導(dǎo)文案,提示用戶細(xì)化搜索意圖,如果用戶輸入“3個(gè)月”后,會(huì)召回相應(yīng)段位的奶粉,并在后續(xù)的搜索中會(huì)記住對(duì)話狀態(tài)“3個(gè)月”寶寶和提示用戶“以下是適合3個(gè)月寶寶的奶粉”,b. 知識(shí)導(dǎo)購(gòu),包含提高售前知識(shí)問(wèn)答或知識(shí)提示,比如“3個(gè)月寶寶吃什么奶粉” 回答“1段”,目前對(duì)話技術(shù)還不太成熟,尤其是在多輪對(duì)話狀態(tài)跟蹤、知識(shí)問(wèn)答和自動(dòng)評(píng)價(jià)幾個(gè)方面,但隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和生成對(duì)抗學(xué)習(xí)等技術(shù)在NLP、對(duì)話策略、閱讀理解等領(lǐng)域的應(yīng)用,越來(lái)越多的訓(xùn)練數(shù)據(jù)和應(yīng)用場(chǎng)景,domain specific 的對(duì)話技術(shù)未來(lái)幾年應(yīng)該會(huì)突飛猛進(jìn);智能內(nèi)容生成,包括生成或輔助人工生成商品和清單的“賣點(diǎn)”,短標(biāo)題和文本摘要等,讓淘寶商品表達(dá)更加個(gè)性化和多元化。

    語(yǔ)義搜索

    語(yǔ)義搜索主要是解決關(guān)鍵字和商品內(nèi)容之間的語(yǔ)義鴻溝,比如搜索“2~3周歲寶寶外套”,如果按照關(guān)鍵字匹配召回結(jié)果會(huì)遠(yuǎn)小于實(shí)際語(yǔ)義匹配的商品。語(yǔ)義搜索的范圍主要包括:a. query tagging和改寫,比如新品,年齡,尺碼,店鋪名,屬性,類目等搜索意圖識(shí)別和歸一化,query tagging模型是用的經(jīng)典的序列標(biāo)注模型 bi-lstm + CRF,而標(biāo)簽分類(歸一化) 作為模型另外一個(gè)任務(wù),將序列標(biāo)注和分類融合在一起學(xué)習(xí);b. query 改寫,主要是計(jì)算query之間相似度,把一個(gè)query改寫成多個(gè)語(yǔ)義相似的query,通常做法是先用不同改寫策略生成改寫候選query集合,比如詞替換、向量化后top k、點(diǎn)擊商品相似度等,然后在用ltr對(duì)后續(xù)集合排序找出合適的改寫集合,模型設(shè)計(jì)和訓(xùn)練相對(duì)簡(jiǎn)單,比較難的是如何構(gòu)建高質(zhì)量的訓(xùn)練樣本集合,線上我們用bandit 的方法探測(cè)部分query 改寫結(jié)果的優(yōu)劣,離線則用規(guī)則和生成對(duì)抗網(wǎng)絡(luò)生成一批質(zhì)量較高的樣本; c. 商品內(nèi)容理解和語(yǔ)義標(biāo)簽,通過(guò)商品圖片,詳情頁(yè),評(píng)價(jià)和同義詞,上下位詞等給商品打標(biāo)簽或擴(kuò)充商品索引內(nèi)容,比如用 image tagging技術(shù)生成圖片的文本標(biāo)簽豐富商品內(nèi)容,或者更進(jìn)一步用直接用圖片向量和文本向量融合,實(shí)現(xiàn)富媒體的檢索和查詢;d. 語(yǔ)義匹配,經(jīng)典的DSSM 模型技術(shù)把query 和商品變成向量,用向量?jī)?nèi)積表達(dá)語(yǔ)義相似度,在問(wèn)答或閱讀理解中大量用到多層LSTM + attention 做語(yǔ)義匹配,同樣高質(zhì)量樣本,特別是高質(zhì)量負(fù)樣本很大程度上決定了模型的質(zhì)量,我們沒(méi)有采樣效率很低的隨機(jī)負(fù)采樣,而是基于電商知識(shí)圖譜,通過(guò)生成字面相似但不相關(guān)的query及相關(guān)文檔的方法生成負(fù)樣本。從上面可以看到query tagging、query相似度、語(yǔ)義匹配和語(yǔ)義相關(guān)性是多個(gè)目標(biāo)不同但關(guān)聯(lián)程度非常高的任務(wù),下一步我們計(jì)劃用統(tǒng)一的語(yǔ)義計(jì)算框架支持不同的語(yǔ)義計(jì)算任務(wù),具體包括1. 開(kāi)發(fā)基于商品內(nèi)容的商品表征學(xué)習(xí)框架,為商品內(nèi)容理解,內(nèi)容生成,商品召回和相關(guān)性提供統(tǒng)一的商品表征學(xué)習(xí)框架,重點(diǎn)包括商品標(biāo)題,屬性,詳情頁(yè)和評(píng)價(jià)等文本信息抽取,圖像特征抽取和多模信號(hào)融合;2. query 表征學(xué)習(xí)框架,為query 類目預(yù)測(cè),query改寫,query 推薦等提供統(tǒng)一的表征學(xué)習(xí)框架,重點(diǎn)通過(guò)多個(gè)query 相似任務(wù)訓(xùn)練統(tǒng)一的query表征學(xué)習(xí)模型;3. 語(yǔ)義召回,語(yǔ)義相關(guān)性等業(yè)務(wù)應(yīng)用模型框架。語(yǔ)義搜索除了增加搜索結(jié)果相關(guān)性,提升用戶體驗(yàn)外,也可以一定程度上遏制淘寶商品標(biāo)題堆砌熱門關(guān)鍵詞的問(wèn)題。

    智能匹配

    這里主要是指?jìng)€(gè)性化和排序。內(nèi)容包括:a. ibrain (深度用戶感知網(wǎng)絡(luò)),搜索或推薦中個(gè)性化的重點(diǎn)是用戶的理解與表達(dá),基于淘寶的用戶畫像靜態(tài)特征和用戶行為動(dòng)態(tài)特征,我們基于multi-modals learning、multi-task representation learning以及LSTM的相關(guān)技術(shù),從海量用戶行為日志中直接學(xué)習(xí)用戶的通用表達(dá),該學(xué)習(xí)方法善于“總結(jié)經(jīng)驗(yàn)”、“觸類旁通”,使得到的用戶表達(dá)更基礎(chǔ)且更全面,能夠直接用于用戶行為識(shí)別、偏好預(yù)估、個(gè)性化召回、個(gè)性化排序等任務(wù),在搜索、推薦和廣告等個(gè)性化業(yè)務(wù)中有廣泛的應(yīng)用場(chǎng)景,感知網(wǎng)絡(luò)超過(guò)10B個(gè)參數(shù),已經(jīng)學(xué)習(xí)了幾千億次的用戶行為,并且會(huì)保持不間斷的增量學(xué)習(xí)越來(lái)越聰明; b. 多模學(xué)習(xí),淘寶商品有文本、圖像、標(biāo)簽、id 、品牌、類目、店鋪及統(tǒng)計(jì)特征,這些特征彼此有一定程度的冗余和互補(bǔ),我們利用多模學(xué)習(xí)通過(guò)多模聯(lián)合學(xué)習(xí)方法把多維度特征融合在一起形成統(tǒng)一的商品標(biāo)準(zhǔn),并多模聯(lián)合學(xué)習(xí)中引入self-attention實(shí)現(xiàn)特征維度在不同場(chǎng)景下的差異,比如女裝下圖片特征比較重要,3C下文本比較重要等;c. deepfm,相對(duì)wide & deep 模型,deepfm 增加了特征組合能力,基于先驗(yàn)知識(shí)的組合特征能夠應(yīng)用到深度學(xué)習(xí)模型中,提升模型預(yù)測(cè)精度;d. 在線深度排序模型,由于行為類型和商品重要性差異,每個(gè)樣本學(xué)習(xí)權(quán)重不同,通過(guò)樣本池對(duì)大權(quán)重樣本重復(fù)copy分批學(xué)習(xí),有效的提升了模型學(xué)習(xí)穩(wěn)定性,同時(shí)通過(guò)融合用戶狀態(tài)深度ltr模型實(shí)現(xiàn)了千人千面的排序模型學(xué)習(xí);e. 全局排序,ltr 只對(duì)單個(gè)文檔打分然后按照l(shuí)tr分?jǐn)?shù)和打散規(guī)則排序,容易導(dǎo)致搜索結(jié)果同質(zhì)化,影響總頁(yè)效率,全局排序通過(guò)已知排序結(jié)果做為上下文預(yù)測(cè)下一個(gè)位置的商品點(diǎn)擊概率,有效提升了總頁(yè)排序效率;f. 另外工程還實(shí)現(xiàn)了基于用戶和商品向量的向量召回引擎,相對(duì)倒排索引,向量化召回泛化能力更強(qiáng),對(duì)語(yǔ)義搜索和提高個(gè)性化匹配深度是非常有價(jià)值的。以上實(shí)現(xiàn)了搜索從召回、排序特征、排序模型、個(gè)性化和重排的深度學(xué)習(xí)升級(jí),在雙11無(wú)線商品搜索中帶來(lái)超過(guò)10% (AB-Test)的搜索指標(biāo)提升。

    智能決策

    搜索中個(gè)性化產(chǎn)品都是成交最大化,導(dǎo)致的問(wèn)題是搜索結(jié)果趨同,浪費(fèi)曝光,今年做的一個(gè)重要工作是利用多智能體協(xié)同學(xué)習(xí)技術(shù),實(shí)現(xiàn)了搜索多個(gè)異構(gòu)場(chǎng)景間的環(huán)境感知、場(chǎng)景通信、單獨(dú)決策和聯(lián)合學(xué)習(xí),實(shí)現(xiàn)聯(lián)合收益最大化,而不是此消彼長(zhǎng),在今年雙11中聯(lián)合優(yōu)化版本帶來(lái)的店鋪內(nèi)和無(wú)線搜索綜合指標(biāo)提升12% (AB-Test),比非聯(lián)合優(yōu)化版本高3% (AB-Test)。

    性能優(yōu)化

    在深度學(xué)習(xí)剛起步的時(shí)候,我們意識(shí)到深度模型inference 性能會(huì)是一個(gè)瓶頸,所以在這方面做了大量的調(diào)研和實(shí)驗(yàn),包括模型壓縮(剪枝),低秩分解,量化和二值網(wǎng)絡(luò),由于缺少相應(yīng)的指令集和硬件支持,最終只在個(gè)別場(chǎng)景下上線,期待支持低精度矩陣計(jì)算和稀疏矩陣計(jì)算的硬件早日出現(xiàn)。

    未來(lái)計(jì)劃

    通用用戶表征學(xué)習(xí)。前面介紹的DUPN 是一個(gè)非常不錯(cuò)的用戶表征學(xué)習(xí)模型,但基于query 的attention 只適合搜索,同時(shí)缺少基于日志來(lái)源的attention,難以推廣到其他業(yè)務(wù),在思考做一個(gè)能夠適合多個(gè)業(yè)務(wù)場(chǎng)景的用戶表征模型,非搜索業(yè)務(wù)做些簡(jiǎn)單fine tuning 就能取得比較好的效果;同時(shí)用戶購(gòu)物偏好受季節(jié)和周期等影響,時(shí)間跨度非常大,最近K個(gè)行為序列假設(shè)太簡(jiǎn)單,我們?cè)谒伎寄軌蜃鰈ife-long learning 的模型,能夠?qū)W習(xí)用戶過(guò)去幾年的行為序列;搜索鏈路聯(lián)合優(yōu)化。從用戶進(jìn)入搜索到離開(kāi)搜索鏈路中的整體優(yōu)化,比如 搜索前的query 引導(dǎo)(底紋),搜索中的商品和內(nèi)容排序,搜索后的 query推薦(錦囊)等場(chǎng)景;跨場(chǎng)景聯(lián)合優(yōu)化。今年搜索內(nèi)部主搜索和店鋪內(nèi)搜索聯(lián)合優(yōu)化取得了很好的結(jié)果,未來(lái)希望能夠拓展在更多大流量場(chǎng)景,提高手淘的整體購(gòu)物體驗(yàn);多目標(biāo)聯(lián)合優(yōu)化。搜索除了成交外,還需要承擔(dān)賣家多樣性,流量公平性,流量商業(yè)化等居多平臺(tái)和賣家的訴求,搜索產(chǎn)品中除了商品搜索外還有“穹頂”,“主題搜索”,“錦囊”,“內(nèi)容搜索”等非商品搜索內(nèi)容,不同搜索目標(biāo)和不同內(nèi)容(物種)之間的聯(lián)合優(yōu)化未來(lái)很值得深挖。

    以上就是關(guān)于人工智能十大算法相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。


    推薦閱讀:

    人工服務(wù)電話24小時(shí)(百度24小時(shí)人工客服電話)

    人工智能聊天工具ChatGPT(人工智能聊天app)

    人工智能不會(huì)取代的行業(yè)(人工智能不會(huì)取代的行業(yè)是)

    直播運(yùn)營(yíng)的崗位(直播運(yùn)營(yíng)的崗位要求)

    上海庭院景觀設(shè)計(jì)效果圖(上海庭院景觀設(shè)計(jì)效果圖片)