正文

openai首席技術(shù)官（it首席技術(shù)官）

發(fā)布時間：2023-03-13 22:31:42 稿源：創(chuàng)意嶺閱讀： 144 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于openai首席技術(shù)官的問題，以下是小編對此問題的歸納整理，讓我們一起來看看吧。

ChatGPT國內(nèi)免費在線使用，一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

只需要輸入關(guān)鍵詞，就能返回你想要的內(nèi)容，越精準，寫出的就越詳細，有微信小程序端、在線網(wǎng)頁版、PC客戶端

官網(wǎng)：https://ai.de1919.com

本文目錄:

1、馬斯克躋身全球第四大富豪，旗下都有哪些公司？
2、馬斯克的交易
3、openai什么時候可以中文的
4、alphago是什么語言開發(fā)的

openai首席技術(shù)官（it首席技術(shù)官）

一、馬斯克躋身全球第四大富豪，旗下都有哪些公司？

1、SpaceX

2020 年 5 月 30 日，有史以來第一次，一家私人商業(yè)航空航天公司將宇航員送入地球太空軌道。將 NASA 宇航員 Robert Behnken 和 Douglas Hurley 送入太空的火箭就是馬斯克旗下的 spaceX 的獵鷹 9 號，搭載宇航員的"龍"飛船也是出自 spaceX。這是馬斯克火星殖民野心的一部分。

openai首席技術(shù)官（it首席技術(shù)官）

2、The Boring Company

該公司的最終目標是在主要城市建立隧道網(wǎng)絡(luò)，以緩解地面交通。該公司在其網(wǎng)站上辯稱，隧道是城市的一個很好的解決方案。

3、Neuralink

你能想象有一天，電影《黑客帝國》中的腦接口儀器會實現(xiàn)，馬斯克曾宣稱，腦鏈接口可以讓人的大腦類似電腦硬件一樣，擴展人的神經(jīng)系統(tǒng)。

4、OpenAI

OpenAI 是特斯拉自動駕駛系統(tǒng)，以及腦鏈接口的擴展。

5、特斯拉

特斯拉甚至超過了豐田，成為市值最大的汽車制造公司，也是新世紀以來成長最快的制造業(yè)公司；也許特斯拉在中國上海、德國柏林等都已經(jīng)有新的超級工廠的規(guī)劃，旗下電動汽車也成為了世界各地的明星汽車產(chǎn)品。

二、馬斯克的交易

轉(zhuǎn)：Aliens On Earth Elon Musk Has His Doubts

作為Space X的首席執(zhí)行官和創(chuàng)始人，埃隆·馬斯克完全知道外星人是否存在（他之前聲稱是外星人創(chuàng)造了金字塔）。Space X是第一家發(fā)射宇宙飛船抵達國際空間站并將人類送上太空的私營公司。最近在喬·羅根博客的采訪中，羅根問他是否有外星生命體存在，并且正在訪問地球時。馬斯克搖了搖頭，回答說：“不，據(jù)我所知，沒有直接證據(jù)表明地球上有外星生命。如果外星生物在地球上，那么多擁有iPhone的人為什么沒有任何照片證據(jù)？五角大樓和中央情報局公布的UFO是模糊的黑白畫面視頻。這句話的意思是，目前還不清楚UFO是否來自外星?！?/p>

除了擔任Space X和特斯拉公司的首席執(zhí)行官之外，馬斯克還是開發(fā)腦機接口的Neuralink和開發(fā)下一代人工智能的OpenAI的聯(lián)合創(chuàng)始人。同時，馬斯克也是鉆探公司的首席執(zhí)行官，該公司負責鉆探地下運輸隧道，所有這些都讓馬斯克成為了“世界上最富有的人”。

人們很容易就能找到那些相信外星生命存在的人，不管他們是否訪問過地球。大多數(shù)主流科學家和天文學家都同意這一點。

大家有沒有想過，一家高調(diào)的太空運輸公司，執(zhí)著于過時的火箭推進技術(shù)。這關(guān)于深層國家和陰謀集團對未來的邪惡計劃，所以馬斯克當然會支持深層國家掩蓋大量外星種族存在的證據(jù)，那些秘密團體的特工們正在不斷的與這些種族互動。自1947年CIA和MJ 12成立以來，DS一直在壓制外星人的存在和他們的先進技術(shù)不受地球人的影響。他們只想獨占這種先進的外星技術(shù)，這樣他們就可以統(tǒng)治地球和我們的太陽系。由于馬斯克和這個由政府、銀行家和實業(yè)家組成的精英陰謀集團的聯(lián)系如此緊密，他擁有幾乎所有的資源和人脈，他一定知道外星生命存在的真相。我的猜測是，他已經(jīng)將自己的股份出售給Deep State，使用過時的火箭推進技術(shù)來維持地球的隔離狀態(tài)和先進科技存在的真相。抵抗運動曾表示，“馬斯克是某個正面SSP派系的名人，他在和光明勢力合作，有可能成為壓縮突破的引導(dǎo)者。但很可惜，他現(xiàn)在已經(jīng)沒有在和光明勢力合作了。他本質(zhì)上是一個被光明會創(chuàng)傷編程控制的好人，他現(xiàn)在與光明會合作并積極配合他們的議程——利用星鏈衛(wèi)星加強隔離地球的電磁能量網(wǎng)格。”

#馬斯克# #spacex# #外星人#[/cp]

三、openai什么時候可以中文的

2022年6月，openai再2022年6月的時候可以中文的，在2015年open AI出現(xiàn)的時候，一直是沒有中文的，但是在2020年的時候，官方宣布準備設(shè)置三種語言。顧大家進行使用。直到2022年六月份正式版出現(xiàn)，已經(jīng)完全可以使用open AI來用中文操作了。

四、alphago是什么語言開發(fā)的

Android以Java為編程語言，使接口到功能，都有層出不窮的變化，其中Activity等同于J2ME的MIDlet，一個 Activity 類（class）負責創(chuàng)建視窗（window），一個活動中的Activity就是在 foreground（前景）模式，背景運行的程序叫做Service。兩者之間.

英語作文human vs alphago

Google's artificial intelligence-driven AlphaGo sofare program will challenge Ke Jie, the world's top professional Go player, at China's Future of Go Summit in May. The prospect of this petition beeen human and artificial intelligence has captured the attention of the Chinese public, where the game was invented more than 2,500 years ago, and driven interest in Google's DeepMind machine learning method that developed AlphaGo.We believe a machine could never replace a person as an adversary in future.It's a cold machine without blood, while we have spiritual power.

怎么看待alphago的這個失誤

谷歌非常有謀略，先讓阿爾法狗連贏三次，奠定勝利的事實，展示人工智能的厲害！讓人恐慌！然后，谷歌讓阿爾法狗輸棋給李世石，以明白無誤的方式告訴恐慌的人們：不要害怕，我們掌控著人工智能的！如果人工智能把人逼上絕路，人工智能產(chǎn)業(yè)就會遭到人們的封殺！谷歌輸一局，緩和局面。

中日韓還有成千上萬圍棋學習者和相關(guān)從業(yè)人員，Google是商業(yè)公司，當然不會把事情做絕，肯定會考量這方面的因素。

比賽結(jié)束，alphago四比一完勝李世石，僅勝利的一局有很多人認為是谷歌為了讓alphago有世界排名而故意輸?shù)囊痪?，因為如果一個棋手一直連勝，是沒有世界排名的，輸了一局才有排名，按照官方發(fā)布目前alphago排名世界第二，中國小將柯杰世界第一。

如何評價AlphaGo的圍棋水平

AlphaGo能夠戰(zhàn)勝李世石的確證明了他是有職業(yè)頂尖的水平，也就是的職業(yè)九段，其計算能力與局部分析能力超越職業(yè)九段！可是，AlphaGo要想拿到職業(yè)冠軍是基本不可能的，因為它不會自主學習，需要輸入對方的棋譜才能占優(yōu)優(yōu)勢。

此外，在局部與大局的判斷上，AlphaGo是有缺陷的，如果是遇到巔峰時期的李昌鎬或是聶老聶衛(wèi)平先生，折現(xiàn)缺點就會被無限放大。

總而言之，現(xiàn)在它的對局還是太少了，需要更多的對局與研究，看不同的棋風與派別對它的勝率的影響，究竟綜合實力是多少，還需要考究！

人工智能的利與弊作文結(jié)尾？

機器人還是不一樣，完全不受外界與情緒的任何干擾，坐下便拼殺起來。

它的芯片經(jīng)歷了十年換代，幾乎對所有圍棋套路了如指掌，面對我的每一步棋，都能識破我的意圖，找到最合適的解決方法，更別提失誤了，而我卻并不急躁，慢慢悠悠，心中早已打好了算盤。

這盤棋下得出奇得慢，半個月，1個月，我也并不著急，AlphaGo作為一個高智商機器人也能準確捕捉到我的所有需求，我們不僅棋下得有條不紊，它更是端茶倒水，冷風熱氣，無微不至。

這棋轉(zhuǎn)眼便下了三個月，我打定主意，心中不急，這AlphaGo作為機器人便更不知著急了，倒是觀眾們耐心早已磨完，他們催促也好，咒罵也罷，我自不動，每日只想一步棋，每日只下一步棋，但我內(nèi)心卻從未平靜。

我等待著機會，更等待著靈感，后來已無人有心再關(guān)注這場比賽，我的心中也越發(fā)平靜了。

直到那一天，我依如往常早早起床，一邊誦讀著道德經(jīng)，一邊在園中散步。

突然，一個靈感穿過我的頭腦，一個陰陽卦象圖轉(zhuǎn)變?yōu)榱艘环灞P，“我若擊殺這個未曾關(guān)注過的棋點，他豈不再無機會？”我哈哈大笑，回到棋盤前，下了這一步我等了許久的棋，不出所料，AlphaGo一籌莫展，投子認輸。

世界轟動，人們重新將關(guān)注點拉到了我身上，我也不過多解釋，手放背后：“道可道，非常道……”我先人一盤棋能下幾個月，參悟世間之道，下的是道，而非棋，這豈是一個機器人能理解的？”從此之后，人們不再挑戰(zhàn)AlphaGo，亦不再過度追求棋中勝負，他們好像也沉靜了下來，回歸了這項運動最本質(zhì)的精髓，思考人生，思考自然，思考世界，找到了心中的那片桃花源。

如何評價柯潔與 AlphaGo 的對決

柯潔經(jīng)歷了英雄般的戰(zhàn)斗后，依然第二局輸給AlphaGo。

最有價值的信息可能來自AlphaGo之父薩比斯，中盤階段他評論說：“不可思議，根據(jù)AlphaGo的評估，柯潔現(xiàn)在下得很完美。

”賽后薩比斯則評論：“這是一場驚心動魄的令人驚奇的比賽，柯潔幾乎把AlphaGo逼到了極限。

”柯潔今天的最大收獲是測出阿法狗的真實水平。

期望這次比賽能夠驗證。

當然它有兩個前提條件，一是柯潔把最好水平發(fā)揮出來，二是AlphaGo能夠經(jīng)受真正的考驗，而不是表面看它只贏一兩個子，實際上后臺勝率顯示根本沒有機會。

前天的第一局，AlphaGo贏了1.5目。

這是一個很小的差距，但柯潔下得談不上多出色，因為從頭到尾他基本沒什么機會。

AlphaGo并不是一個賭徒，能贏100目絕不贏99；它是根據(jù)勝率估算來行棋的，如果贏1目而它認為勝率是100%，就沒必要去下贏100目而勝率只有99%的棋。

所以，第一局柯潔遠遠沒有逼出AlphaGo的真正實力。

昨天AlphaGo方面的消息，認為這次雖然只是一個單機版，但棋力已經(jīng)比去年贏李世石的時候提高了三子。

這是一個挺嚇人的消息，因為它會讓人類棋手覺得，目前這個版本至少比人類強三子以上。

老實講這挺絕望的，三子以上，四子。

那等于徹底宣布人類棋手跟AlphaGo已經(jīng)是天壤之別。

知道，面對一個可以讓四子的對手，這是職業(yè)和業(yè)余的差距，比賽已經(jīng)失去意義，準確地說那叫戲耍。

它可以只贏1目甚至半目，但不說明任何問題，就像柯潔也可以讓只輸半目，但那又能說明什么。

難道會跑大街上喊，快看，柯潔只贏了半目。

誰都知道，柯潔想怎么贏就怎么贏，半目和100目沒差別。

今天的比賽，由于“幾乎把AlphaGo逼到了極限”，雖然不是讓子棋，但基本可以猜出，在人類棋手高水平發(fā)揮的前提下，目前AlphaGo讓不到人類三子，可能是二子或者略多。

掛盤講解的李世石也做出這種判斷：AlphaGo并沒有提升三子的實力，估計大概有二子。

至此，本次比賽人類棋手的目標或者說心愿已經(jīng)達到：測試出AlphaGo的真正實力。

否則，AlphaGo就永遠是上帝般的存在。

知道它強，但不知道它到底多強，所以它就是上帝。

知道，沒有上帝。

如果由于無法評測AI（人工智能）的水平，而把它視為上帝一樣的存在，這不是人類進化或者說發(fā)展的方向。

等于把命運交給未知，哪怕這個未知是人類創(chuàng)造出來的，也有理由疑慮甚至恐懼。

所以要感謝柯杰，不愧圍棋第一人，他今天的勇氣和表現(xiàn)，至少讓暫時可以從外部角度了解到AlphaGo的真實水平。

這是比勝負更重要的事情。

如何評價AlphaGo

題目：《人工智能》3月15日，舉世矚目的“人機大戰(zhàn)”塵埃落定，人工智能“阿爾法狗圍棋”（AlphaGo）以4:1的比分戰(zhàn)勝人類圍棋頂尖高手李世石九段，為世人留下一個不愿接受又不得不接受的事實。

面對“阿爾法狗圍棋”（AlphaGo），有人不服，如中國的超級圍棋新星柯潔九段，就公開向“阿爾法狗圍棋”（AlphaGo）叫板：“你贏不了我！”有人嘆息：人類智慧最后的尊嚴在一只“小狗”面前丟失。

有人甚至悲觀地認為，機器統(tǒng)治人類的時代即將來臨。

其實，所謂人類尊嚴、所謂機器人的統(tǒng)治時代，只是我們一些人的臆想，“阿爾法狗圍棋”（AlphaGo）的勝利，說到底就是一次技術(shù)革命的勝利，是人類對自身的一次超越。

正如西安交通大學副校長、國家重點基礎(chǔ)研究計劃（973）“基于視認知的非結(jié)構(gòu)化信息處理基礎(chǔ)理論與關(guān)鍵技術(shù)”首席科學家徐宗本說的：“任何人工智能技術(shù)的成功一定是當代最新技術(shù)綜合運用的成功，片面說成誰戰(zhàn)勝誰是不公平的，也是無意義的，說人類智慧的最后壁壘被攻破，這都是無稽之談。

”“阿爾法狗圍棋”（AlphaGo）的勝利，背后的最大價值在于，它激勵人們持續(xù)不斷地探索過去人工智能領(lǐng)域一直看似難以實現(xiàn)的人類智能級別。

從這一點上看，人工智能的勝利也有非凡的意義，甚至可以說具有劃時代的意義。

是的，翻開人類歷史，哪一次技術(shù)革命不帶來人類社會翻天覆地的變化？蒸汽機的發(fā)明、使用，使人類從農(nóng)業(yè)手工業(yè)時代進入了工業(yè)社會；電動機的誕生，使人類從工業(yè)社會跨入了現(xiàn)代化。

而以原子能、電子計算機、空間技術(shù)和生物工程的發(fā)明與應(yīng)用為主要標志的信息技術(shù)革命，更讓人類從此進入了自動化、信息化時代。

每一次技術(shù)革命，伴隨的都是生產(chǎn)力的發(fā)展和人類自身的解放。

“阿爾法狗圍棋”（AlphaGo）的勝利，是不是會掀起又一次技術(shù)革命，我們還需拭目以待。

然而，人工智能的進步，卻可以讓我們展望到人類美妙無比的前景。

我們似乎可以看到，不久的將來，到處都是機器人在人們的指令下為人們服務(wù)；我們似乎可以看到，那些對于目前醫(yī)術(shù)來說幾乎無解的人類大腦和神經(jīng)疾病，如自閉癥、老年癡呆癥這樣的國際醫(yī)學難題，隨著人工智能的進步，一切都會迎刃而解；我們似乎可以看到，有了人工智能的協(xié)助，人類真正步入了大同的理想社會。

是的，“阿爾法狗圍棋”（AlphaGo）的勝利，是人類的智慧向前邁出的又一步，有了這一步，我們的世界將更加美好。

當然，面對這些進步，我們不能只是圍觀、娛樂和敬仰，我們應(yīng)該用我們的智慧，去促成人工智能更大的進步！

AlphaGo是什么谷歌AlphaGo全解讀

AlphaGo一般指阿爾法圍棋阿爾法圍棋（AlphaGo）是第一個擊敗人類職業(yè)圍棋選手、第一個戰(zhàn)勝圍棋世界冠軍的人工智能程序。

其主要工作原理是“深度學習”。

阿爾法圍棋（AlphaGo）是一款圍棋人工智能程序。

其主要工作原理是“深度學習”。

“深度學習”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。

一層神經(jīng)網(wǎng)絡(luò)會把大量矩陣數(shù)字作為輸入，通過非線性激活方法取權(quán)重，再產(chǎn)生另一個數(shù)據(jù)集合作為輸出。

這就像生物神經(jīng)大腦的工作機理一樣，通過合適的矩陣數(shù)量，多層組織鏈接一起，形成神經(jīng)網(wǎng)絡(luò)“大腦”進行精準復(fù)雜的處理，就像人們識別物體標注圖片一樣。

對于最強AlphaGo Zero如何煉成的真心話,都在這里

最強AlphaGo Zero怎樣煉成剛剛，Deepmind在Reddit的Machine Learning板塊舉辦了在線答疑活動AMA,Deepmind強化學習組負責人David Silver和其同事熱情地回答了網(wǎng)友們提出的各種問題。

由于在AMA前一天Deepmind剛剛發(fā)表了《Mastering the game of Go without human knowledge》（不使用人類知識掌握圍棋）的論文，相關(guān)的提問和討論也異常熱烈。

什么是AMA?AMA(Ask Me Anything)是由Reddit的特色欄目，你也可以將其理解為在線的“真心話大冒險”。

AMA一般會約定一個時間，并提前若干天在Reddit上收集問題，回答者統(tǒng)一解答。

本次Deepmind AMA的回答人是：David Silver:Deepmind強化學習組負責人，AlphaGo首席研究員。

David Silver1997年畢業(yè)于劍橋大學，獲得艾迪生威斯利獎。

David于2004年在阿爾伯塔大學獲得計算機博士學位，2013年加盟DeepMind，是AlphaGo項目的主要技術(shù)負責人。

Julian Schritieser:Deepmind高級軟件工程師。

此前有多位機器學習界的大牛/公司在Reddit Machine Learning版塊開設(shè)AMA，包括：Google Brain Team、OpenAI Research Team 、Andrew Ng and Adam Coates、Jürgen Schmidhuber、Geoffrey Hinton、Michael Jordan 、Yann LeCun、Yoshua Bengio等。

我們從今天Deepmind的AMA中選取了一些代表性的問題，整理如下：關(guān)于論文與技術(shù)細節(jié)Q: Deepmind Zero的訓(xùn)練為什么如此穩(wěn)定？深層次的增強學習是不穩(wěn)定和容易遺忘的，自我對局也是不穩(wěn)定和容易遺忘的，如果沒有一個好的基于模仿的初始化狀態(tài)和歷史檢查點，二者結(jié)合在一起應(yīng)該是一個災(zāi)難...但Zero從零開始，我沒有看到論文中有這部分的內(nèi)容，你們是怎么做到的呢？David Silver：在深層增強學習上，AlphaGo Zero與典型的無模式算法（如策略梯度或者Q學習）采用的是完全不同的算法。

通過使用AlphaGo搜索，我們可以極大改進策略和自我對局的結(jié)果，然后我們會用簡單的、基于梯度的更新來訓(xùn)練下一個策略及價值網(wǎng)絡(luò)。

比起基于簡便的基于梯度的策略改進，這樣的做法會更加穩(wěn)定。

Q：我注意到ELO等級分增長的數(shù)據(jù)只與到第40天，是否是因為論文截稿的原因？或者說之后AlphaGo的數(shù)據(jù)不再顯著改善？David Silver:AlphaGo已經(jīng)退役了！這意味著我們將人員和硬件資源轉(zhuǎn)移到其他AI問題中，我們還有很長的路要走吶。

Q：關(guān)于論文的兩個問題：Q1：您能解釋為什么AlphaGo的殘差塊輸入尺寸為19x19x17嗎？我不知道為什么每個對局者需要用8個堆疊的二進制特征層來描述？我覺得1、2個層就夠了啊。

雖然我不是100%理解圍棋的規(guī)則，但8個層看起來也多了點吧？Q2：由于整個通道使用自我對局與最近的/最好的模型進行比較，你們覺得這對于采用參數(shù)空間的特定SGD驅(qū)動軌跡對否會有過擬合的風險？David Silver：說起來使用表征可能比現(xiàn)在用的8層堆疊的做法更好！但我們使用堆疊的方式觀察歷史數(shù)據(jù)有三個原因：1）它與其他領(lǐng)域的常見輸入一致；2）我們需要一些歷史狀態(tài)來表示被KO;3）如果有一些歷史數(shù)據(jù)，我們可以更好地猜測對手最近下的位置，這可以作為一種關(guān)注機制（注：在圍棋中，這叫“敵之要點即我之要點”），而第17層用于標注我們現(xiàn)在究竟是執(zhí)黑子還是白子，因為要考慮貼目的關(guān)系。

Q：有了強大的棋類引擎，我們可以給玩家一個評級——例如Elo圍棋等級分就是通過棋手對局的分析逐步得出的，那么AlphaGo是否可以對過去有等級分前的棋手的實力進行分析？這可能為研究人類的認知提供一個平臺。

Julian Schritieser：感謝分享，這個主意很棒！我認為在圍棋中這完全可以做到，或許可以用最佳應(yīng)對和實際應(yīng)對的價值差異或者政策網(wǎng)絡(luò)給每一手位置評估得到的概率來進行？我有空的時候試一下。

Q：既然AlphaGo已經(jīng)退役了，是否有將其開源的計劃？這將對圍棋社區(qū)和機器學習研究產(chǎn)生巨大的影響。

還有，Hassabis在烏鎮(zhèn)宣稱的圍棋工具將會什么時候發(fā)布？David Silver：現(xiàn)在這個工具正在準備中。

不久后你就能看到新的消息。

Q:AlphaGo開發(fā)過程中，在系統(tǒng)架構(gòu)上遇到的最大障礙是什么？David Silver：我們遇到的一個重大挑戰(zhàn)是在和李世石比賽的時候，當時我們意識到AlphaGo偶爾會受到我們所謂的“妄想”的影響，也就是說，程序可能會錯誤理解當前盤面局勢，并在錯誤的方向上持續(xù)許多步。

我們嘗試了許多方案，包括引入更多的圍棋知識或人類元知識來解決這個問題。

但最終我們?nèi)〉昧顺晒Γ瑥腁lphaGo本身解決了這個問題，更多地依靠強化學習的力量來獲得更高質(zhì)量的解決方案。

圍棋愛好者的問題Q:1846年，在十四世本因坊跡目秀策與十一世井上幻庵因碩的一盤對局中，秀策下的第127手讓幻庵因碩一時驚急兩耳發(fā)赤，該手成為扭轉(zhuǎn)敗局的“耳赤一手”。

如果是AlphaGo，是否也會下出相同的一首棋？Julian Schritieser：我問了樊麾，他的回答是這樣的：當時的圍棋不貼目，而AlphaGo的對局中，黑棋需貼7.5目。

貼目情況不同造成了古今棋局的差異，如果讓AlphaGo穿越到當年下那一手，很有可能下的是不同的另一個地方。

Q：從已發(fā)布的AlphaGo相互對局看，執(zhí)白子的時間更為充裕，因...

AlphaGo這個系統(tǒng)主要由幾個部分組成：走棋網(wǎng)絡(luò)（Policy Neork），給定當前局面，預(yù)測/采樣下一步的走棋。

快速走子（Fast rollout），目標和1一樣，但在適當犧牲走棋質(zhì)量的條件下，速度要比1快1000倍。

估值網(wǎng)絡(luò)（Value Neork），給定當前局面，估計是白勝還是黑勝。

蒙特卡羅樹搜索（Monte Carlo Tree Search,MCTS），把以上這三個部分連起來，形成一個完整的系統(tǒng)。

我們的DarkForest和AlphaGo同樣是用4搭建的系統(tǒng)。

DarkForest較AlphaGo而言，在訓(xùn)練時加強了1，而少了2和3，然后以開源軟件Pachi的缺省策略（default policy）部分替代了2的功能。

以下介紹下各部分。

1、走棋網(wǎng)絡(luò)走棋網(wǎng)絡(luò)把當前局面作為輸入，預(yù)測/采樣下一步的走棋。

它的預(yù)測不只給出最強的一手，而是對棋盤上所有可能的下一著給一個分數(shù)。

棋盤上有361個點，它就給出361個數(shù)，好招的分數(shù)比壞招要高。

DarkForest在這部分有創(chuàng)新，通過在訓(xùn)練時預(yù)測三步而非一步，提高了策略輸出的質(zhì)量，和他們在使用增強學習進行自我對局后得到的走棋網(wǎng)絡(luò)（RL neork）的效果相當。

當然，他們并沒有在最后的系統(tǒng)中使用增強學習后的網(wǎng)絡(luò)，而是用了直接通過訓(xùn)練學習到的網(wǎng)絡(luò)（SL neork），理由是RL neork輸出的走棋缺乏變化，對搜索不利。

有意思的是在AlphaGo為了速度上的考慮，只用了寬度為192的網(wǎng)絡(luò)，而并沒有使用最好的寬度為384的網(wǎng)絡(luò)（見圖2(a)），所以要是GPU更快一點（或者更多一點），AlphaGo肯定是會變得更強的。

所謂的0.1秒走一步，就是純粹用這樣的網(wǎng)絡(luò)，下出有最高置信度的合法著法。

這種做法一點也沒有做搜索，但是大局觀非常強，不會陷入局部戰(zhàn)斗中，說它建模了“棋感”一點也沒有錯。

我們把DarkForest的走棋網(wǎng)絡(luò)直接放上KGS就有3d的水平，讓所有人都驚嘆了下。

可以說，這一波圍棋AI的突破，主要得益于走棋網(wǎng)絡(luò)的突破。

這個在以前是不可想像的，以前用的是基于規(guī)則，或者基于局部形狀再加上簡單線性分類器訓(xùn)練的走子生成法，需要慢慢調(diào)參數(shù)年，才有進步。

當然，只用走棋網(wǎng)絡(luò)問題也很多，就我們在DarkForest上看到的來說，會不顧大小無謂爭劫，會無謂脫先，不顧局部死活，對殺出錯，等等。

有點像高手不經(jīng)認真思考的隨手棋。

因為走棋網(wǎng)絡(luò)沒有價值判斷功能，只是憑“直覺”在下棋，只有在加了搜索之后，電腦才有價值判斷的能力。

2、快速走子那有了走棋網(wǎng)絡(luò)，為什么還要做快速走子呢？有兩個原因，首先走棋網(wǎng)絡(luò)的運行速度是比較慢的，AlphaGo說是3毫秒，我們這里也差不多，而快速走子能做到幾微秒級別，差了1000倍。

所以在走棋網(wǎng)絡(luò)沒有返回的時候讓CPU不閑著先搜索起來是很重要的，等到網(wǎng)絡(luò)返回更好的著法后，再更新對應(yīng)的著法信息。

其次，快速走子可以用來評估盤面。

由于天文數(shù)字般的可能局面數(shù)，圍棋的搜索是毫無希望走到底的，搜索到一定程度就要對現(xiàn)有局面做個估分。

在沒有估值網(wǎng)絡(luò)的時候，不像國象可以通過算棋子的分數(shù)來對盤面做比較精確的估值，圍棋盤面的估計得要通過模擬走子來進行，從當前盤面一路走到底，不考慮岔路地算出勝負，然后把勝負值作為當前盤面價值的一個估計。

這里有個需要權(quán)衡的地方：在同等時間下，模擬走子的質(zhì)量高，單次估值精度高但走子速度慢；模擬走子速度快乃至使用隨機走子，雖然單次估值精度低，但可以多模擬幾次算平均值，效果未必不好。

所以說，如果有一個質(zhì)量高又速度快的走子策略，那對于棋力的提高是非常有幫助的。

為了達到這個目標，神經(jīng)網(wǎng)絡(luò)的模型就顯得太慢，還是要用傳統(tǒng)的局部特征匹配（local pattern matching）加線性回歸（logistic regression）的方法，這辦法雖然不新但非常好使，幾乎所有的廣告推薦，競價排名，新聞排序，都是用的它。

與更為傳統(tǒng)的基于規(guī)則的方案相比，它在吸納了眾多高手對局之后就具備了用梯度下降法自動調(diào)參的能力，所以性能提高起來會更快更省心。

AlphaGo用這個辦法達到了2微秒的走子速度和24.2%的走子準確率。

24.2%的意思是說它的最好預(yù)測和圍棋高手的下子有0.242的概率是重合的，相比之下，走棋網(wǎng)絡(luò)在GPU上用2毫秒能達到57%的準確率。

這里，我們就看到了走子速度和精度的權(quán)衡。

和訓(xùn)練深度學習模型不同，快速走子用到了局部特征匹配，自然需要一些圍棋的領(lǐng)域知識來選擇局部特征。

對此AlphaGo只提供了局部特征的數(shù)目（見Extended Table 4），而沒有說明特征的具體細節(jié)。

我最近也實驗了他們的辦法，達到了25.1%的準確率和4-5微秒的走子速度，然而全系統(tǒng)整合下來并沒有復(fù)現(xiàn)他們的水平。

我感覺上24.2%并不能完全概括他們快速走子的棋力，因為只要走錯關(guān)鍵的一步，局面判斷就完全錯誤了；而圖2(b)更能體現(xiàn)他們快速走子對盤面形勢估計的精確度，要能達到他們圖2(b)這樣的水準，比簡單地匹配24.2%要做更多的工作，而他們并未在文章中強調(diào)這一點。

在AlphaGo有了快速走子之后，不需要走棋網(wǎng)絡(luò)和估值網(wǎng)絡(luò)，不借助任何深度學習和GPU的幫助，不使用增強學習，在單機上就已經(jīng)達到了3d的水平（見Extended Table 7倒數(shù)第二行），這是相當厲害的了。

任何使用傳統(tǒng)方法在單機上達...

轉(zhuǎn)載請注明出處作文大全網(wǎng) » alphago是什么語言開發(fā)的

以上就是關(guān)于openai首席技術(shù)官相關(guān)問題的回答。希望能幫到你，如有更多相關(guān)問題，您也可以聯(lián)系我們的客服進行咨詢，客服也會為您講解更多精彩的知識和內(nèi)容。