-
當前位置:首頁 > 創(chuàng)意學院 > 技術(shù) > 專題列表 > 正文
openai最大股東(openai公司上市了嗎)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于openai最大股東的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
ChatGPT國內(nèi)免費在線使用,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、淺談策略梯度(PG)算法
Policy Optimization(策略優(yōu)化)是強化學習中的一大類算法,其基本思路區(qū)別于Value-based的算法。因此,很多教科書都將model-free RL分成兩大類,Policy Optimization和Value-based。本系列博客將會參考OpenAI發(fā)布的入門教程 Spinning Up [1] ,Spinning Up系列是入門Policy Optimization的非常好的教材,特別適合初學者。Policy Gradient(策略梯度,簡稱PG)算法是策略優(yōu)化中的核心概念,本章我們就將從最簡單的PG推導(dǎo)開始,一步步揭開策略優(yōu)化算法的神秘面紗。
如果用一句話來表達 策略梯度 的直觀解釋,那就是“如果動作使得最終回報變大,那么增加這個動作出現(xiàn)的概率,反之,減少這個動作出現(xiàn)的概率”。這句話表達了兩個含義:
本節(jié)我們將一步步推導(dǎo)出策略梯度的基礎(chǔ)公式,這一小節(jié)非常重要,理解了推導(dǎo)過程,就基本上理解了策略梯度的核心思想。所以,一定要耐心的把這一小節(jié)的內(nèi)容全部看懂,最好能夠達到自行推導(dǎo)的地步。
我們用參數(shù)化的神經(jīng)網(wǎng)絡(luò)表示我們的策略 ,那我們的目標,就可以表示為調(diào)整 ,使得 期望回報 最大,用公式表示:
在公式(1)中, 表示從開始到結(jié)束的一條完整路徑。通常,對于最大化問題,我們可以使用梯度上升算法來找到最大值。
為了能夠一步步得到最優(yōu)參數(shù),我們需要得到 ,然后利用梯度上升算法即可,核心思想就是這么簡單。
關(guān)鍵是求取最終的 回報函數(shù) 關(guān)于 的梯度,這個就是 策略梯度 (policy gradient),通過優(yōu)化策略梯度來求解RL問題的算法就叫做 策略梯度算法 ,我們常見的PPO,TRPO都是屬于策略梯度算法。下面我們的目標就是把公式(2)逐步展開,公式(2)中最核心的部分就是 ,這也是這篇博客最核心的地方。
在以上的推導(dǎo)中,用到了log求導(dǎo)技巧: 關(guān)于 的導(dǎo)數(shù)是 。因此,我們可以得到以下的公式:
所以,才有公式(5)到公式(6),接下來我們把公式(7)進一步展開,主要是把 展開。先來看看
加入log,化乘法為加法:
計算log函數(shù)的梯度,并且約去一些常量:
因此,結(jié)合公式(7)和公式(9),我們得到了最終的表達式
公式(10)就是PG算法的核心表達式了,從這個公式中可以看出,我們要求取的策略梯度其實是一個期望,具體工程實現(xiàn)可以采用蒙特卡羅的思想來求取期望,也就是采樣求均值來近似表示期望。我們收集一系列的 ,其中每一條軌跡都是由agent采用策略 與環(huán)境交互采樣得到的,那策略梯度可以表示為:
其中, 表示采樣的軌跡的數(shù)量?,F(xiàn)在,我們完成了詳細的策略梯度的推導(dǎo)過程,長舒一口氣,接下來的工作就比較輕松了,就是在公式(10)的基礎(chǔ)上修修改改了。
再進行簡單修改之前,我們再總結(jié)一下公式(10),畢竟這個公式是PG算法最核心的公式:
我們繼續(xù)觀察公式(10),對于公式中的 ,表示整個軌跡的回報,其實并不合理。對于一條軌跡中的所有動作,均采用相同的回報,就相當于對于軌跡中的每一個動作都賦予相同的權(quán)重。顯然,動作序列中的動作有好有壞,都采取相同的回報,無法達到獎懲的目的,那我們該怎么表示 某個狀態(tài)下,執(zhí)行某個動作 的回報呢?
一種比較直觀思路是,當前的動作將會影響后續(xù)的狀態(tài),并且獲得即時獎勵(reward),那么我們只需要使用 折扣累計回報 來表示當前動作的回報就行了,用公式表示為:
這在spinning up中叫做reward to go,所以,公式(10)可以表示為:
當然,使用reward to go的權(quán)重分配還是相當初級,我們可以使用更加高級的權(quán)重分配方式,進一步減少回報分配的方差,限于篇幅原因,我們后續(xù)再聊。
本章我們花了大量的篇幅推導(dǎo)了策略梯度(PG)的核心公式,得到了關(guān)鍵表達式(10),理解該公式對于我們后續(xù)理解整個PG算法族非常有幫助,希望大家能夠認真的理解這一公式推導(dǎo)過程。
二、部門撤消后,特斯拉公關(guān)現(xiàn)在做什么?
撰文?/?張霖郁
編輯?/ 涂彥平
設(shè)計?/ 杜?凱
如果馬斯克不出爾反爾,基利·蘇普瑞齊奧(Keely Sulprizio)是特斯拉最后一任全球傳播總監(jiān)。她2019年12月離職,任期不到一年。之后,特斯拉再沒有官方宣布任何繼任者。這就是說,特斯拉撤銷美國公關(guān)部的征兆早已發(fā)生,10個月前,這個部門已被推進手術(shù)臺。
不愿具名的消息源透露給汽車商業(yè)評論,他說馬斯克在13年中,公關(guān)最高層至少換了9任,他們中足夠優(yōu)秀且堅韌的最多能待一年半到兩年,最短的僅為兩個月。之前曾有位從American Express過來的公關(guān)負責人,因為兩篇新聞稿里出現(xiàn)的拼寫錯誤,她第二天就被馬斯克開了。
“他不喜歡錯誤,尤其在新聞稿里,他覺得那是大家第一時間讀到的特斯拉官方消息,不能出錯”,消息源說。
戴夫·阿諾德(Dave Arnold)
馬斯克并不只是對公關(guān)部嚴苛,其他部門的高層也經(jīng)歷同樣的待遇。Business Insider曾統(tǒng)計過歷年特斯拉高層的離職人數(shù)。
2018年為19人,涉及部門從工程到人力資源再到法務(wù),無一幸免;2019年是16人,其中包括基利·蘇普瑞齊奧的前任戴夫·阿諾德(Dave Arnold),戴夫在歷任的傳播總監(jiān)中,任期算是比較長的,他待了兩年。
原公關(guān)部的人現(xiàn)在做什么?
據(jù)消息源說,美國公關(guān)部半年前開始調(diào)整后,有一部分員工已經(jīng)離職,留下的人職位發(fā)生變更,?有些人改去做與客戶相關(guān)的工作,本質(zhì)上是去賣車。
亞歷山大·英格拉姆(Alexander Ingram)在今年2月前曾是公關(guān)部傳播經(jīng)理,負責各車型的傳播。2月后,職位名稱改為“車型和能源內(nèi)容主管”(Content Lead, Vehicles & Energy),工作內(nèi)容最大的變化是不再與媒體打交道,只生產(chǎn)內(nèi)容,并且增加了能源領(lǐng)域。
原來特斯拉公關(guān)部的職能分解到市場部、社交媒體運營部和馬斯克的行政部。這也意味著,公關(guān)的大部分職能仍然存在,只是砍掉了媒體關(guān)系。很多公司重要的消息,馬斯克自己在推特上發(fā),之前他也是這么做的。
“馬斯克的推特100%是他自己寫的,有些企業(yè)家有團隊運營,但馬斯克肯定不是?!币晃缓婉R斯克有私交的行業(yè)人士告訴汽車商業(yè)評論。
目前,撤除公關(guān)部后,唯一需要顧慮的是股東投資人關(guān)系,但這部分由專人負責,所以并不受影響。
特斯拉股票拆分已完成,股價仍處于上升趨勢,整個行業(yè)都在以特斯拉為標桿和先鋒。所以這個階段,馬斯克完全可以自己掌控并傳播特斯拉的故事?!?個月前,他們對媒體的報道已越來越敏感,?希望記者按著他們的節(jié)奏和框架講故事?!毕⒃凑f。
今年4月,特斯拉在北京舉行過一次小范圍的媒體溝通會,目的是展示他們的服務(wù)理念以及品質(zhì)。溝通會的過程中,汽車商業(yè)評論記者曾詢問特斯拉公關(guān)部的人數(shù)以及負責人情況,對方回答含糊,給人感覺公關(guān)部并不是獨立部門,似乎由其他部門的人兼職擔任,或者公關(guān)人員同時兼任其他部門事務(wù)。
有意思的是,從今年8月到10月,特斯拉中國的公關(guān)團隊一直在招區(qū)域?qū)ν馐聞?wù)經(jīng)理,為海南、北京、湖北、重慶這4個地區(qū)建立強有力的政府和媒體關(guān)系招兵買馬。
這個職位主要負責“建立并維護積極正面的特斯拉企業(yè)形象,運用高效靈活的溝通能力與包括媒體、政府機構(gòu)、行業(yè)協(xié)會組織等外部機構(gòu)建立聯(lián)系,構(gòu)建和諧的外部環(huán)境支持特斯拉在區(qū)域市場的業(yè)務(wù)發(fā)展”。不同的區(qū)域,具體職位要求也略有不同。
中國市場以及政府關(guān)系的重要性,加上區(qū)域的地方特色以及政策的變動,特斯拉還需要公關(guān)去建立和維護這些關(guān)系。但在美國,馬斯克已然非常熟悉游戲規(guī)則。
是否有可能反轉(zhuǎn)?
根據(jù)美國《全球資產(chǎn)研究》的一份報告顯示,特斯拉在每款車型上的廣告投入是6美元,相比之下,豐田每款車是248美元。威馬創(chuàng)始人沈暉并不認同特斯拉不做廣告這件事,他在第十二屆汽車藍皮書論壇上曾說:“SpaceX是特斯拉做的最大的廣告。”
特斯拉把每一次的發(fā)布會都做成了全民事件,這或許正是美國文化孵化出來的儀式,就像蘋果發(fā)布會一樣。如果換個國家和文化,未必能孵化出這條路子。
“美國人什么都喜歡大:大車、大型活動、大的概念。他們愛開皮卡,對那種熱鬧、人多、音樂沖天的活動特別感興趣,他們有party文化,所以產(chǎn)生了超級碗、奧斯卡等一系列這樣的活動。另外,美國老百姓對宏大的理念也極有興趣,比如宇宙、人類、科技這樣的話題,特斯拉在這三個方面都做得很好?!币晃辉诿赖牡诙A人這樣總結(jié)特斯拉在美國的成功,他也是汽車行業(yè)的資深專家。
除了特斯拉,馬斯克還擁有7家公司:航空航天方面是SpaceX,電信、互聯(lián)網(wǎng)領(lǐng)域有Starlink,新能源領(lǐng)域是SolarCity,交通運輸有Hyperloop,基礎(chǔ)設(shè)施/隧道挖掘是Boring Company,而人工智能方面是OpenAI,還有最近很火的腦機接口Neuralink,屬于醫(yī)療保健領(lǐng)域。
從宇宙到人類個體,他這8家公司全都有覆蓋,并且均處于先鋒地位。從某種意義上說,馬斯克目前的信心、實力以及掌控話題的能力已讓他成為特斯拉最大的公關(guān),他僅憑一己之力就能阻擋無數(shù)次的負面新聞,比如自動駕駛事故、降價等事件,他完全不需要和媒體搞關(guān)系。
但馬斯克未來是否會反悔,重建公關(guān)部?
這是有可能的。“不能完全把馬斯克的話當真”似乎也是特斯拉忠粉們的共識。
細數(shù)過往,比如2018年8月,也就是特斯拉極為困難的那年,馬斯克在社交媒體上宣布要把公司私有化,并詳細說了交易金額。17天后,他卻在董事會上公開放棄這一計劃,事后美國證券交易委員會(SEC)介入調(diào)查。
馬斯克也曾親口表示 Model 3高性能版不會國產(chǎn),導(dǎo)致2019年國內(nèi)一些用戶花高價買了進口版本。事實上,今年4月,特斯拉官宣了這款車的國產(chǎn)消息。?還有之前Model 3的交付日期,他承諾的和實際交付是兩回事。
今年他強調(diào)最多的是要實現(xiàn)真正的自動駕駛,大部分的忠粉都在半信半疑中期待。
汽車商業(yè)評論認為,等未來特斯拉的技術(shù)和市占率不再具有絕對優(yōu)勢時,或許特斯拉的公關(guān)部會重建。
本文來源于汽車之家車家號作者,不代表汽車之家的觀點立場。
三、時間管理大師——硅谷鋼鐵俠
2021年1月, 加冕新首富、獵鷹火箭一箭143星、國產(chǎn)model Y落地 ,埃隆·馬斯克的成就list一口氣打了好幾個勾,短時間內(nèi)這么多收獲,離不開他高超的時間管理術(shù)。
作為這個世界上最成功最忙碌的男人之一,馬斯克管理7家公司,還養(yǎng)育了6個孩子——普通人就算有三頭六臂恐怕都忙不過來,馬斯克到底是怎么做到的?
首先是“Time Boxing”工作法,為任務(wù)設(shè)置時長——凡是醒著狀態(tài),馬斯克會以5分鐘為單位來安排日程, 一天時光就切成了幾百個“時間方糖” 。
到工作時間, 每天的最低標準是處理最關(guān)鍵的事務(wù) ,包括最緊要工作、需要見面的關(guān)鍵人物和必須參加的關(guān)鍵活動。
接下來的非工作事務(wù),馬斯克會壓縮在最短時間內(nèi)完成,包括花5分鐘吃飯,一周為約會安排10小時等。
一心二用甚至三用,是馬斯克管理時間的一大特點,他會在開會時用手機打理生意,在檢查發(fā)票時回復(fù)郵件,有時抱孩子坐在腿上玩耍還會抽空回份郵件……
2017年美國連線雜志對馬斯克花費時間進行有趣的對比換算,得出的結(jié)論是:馬斯克一年干了別人八年的工作量。
造火箭,Space X對比藍色起源,耗時比例1:6;
造自動駕駛汽車,特斯拉對比福特,耗時比1:4;
造超級高鐵,馬斯克對比加州政府的項目,耗時比1:6;
挖隧道,The Boring Company對比正常地鐵,耗時比1:14;
交付平民價位的電動汽車,從立項到交付,耗時是通用汽車的2/3;
更快的汽車生產(chǎn)線,通常汽車組裝需要3分鐘,特斯拉機器人生產(chǎn)線10秒搞定,耗時比1:18;
登陸火星,按規(guī)劃馬斯克想在2024年就送人類上火星,NASA要到2035,馬斯克又1:8領(lǐng)先;
以道御術(shù),馬斯克做好技術(shù)層面時間管理的同時,又是什么賦予了他對時間的駕馭感?
「第一性原理」 是馬斯克掛在嘴邊的理論之一,他要確保自己了解極大多數(shù)事情背后的基礎(chǔ)科學原理或規(guī)則——這可以減少他花費大量時間去學習新概念,認知事物便有了一個平滑上揚的認知曲線。
馬斯克推崇的“Time Boxing”工作法,關(guān)注的核心不是什么時刻做這件事,而是做這件事花費的時長。這種時間管理方法,和市面上大量根據(jù)日程來安排待辦事項的時間管理方法,有著本質(zhì)區(qū)別。對馬斯克這種日程繁雜又不固定的人士尤其好用。
在埃隆·馬斯克的日程中,沒有任何兩天是完全一樣的,他曾在訪談中描述自己的工作節(jié)奏,周一和周五在洛杉磯的Space X,星期二、三、四他會在舊金山灣區(qū)的Tesla工作,星期六還有半天要在 Y Combinator 孵化器里研究人工智能開源項目 OpenAI的工作。
通常人們安排日程,會是9點到10點做任務(wù)一,10點到11點做任務(wù)二,呈線性分布。可有時任務(wù)一延誤就會影響任務(wù)二,提前做完了任務(wù)一可能還要等到10點做任務(wù)二,這樣根據(jù)時間線來制定的工作計劃,看似井井有條實際上卻有些脆弱。
而“Time Boxing”對未來需要執(zhí)行的每件事項設(shè)定了明確的預(yù)算時長,例如任務(wù)一要在15分鐘內(nèi)完成,任務(wù)二要在10分鐘內(nèi)完成……。完成任務(wù)一之后,可以立刻開始進行下一件最適合進行的任務(wù),而不一定是任務(wù)清單上排第二的任務(wù)。
馬斯克深諳Deadline才是第一生產(chǎn)力的道理,給每項任務(wù)安排足夠且最少的時間,這樣就讓自己時刻處于Deadline臨近的影響下,這樣效率也最高。
有關(guān)企業(yè)官僚作風的帕金森定律也提到,工作會填滿分配的時間。
也就是說,為任務(wù)分配的時間越多,完成任務(wù)花費的時間也就越多。明明30分鐘可以查完的資料,如果安排半天,那可能真的會花半天。于是他就把一些低價值的事項分配較少的時長,避免時間的浪費,譬如5分鐘內(nèi)狼吞虎咽地吃完午餐。
基于這種時間管理方法,他始終在保持很快的工作節(jié)奏,完成一件事之后,立刻進行下一件,不空耗時間,也不用等待下一個任務(wù)時間點的到來。
此外,馬斯克還在個人管理精力的分配上運用了帕斯托雷法則:將大部分的精力用在最重要的兩家公司上面,即Space X和特斯拉。
在接受歐洲數(shù)字出版社Axel Springer CEO訪談時表示:“人類歷史上最偉大的發(fā)明是語言(而非車輪)”,語言之外就是寫作,“寫作就像是一個硬盤驅(qū)動器,讓事物超越人本身來延續(xù)。如果你想用口述史的方式來保存一切東西,是非常困難的?!?/p>
大量的事務(wù)都用郵件解決,這也是他極少使用電話的原因,這樣就可以避免高效狀態(tài)經(jīng)常被打斷。
而且馬斯克80%的溝通都是創(chuàng)造性工作,如工程和設(shè)計,能夠持續(xù)保證心流狀態(tài)才是最高效的方式。
用他自己的話說:“我喜歡郵件,并且盡可能嘗試異步溝通,我非常擅長寫郵件。”他還用一個很難被猜到的郵件地址來避免與公司以外的人取得聯(lián)系,這樣他就能更專注于公司的實際工作。
他還在一次會議上開玩笑說:“我寫過很多郵件——并且非常擅長。這是我的核心競爭力?!彼?jīng)常通過郵件向全公司傳達如何溝通,公司的愿景和使命,以及如何高效工作。
2018年7月1日,馬斯克向全體員工,發(fā)送了一封人人期待已久的電子郵件:“我認為我們剛剛成為了一家真正的汽車公司。我們在七天內(nèi)制造了5,031輛 Model 3?!敝墚a(chǎn)能爬升過5000臺,馬斯克將特斯拉最有里程碑意義的成就,通過郵件告訴了所有人。
馬斯克的郵件技能也是練過的,用語清晰、簡潔、直接。
能用兩個字就不用十個字,他會使用一些恰如其分的技巧型話術(shù),比如“我希望……,你能夠做到嗎?”,一旦你在郵件中答應(yīng),就像是自己承諾完成任務(wù),而不是他硬壓下來的,也就不得不完成。
回完最重要的郵件,馬斯克會親自送娃上學。
再忙,他也還是好爸爸一枚,開著自己的特斯拉汽車,把娃送到自建在Space X總部的試驗性小學Ad Astra。學校名字取自拉丁諺語Per aspera ad astra,含義是「歷經(jīng)艱辛,終達星辰」古典且浪漫。
馬斯克還有空客串電影電視劇集,《鋼鐵俠》、《生活大爆炸》等都出現(xiàn)過他的身影,他幾乎可以算是硅谷科技精英中客串影視節(jié)目最多的家伙,這樣的免費公關(guān)宣傳對他要推進的目標是有意義的,也在節(jié)約他的PR時間。
作為頂級富豪,永遠精力充沛、勝券在握的馬斯克,走出了自己刻苦又松弛時間管理風格。
四、開放api是開源嗎
開放API并不等同于開源。開放API是指一個軟件或平臺允許第三方開發(fā)者使用其接口和數(shù)據(jù),以便創(chuàng)建新的應(yīng)用程序或服務(wù)。開源則是指軟件的源代碼是公開的,任何人都可以查看、修改和分發(fā)。雖然開放API和開源都可以促進創(chuàng)新和合作,但它們是不同的概念。
開放API的優(yōu)點是可以讓不同的應(yīng)用程序之間實現(xiàn)互操作性,從而提高整個生態(tài)系統(tǒng)的價值。例如,許多社交媒體平臺都提供開放API,使得第三方開發(fā)者可以創(chuàng)建各種應(yīng)用程序,如社交媒體管理工具、數(shù)據(jù)分析工具等。這些應(yīng)用程序可以幫助用戶更好地管理和分析他們的社交媒體賬戶,從而提高效率和效果。
總之,開放API和開源是兩個不同的概念,但它們都可以促進創(chuàng)新和合作。開放API可以讓不同的應(yīng)用程序之間實現(xiàn)互操作性,從而提高整個生態(tài)系統(tǒng)的價值。而開源則可以讓開發(fā)者更容易地查看、修改和分發(fā)軟件的源代碼,從而促進創(chuàng)新和合作。
以上就是關(guān)于openai最大股東相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
openai和谷歌什么關(guān)系(谷歌nano和pico的區(qū)別)
openai自動代碼生成器(openapi3.0 自動生成api文檔)
南通特色景觀設(shè)計資質(zhì)(南通特色景觀設(shè)計資質(zhì)企業(yè))