正文

拿來主義行不通！因?yàn)镃hatGPT的這一點(diǎn)真不好拿！

發(fā)布時(shí)間：2023-03-03 16:26:20 稿源：互聯(lián)網(wǎng) 閱讀： 847 問大家

我們國家什么時(shí)候才可以研發(fā)出像ChatGPT這樣牛逼的人工智能產(chǎn)品？有人說拿來主義，復(fù)制一份不就好了嗎？話糙理不糙，因?yàn)檫@確實(shí)是最快的一個(gè)渠道，但是ChatGPT這種產(chǎn)品的4個(gè)先決條件，我們已經(jīng)滿足了3個(gè)，其中有一個(gè)我個(gè)人感覺確實(shí)暫時(shí)拿不動(dòng)！

下面我直接列舉了8個(gè)問題，應(yīng)該可以回復(fù)你關(guān)于ChatGPT的大多數(shù)疑問，而與此同時(shí)，當(dāng)你看完之后，你應(yīng)該對ChatGPT會(huì)有一個(gè)全新的認(rèn)識(shí)，你也會(huì)明白，為什么我說有一點(diǎn)暫時(shí)拿不動(dòng)！

不廢話直接上干貨，先看一下GPT這個(gè)模型的一個(gè)時(shí)間里程碑:

OpenAI從2018年開始研發(fā)GPT模型，到2022年11月30日正式發(fā)布基于GPT3.5模型的ChatGPT聊天機(jī)器人，期間總共歷時(shí)大概四年半，進(jìn)入了2023年的2月份，ChatGPT只用了5天就吸引了100萬訂閱用戶，而到今天大概只有兩個(gè)月的時(shí)間，它更是達(dá)成了1億活躍獨(dú)立用戶的歷史最快成績，由此可見，這個(gè)玩意兒確實(shí)是革命性的，比爾蓋茨更是稱贊它的出現(xiàn)不亞于電子計(jì)算機(jī)或者是互聯(lián)網(wǎng)的出現(xiàn)，其影響力可見一斑。

你的可能疑問

問：ChatGPT可以訪問互聯(lián)網(wǎng)嗎？

答：ChatGPT和其他基于Transformer（轉(zhuǎn)換器）的大型語言模型是無法訪問互聯(lián)網(wǎng)的，但是想讓人工智能領(lǐng)域里的模型去訪問互聯(lián)網(wǎng)，應(yīng)該是一件很簡單的事情，這一層是可以單獨(dú)構(gòu)建的，后續(xù)很有可能會(huì)出現(xiàn)一個(gè)WebGPT的概念。

簡單說一下什么是transform模型，它是一種神經(jīng)網(wǎng)絡(luò)，可以通過跟蹤序列數(shù)據(jù)中的關(guān)系，比如說某句話中的單詞來學(xué)習(xí)上下文，它會(huì)應(yīng)用一組不斷發(fā)展的數(shù)學(xué)技術(shù)，我們可以稱之為注意力，或者是自主注意力，去感應(yīng)遙遠(yuǎn)數(shù)據(jù)元素中的那種微妙的相互影響與依賴關(guān)系，放張圖片，看一下transformer模型的神秘面紗吧：

問：ChatGPT怎么收費(fèi)？

答：好日子已經(jīng)到頭了，從發(fā)布到現(xiàn)在兩個(gè)月的時(shí)間，基本上都是可以免費(fèi)使用的，但是從2023年的2月份左右開始，open AI將會(huì)發(fā)布一個(gè)plus計(jì)劃，每個(gè)月大概需要20美元，當(dāng)然好處也是多多，那就是你的請求量可以很大，而且可以給你更快的響應(yīng)速度，當(dāng)然，如果x的GP有一些新的功能的話，你也是可以優(yōu)先使用的，所以花錢也是有花錢的道理，但是我相信一定會(huì)爆賣的。

問：ChatGPT的“智商”到底怎么樣？

答：首先要說的是是GP3.5模型已經(jīng)通過了美國律師資格考試，注冊會(huì)計(jì)師的考試以及美國醫(yī)療執(zhí)照的考試，試問美國有多少的人可以同時(shí)通過這三項(xiàng)考試呢？另外，門薩國際的前主席曾經(jīng)對GPT3的智商進(jìn)行了估計(jì)，他估計(jì)ChatGPT在語言智商的測試環(huán)節(jié)中應(yīng)該可以取得150分的高分，而實(shí)測的結(jié)果是147分，在這里我給大家再列舉一張圖，看一下GPT-3已經(jīng)在哪些行業(yè)取得了哪樣的成績：

看看這個(gè)圖是不是感覺ChatGPT強(qiáng)大的有點(diǎn)離譜啊，他可以立法，他可以判案，他可以通過商學(xué)院的MBA考試，他可以考取醫(yī)師資格證書，他可以攻克亞馬遜的AWS認(rèn)證，在口語測試中智商更是高達(dá)147，而且在這幾個(gè)案例中他的表現(xiàn)都已經(jīng)優(yōu)于了人類平均值，那這就基本可以驗(yàn)證一點(diǎn)，從綜合的角度來看，ChatGPT的智商已經(jīng)在人類中平均值之上，照這個(gè)勢頭發(fā)展下去，用不了幾年，多數(shù)人在ChatGPT面前都是個(gè)“傻子”！

問：ChatGPT可靠嗎？

答：其實(shí)上面的一個(gè)問題已經(jīng)給出了一個(gè)答案，那就是在信息的正確率上，ChatGPT在多數(shù)情況下是對的，但是有大概百分之二三十，信息就不那么可靠了。前兩天ChatGPT不是也出現(xiàn)了一個(gè)小小的“笑話”嗎？有人讓他同時(shí)評價(jià)川普和拜登，但是他在對拜登進(jìn)行大加贊賞的同時(shí)，卻拒絕評價(jià)川普，這就說明ChatGPT具體會(huì)給出怎樣的答案，它背后的人是是有決斷權(quán)的。另外OpenAI自己也表示，他們希望通過現(xiàn)實(shí)世界的經(jīng)驗(yàn)與反饋，學(xué)習(xí)如何研發(fā)真正有用和可靠的人工智能，他們表示ChatGPT目前還沒有那個(gè)實(shí)力，在任何事情上給出值得信賴的答案。

問：ChatGPT是否比GPT-3更強(qiáng)大？

答：這地方大家可能就有一個(gè)誤區(qū)了，其實(shí)ChatGPT是GPT3這個(gè)模型的一個(gè)實(shí)際應(yīng)用案例，我們用戶是可以真正的看到ChatGPT的，因?yàn)樗斜容^漂亮的用戶界面，我們可以實(shí)時(shí)的跟它進(jìn)行交互，而對于GPT-3而言，我們只知道它是ChatGPT的一個(gè)基石，其實(shí)它可以給我們提供更多選擇的對話模型以及大型語言模型庫，說白了他們的關(guān)系就是，沒有GPT-3就沒有ChatGPT，但是沒有ChatGPT，GPT-3依然存在。打個(gè)更加貼切的比方，那就是，如果你玩游戲的話，你應(yīng)該知道虛幻引擎， GPT-3就是那個(gè)虛幻引擎，而ChatGPT則是基于虛幻引擎上實(shí)際開發(fā)出來的一個(gè)游戲而已。

問：我們可以在自己的本地運(yùn)行ChatGPT或基于GPT-3模型進(jìn)行訓(xùn)練嗎？

答：理論上當(dāng)然是可以的，但是這幾個(gè)條件你看一看就可以了，對個(gè)人而言沒有希望，對小公司而言也沒有希望，只有大型的公司才有可能做到：

第一，硬件投資，為了能夠訓(xùn)練1750億個(gè)參數(shù)的GPT-3模型，你需要使用到大概1萬張顯卡以及285,000個(gè)CPU的核心，這種投資可以嚇退99.99%的人，即使OpenAI自己也沒有能力打造這套硬件設(shè)施，它是花了10億美元從微軟云上租用來的！猛不猛？爆不爆？第二，人員配備，我們訓(xùn)練的目標(biāo)肯定不能去訓(xùn)練別人已經(jīng)訓(xùn)練過的東西，也就是別人吃過的東西，我們肯定不會(huì)再去吃了，所以為了訓(xùn)練出新的東西，我們需要世界上最聰明的博士級數(shù)據(jù)科學(xué)家，這又是一筆錢，沒有幾億美元是拿不下來的，而且其實(shí)有錢也不一定能夠請到這樣的人。第三，數(shù)據(jù)收集，凡是涉及到人工智能模型的訓(xùn)練，就需要海量海量的數(shù)據(jù)，數(shù)據(jù)從哪里來由誰來收集，這都是不確定的，又是一筆時(shí)間和金錢。第四，真正的訓(xùn)練，假如說你是世界的超人，123條你都已經(jīng)滿足了，但是真正對模型訓(xùn)練也是需要花費(fèi)時(shí)間的，像GPT-3這種規(guī)模的模型，需要大概9~12個(gè)月的時(shí)間，而且中間如果出現(xiàn)了一些問題，還需要對他進(jìn)行多次訓(xùn)練，時(shí)間成本也是很高很高的。拿來主義行不通！因?yàn)镃hatGPT的這一點(diǎn)真不好拿！

問：ChatGPT是否會(huì)偷偷的復(fù)制保留數(shù)據(jù)？

答：其實(shí)你的數(shù)據(jù)，ChatGPT都看不上，他之所以現(xiàn)在如此強(qiáng)大的核心原因是，在大量時(shí)間的訓(xùn)練之后，它已經(jīng)在數(shù)以萬億計(jì)的各種各樣的詞之間建立了關(guān)聯(lián)，并保留了這些詞匯之間“微妙”的連接，它早已經(jīng)將原始數(shù)據(jù)都已經(jīng)丟失了，也就是你知道的，他全都知道，你不知道的，他知道的更多，它能夠在各種各樣的問題上給出人性化的答案，并不是他記住了這些答案，而是建立了你問題所提出的那些文字之間的微妙的鏈接，基于這些鏈接，亦或是說神經(jīng)網(wǎng)絡(luò)或者是神經(jīng)元吧，它可以真正地以接近人類大腦的方式給出自己的回復(fù)，一句話，他的強(qiáng)大不是靠死記硬背，所以就談不上偷偷復(fù)制保留數(shù)據(jù)的問題了。

問：ChatGPT有類人人意識(shí)嗎？

答：我相信這個(gè)問題好多人應(yīng)該都挺關(guān)注的，大家可能都覺得ChatGPT如此強(qiáng)大，很有可能已經(jīng)有了類似于人類的意識(shí)，其實(shí)現(xiàn)在想一想，完全沒有可能，只要把電一斷，一切涼涼。在上個(gè)問題中已經(jīng)說了，它在數(shù)以萬億計(jì)的詞語之間建立了微妙的關(guān)聯(lián)，也就是它應(yīng)該是一個(gè)非常強(qiáng)大的文本預(yù)測器，也就是在經(jīng)過訓(xùn)練之后，當(dāng)接收到新的文本之后，它可以預(yù)測到下一個(gè)文本，也就僅此而已，所以現(xiàn)在這個(gè)模型啊，我們暫時(shí)還不用擔(dān)心，它完全是靜態(tài)的，沒有思想與意識(shí)。

階段性匯總

其實(shí)看過了這幾個(gè)問題之后，我想各位應(yīng)該對ChatGPT，從科學(xué)的角度上，應(yīng)該有了一個(gè)入門級的認(rèn)知，如果讓我總結(jié)上述幾個(gè)問題得出的結(jié)論的話，那就是：

使用全球頂級的人才，使用全球頂級的算力，使用全球海量的數(shù)據(jù)，使用以年為單位的訓(xùn)練時(shí)間，去構(gòu)建出，全球以萬億計(jì)的詞匯的連接，ChatGPT當(dāng)前在所有問題上的答案，都是以問題中的文本作為連接的入口，然后給出它的連接能夠關(guān)聯(lián)出的預(yù)測，而當(dāng)下這個(gè)連接有多復(fù)雜，我們就只需要記住一個(gè)數(shù)字，1750億。

我們的ChatGPT何時(shí)出現(xiàn)？

其實(shí)上面已經(jīng)說了訓(xùn)練類似于GPT這種模型的一個(gè)要求，首先在硬件算力這塊，我們肯定是沒有任何問題的，這個(gè)毫無疑問，一萬張GPU算什么，現(xiàn)在某魚上的二手顯卡，至少以百萬張計(jì)，至于30萬顆CPU核心，那更是毛毛雨。

其次在博士級數(shù)據(jù)科學(xué)家這塊兒，這塊真的不太好搞，因?yàn)槲覀兊臉I(yè)務(wù)科學(xué)家比較多，但是數(shù)據(jù)科學(xué)家，說真的，沒有聽說過幾個(gè)。說到這兒，其實(shí)我想給即將畢業(yè)的大學(xué)生們提一個(gè)建議，路已經(jīng)很明確了，我們現(xiàn)在很缺少數(shù)據(jù)科學(xué)家，把數(shù)學(xué)學(xué)好，在這一行業(yè)成為一個(gè)科學(xué)家吧。

再次所謂的海量數(shù)據(jù)，對我們來說問題依然不大，因?yàn)槲覀內(nèi)硕嗔α看螅咳水a(chǎn)生一點(diǎn)數(shù)據(jù)，就可以甩國外幾條街，當(dāng)然前提是盡量多產(chǎn)生一點(diǎn)有意義有價(jià)值的數(shù)據(jù)。

最后就是那個(gè)訓(xùn)練時(shí)間，這個(gè)是最不需要成本的，雖然說時(shí)間就是金錢，但是我們完全可以從第1條硬件上，也就是從算力上去堆砌，一倍不行搞兩倍，兩倍不行搞10倍，機(jī)器多力量大，訓(xùn)練時(shí)間縮短那是必然的。

就說這么多吧，我是科技品鑒官，最近被網(wǎng)絡(luò)上的ChatGPT刷屏刷到爆，也必須去仔細(xì)的了解一下ChatGPT到底是何方神圣，然后寫了這篇小文總結(jié)了一下，希望可以幫助到大家，喜歡的話就點(diǎn)個(gè)贊，點(diǎn)個(gè)關(guān)注吧。