HOME 首頁
SERVICE 服務產品
XINMEITI 新媒體代運營
CASE 服務案例
NEWS 熱點資訊
ABOUT 關于我們
CONTACT 聯系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    拿來主義行不通!因為ChatGPT的這一點真不好拿!

    發(fā)布時間:2023-03-03 16:26:20     稿源: 互聯網    閱讀: 847        問大家

    我們國家什么時候才可以研發(fā)出像ChatGPT這樣牛逼的人工智能產品?有人說拿來主義,復制一份不就好了嗎?話糙理不糙,因為這確實是最快的一個渠道,但是ChatGPT這種產品的4個先決條件,我們已經滿足了3個,其中有一個我個人感覺確實暫時拿不動!

    下面我直接列舉了8個問題,應該可以回復你關于ChatGPT的大多數疑問,而與此同時,當你看完之后,你應該對ChatGPT會有一個全新的認識,你也會明白,為什么我說有一點暫時拿不動!

    不廢話直接上干貨,先看一下GPT這個模型的一個時間里程碑:

    拿來主義行不通!因為ChatGPT的這一點真不好拿!

    OpenAI從2018年開始研發(fā)GPT模型,到2022年11月30日正式發(fā)布基于GPT3.5模型的ChatGPT聊天機器人,期間總共歷時大概四年半,進入了2023年的2月份,ChatGPT只用了5天就吸引了100萬訂閱用戶,而到今天大概只有兩個月的時間,它更是達成了1億活躍獨立用戶的歷史最快成績,由此可見,這個玩意兒確實是革命性的,比爾蓋茨更是稱贊它的出現不亞于電子計算機或者是互聯網的出現,其影響力可見一斑。

    你的可能疑問

    問:ChatGPT可以訪問互聯網嗎?

    答:ChatGPT和其他基于Transformer(轉換器)的大型語言模型是無法訪問互聯網的,但是想讓人工智能領域里的模型去訪問互聯網,應該是一件很簡單的事情,這一層是可以單獨構建的,后續(xù)很有可能會出現一個WebGPT的概念。

    簡單說一下什么是transform模型,它是一種神經網絡,可以通過跟蹤序列數據中的關系,比如說某句話中的單詞來學習上下文,它會應用一組不斷發(fā)展的數學技術,我們可以稱之為注意力,或者是自主注意力,去感應遙遠數據元素中的那種微妙的相互影響與依賴關系,放張圖片,看一下transformer模型的神秘面紗吧:

    拿來主義行不通!因為ChatGPT的這一點真不好拿!

    問:ChatGPT怎么收費?

    答:好日子已經到頭了,從發(fā)布到現在兩個月的時間,基本上都是可以免費使用的,但是從2023年的2月份左右開始,open AI將會發(fā)布一個plus計劃,每個月大概需要20美元,當然好處也是多多,那就是你的請求量可以很大,而且可以給你更快的響應速度,當然,如果x的GP有一些新的功能的話,你也是可以優(yōu)先使用的,所以花錢也是有花錢的道理,但是我相信一定會爆賣的。

    問:ChatGPT的“智商”到底怎么樣?

    答:首先要說的是是GP3.5模型已經通過了美國律師資格考試,注冊會計師的考試以及美國醫(yī)療執(zhí)照的考試,試問美國有多少的人可以同時通過這三項考試呢?另外,門薩國際的前主席曾經對GPT3的智商進行了估計,他估計ChatGPT在語言智商的測試環(huán)節(jié)中應該可以取得150分的高分,而實測的結果是147分,在這里我給大家再列舉一張圖,看一下GPT-3已經在哪些行業(yè)取得了哪樣的成績:

    拿來主義行不通!因為ChatGPT的這一點真不好拿!

    看看這個圖是不是感覺ChatGPT強大的有點離譜啊,他可以立法,他可以判案,他可以通過商學院的MBA考試,他可以考取醫(yī)師資格證書,他可以攻克亞馬遜的AWS認證,在口語測試中智商更是高達147,而且在這幾個案例中他的表現都已經優(yōu)于了人類平均值,那這就基本可以驗證一點,從綜合的角度來看,ChatGPT的智商已經在人類中平均值之上,照這個勢頭發(fā)展下去,用不了幾年,多數人在ChatGPT面前都是個“傻子”!

    問:ChatGPT可靠嗎?

    答:其實上面的一個問題已經給出了一個答案,那就是在信息的正確率上,ChatGPT在多數情況下是對的,但是有大概百分之二三十,信息就不那么可靠了。前兩天ChatGPT不是也出現了一個小小的“笑話”嗎?有人讓他同時評價川普和拜登,但是他在對拜登進行大加贊賞的同時,卻拒絕評價川普,這就說明ChatGPT具體會給出怎樣的答案,它背后的人是是有決斷權的。另外OpenAI自己也表示,他們希望通過現實世界的經驗與反饋,學習如何研發(fā)真正有用和可靠的人工智能,他們表示ChatGPT目前還沒有那個實力,在任何事情上給出值得信賴的答案。

    問:ChatGPT是否比GPT-3更強大?

    答:這地方大家可能就有一個誤區(qū)了,其實ChatGPT是GPT3這個模型的一個實際應用案例,我們用戶是可以真正的看到ChatGPT的,因為它有比較漂亮的用戶界面,我們可以實時的跟它進行交互,而對于GPT-3而言,我們只知道它是ChatGPT的一個基石,其實它可以給我們提供更多選擇的對話模型以及大型語言模型庫,說白了他們的關系就是,沒有GPT-3就沒有ChatGPT,但是沒有ChatGPT,GPT-3依然存在。打個更加貼切的比方,那就是,如果你玩游戲的話,你應該知道虛幻引擎, GPT-3就是那個虛幻引擎,而ChatGPT則是基于虛幻引擎上實際開發(fā)出來的一個游戲而已。

    問:我們可以在自己的本地運行ChatGPT或基于GPT-3模型進行訓練嗎?

    答:理論上當然是可以的,但是這幾個條件你看一看就可以了,對個人而言沒有希望,對小公司而言也沒有希望,只有大型的公司才有可能做到:

    第一,硬件投資,為了能夠訓練1750億個參數的GPT-3模型,你需要使用到大概1萬張顯卡以及285,000個CPU的核心,這種投資可以嚇退99.99%的人,即使OpenAI自己也沒有能力打造這套硬件設施,它是花了10億美元從微軟云上租用來的!猛不猛?爆不爆?第二,人員配備,我們訓練的目標肯定不能去訓練別人已經訓練過的東西,也就是別人吃過的東西,我們肯定不會再去吃了,所以為了訓練出新的東西,我們需要世界上最聰明的博士級數據科學家,這又是一筆錢,沒有幾億美元是拿不下來的,而且其實有錢也不一定能夠請到這樣的人。第三,數據收集,凡是涉及到人工智能模型的訓練,就需要海量海量的數據,數據從哪里來由誰來收集,這都是不確定的,又是一筆時間和金錢。第四,真正的訓練,假如說你是世界的超人,123條你都已經滿足了,但是真正對模型訓練也是需要花費時間的,像GPT-3這種規(guī)模的模型,需要大概9~12個月的時間,而且中間如果出現了一些問題,還需要對他進行多次訓練,時間成本也是很高很高的。拿來主義行不通!因為ChatGPT的這一點真不好拿!

    問:ChatGPT是否會偷偷的復制保留數據?

    答:其實你的數據,ChatGPT都看不上,他之所以現在如此強大的核心原因是,在大量時間的訓練之后,它已經在數以萬億計的各種各樣的詞之間建立了關聯,并保留了這些詞匯之間“微妙”的連接,它早已經將原始數據都已經丟失了,也就是你知道的,他全都知道,你不知道的,他知道的更多,它能夠在各種各樣的問題上給出人性化的答案,并不是他記住了這些答案,而是建立了你問題所提出的那些文字之間的微妙的鏈接,基于這些鏈接,亦或是說神經網絡或者是神經元吧,它可以真正地以接近人類大腦的方式給出自己的回復,一句話,他的強大不是靠死記硬背,所以就談不上偷偷復制保留數據的問題了。

    問:ChatGPT有類人人意識嗎?

    答:我相信這個問題好多人應該都挺關注的,大家可能都覺得ChatGPT如此強大,很有可能已經有了類似于人類的意識,其實現在想一想,完全沒有可能,只要把電一斷,一切涼涼。在上個問題中已經說了,它在數以萬億計的詞語之間建立了微妙的關聯,也就是它應該是一個非常強大的文本預測器,也就是在經過訓練之后,當接收到新的文本之后,它可以預測到下一個文本,也就僅此而已,所以現在這個模型啊,我們暫時還不用擔心,它完全是靜態(tài)的,沒有思想與意識。

    拿來主義行不通!因為ChatGPT的這一點真不好拿!

    階段性匯總

    其實看過了這幾個問題之后,我想各位應該對ChatGPT,從科學的角度上,應該有了一個入門級的認知,如果讓我總結上述幾個問題得出的結論的話,那就是:

    使用全球頂級的人才,使用全球頂級的算力,使用全球海量的數據,使用以年為單位的訓練時間,去構建出,全球以萬億計的詞匯的連接,ChatGPT當前在所有問題上的答案,都是以問題中的文本作為連接的入口,然后給出它的連接能夠關聯出的預測,而當下這個連接有多復雜,我們就只需要記住一個數字,1750億。

    我們的ChatGPT何時出現?

    其實上面已經說了訓練類似于GPT這種模型的一個要求,首先在硬件算力這塊,我們肯定是沒有任何問題的,這個毫無疑問,一萬張GPU算什么,現在某魚上的二手顯卡,至少以百萬張計,至于30萬顆CPU核心,那更是毛毛雨。

    其次在博士級數據科學家這塊兒,這塊真的不太好搞,因為我們的業(yè)務科學家比較多,但是數據科學家,說真的,沒有聽說過幾個。說到這兒,其實我想給即將畢業(yè)的大學生們提一個建議,路已經很明確了,我們現在很缺少數據科學家,把數學學好,在這一行業(yè)成為一個科學家吧。

    再次所謂的海量數據,對我們來說問題依然不大,因為我們人多力量大,每人產生一點數據,就可以甩國外幾條街,當然前提是盡量多產生一點有意義有價值的數據。

    最后就是那個訓練時間,這個是最不需要成本的,雖然說時間就是金錢,但是我們完全可以從第1條硬件上,也就是從算力上去堆砌,一倍不行搞兩倍,兩倍不行搞10倍,機器多力量大,訓練時間縮短那是必然的。

    就說這么多吧,我是科技品鑒官,最近被網絡上的ChatGPT刷屏刷到爆,也必須去仔細的了解一下ChatGPT到底是何方神圣,然后寫了這篇小文總結了一下,希望可以幫助到大家,喜歡的話就點個贊,點個關注吧。


    推薦閱讀:

    拿來主義行不通!因為ChatGPT的這一點真不好拿!

    正規(guī)的抖音號代運營公司如何選擇?吉林抖音代運營方案哪家正規(guī)?

    旅游公司是干什么的(旅游公司是干什么的公司)