OpenAI

ChatGPT是什麼?有什麼功能?背後的OpenAI公司是什麼來頭?

OpenAI由一群頂尖科學家和企業家於2015年創立,其中包括Tesla創辦人Elon Musk埃隆-馬斯克和初創公司孵化器Y Combinator前主席Sam Altman薩姆-奧特曼,目標是以造福人類的方式推進人工智能領域的發展。自成立以來,OpenAI作出了重大貢獻,開發了先進的Machine Learning機器學習模型,並與其他組織合作,向公眾開放專利和研究成果,共同推動了人工智能領域的技術水平。

簡介

OpenAI由一群頂尖科學家和企業家於2015年創立,其中包括Tesla創辦人Elon Musk埃隆-馬斯克和初創公司孵化器Y Combinator前主席Sam Altman薩姆-奧特曼,目標是以造福人類的方式推進人工智能領域的發展。

在這我們將看看OpenAI過去開發的一些模型包括最近爆紅的ChatGPT和DALL-E,這些模型背後的訓練方法和潛在用途,以及將來會如何改變我們的生活。

OpenAI的創立歷史

起源

OpenAI成立於2015年,是一家人工智能研究實驗室和公司。它的創始目標是推動人工智能的發展,同時確保這一技術的發展符合人類的利益和價值。OpenAI的創立背後有一支強大的團隊,以及一位充滿願景和使命感的創始人。

創辦人 Sam Altman

OpenAI的創始人之一是Sam Altman。他是一位著名的創業家和投資者,在創立OpenAI之前已經建立了良好的聲譽和影響力。Sam Altman曾經創立過Loopt和Hydrazine Capital,同時也是Y Combinator(一家著名的創業孵化器)的前任總裁。

使命與願景

Altman在OpenAI的創立中扮演了重要角色,他的使命是通過人工智能的發展來推動社會進步和科技創新。他相信人工智能有巨大的潛力,但也認識到這一技術所帶來的潛在風險。因此,他致力於建立一個開放、透明的研究機構,讓全球的研究者可以共同合作,共享知識,從而推動人工智能的發展更加符合人類的利益。

OpenAI的使命是建立人類利益至上的人工智能,讓這一技術成為全人類的利器,帶來更多的福祉和機會。在Sam Altman的領導下,OpenAI不斷努力實現這一使命,並成為人工智能領域的重要推動者和引領者。

GPT ChatGPT

OpenAI開發的第一批模型是Generative Pre-training簡稱GPT。GPT是一個Machine Learning Model機器學習模型,在人類所寫的文字、文章的大型數據庫上進行監督式(Supervised Learning)和非監督式學習訓練(Unsupervised Learning)。能對用戶輸入的文字,作出類似人類的對答。

GPT與GPT-2

GPT是OpenAI的一項重大成就,因為它是第一批證明電腦有能力生成類似人類回答的模型。然而,它有一些局限性,例如缺乏上下文意識。為了解決這些限制,OpenAI使用更大的數據庫和更先進的訓練方法開發了GPT的改進版GPT-2。

GPT-3

GPT-2之後是GPT-3,它有能力執行更廣泛的工作,包括對文章翻譯、作總結和問題回答等。GPT-3在一個超過80億個字的數據連上進行了訓練,並能夠生成類似人類的文本,甚至一般人無法區分GPT-3寫與人類寫的文本。

ChatGPT

後來,在這些基礎上,OpenAI還開發了最近爆紅的ChatGPT。ChatGPT是一個在人類對話的大型數據庫上訓練的聊天機器人模型,能夠進行自然的、近似真人的對話。目前ChatGPT已被用於各種程式,包括一些客戶服務和虛擬助理。

這些模型是如何訓練的?

監督式學習Supervised Learning

在監督式學習模型中,電腦模型是在一個labelled有標記的數據庫上訓練的,每個input輸入都有對應正確的output輸出,目標是讓模型學會如何從input輸入推算出output輸出,並以此作出預測。

例如,假設我們想建立一個模型,根據房子的大小和位置來預測它的價格。我們可以在房屋數據庫上訓練一個監督學習模型,其中包括每個房屋的大小和位置,以及其價格。該模型將學習將某些尺寸和位置與某些價格聯系起來,然後我們可以使用該模型根據房子的尺寸和位置對其價格進行預測。

另一個例子是電子郵件的垃圾郵件過濾器。我們可以在被標記為正常郵件和垃圾郵件的數據庫上進行訓練,該模型將學習識別正常與垃圾郵件的特徵,然後我們可以使用該模型,自動將新的電子郵件分類為正常郵件和垃圾郵件。

無監督式學習Unsupervised Learning

無監督式學習是在一個沒有標記的數據庫上訓練模型,並且不提供正確的output輸出。這容許模型學習數據中的模式和關系,然後來進行預測。

無監督學習的一個例子是clustering聚類,根據不同數據點之間的相似性歸類。例如,我們可以使用無監督學習,根據客戶的購買模式,將具有類似模式的客戶歸為不同類別,並以此作出商品推薦。

強化學習Reinforcement learning

OpenAI還使用了其他訓練方法,如reinforcement learning 強化學習,在這種學習中,電腦模型學會與身處的環境互動,並以接受獎勵或懲罰進行學習,最終學會如何將獎勵最大化。

一個簡單例子是一隻狗學習聽從命令坐下。當狗坐下時,主人會給予它獎勵,隨著時間的推移,狗學會將坐下的動作與獎勵聯系起來,學會了聽從命令而坐,以使獎勵最大化。

另一個例子是自動駕駛汽車學習如何在城市中導航。汽車模型因遵守道路規則並安全到達目的地而獲得獎勵,通過試驗和錯誤學習,並根據所獲得的獎勵或懲罰調整其行動,最終學會了在城市中導航,

ChatGPT有什麼功能?

在程式開發中的應用

ChatGPT有大量的潛在用途,其中之一就是程式開發者行業。有很多軟件開發者已經在使用ChatGPT進行debug,甚至編寫代碼,一些區塊鏈開發者甚至能夠找到智能合約中潛在的黑客攻擊點或漏洞,預防了被黑客竊取數百萬美元的機會。

在3D藝術創作中的應用

一些3D藝術家使用ChatGPT來生成3D模型,大大節省了他們寫代碼和debug的時間,把專注投放在創作。

在銷售與客服中的應用

ChatGPT也可用於銷售和客服行業,通過自動化回答常見問題,處理客戶查詢,提高客戶滿意度,並節省人力資源。

作者的經驗

我自己亦試用了chatGPT,你可能已經猜到了,這篇文章的大部分是由ChatGPT寫的,它能夠用英文寫文章,我想讓它用中文寫,但內容看起來有點不同,我猜是因為模型是在大量的英文數據庫上訓練的,中文的部分比較少。ChatGPT為我節省了大量的時間,讓我可以專注於其他工作。我試著讓chatGPT為我編輯簡歷,試著讓它解釋一些非常專業的金融知識,到目前為止,它做得很完美。但它不會給你投資建議,相信我,我已經試過了。

人工智能的潛力確實是無限的。

DALL-E

OpenAI還開發了DALL-E,一個能夠從文字描述中生成圖像的機器學習模型。Deep Learning Language-based Image Generator(簡稱DALL-E)是在一個「文字對應圖像」的數據庫上訓練出來的,能夠基於用戶提供的文字描述生成圖像。例如,你可以輸入 “用畢加索風格畫一幅畫”,DALL-E會生成大量畢加索風格的圖像,你可以通過輸入具體要求來添加更多細節。

DALL-E有可能徹底改變一些行業,如平面設計和廣告。有了DALL-E,設計師和營銷人員可以根據文字描述生成定制圖像,在設計過程中節省時間和精力。DALL-E還可用於其他應用,如圖像搜索和基於圖像的推薦系統。

與其他組織的合作

目前OpenAI已與其他組織進行了一些合作,以共同推動人工智能領域。例如與微軟合作,為自然語言處理和圖像識別開發機器學習模型。它還與國際奧林匹克委員會(IOC)合作,探索人工智能在體育中的應用。其中一個例子是使用人工智能來分析體育數據,找尋可用於提高體育成績的趨勢和訓練模式。通過與微軟和國際奧委會這樣的組織合作,OpenAI能夠有效利用其他組織的專業知識和資源,在人工智能領域取得重大進展。

來自風險資本的投資

據報道,OpenAI正在商談以招標方式出售股份 ,不少Venture Capital風險投資公司Thrive Capital(曾投資Instagram和Slack)和Founders Fund(由Paypal創始人Peter Thiel創立,曾投資Airbnb、Spotify和Palantir)正在談判購買這些股份,預計是次交易將高達3億美元,公司價值將達到290億美元左右,這筆交易將使OpenAI的估值比1年前高出一倍。

另一方面,微軟也在就增加對OpenAI的投資進行深入談判,該公司在2019年向OpenAI投資了10億美元,並成為其商業化合作夥伴。他們目前正在研究ChatGPT聊天機器人的準確性,並計劃將其納入微軟自己的搜索引擎Bing中,目前Bing占全球搜索引擎流量的9%,而谷歌以83%的份額佔據主導地位。

結語

希望以上內容有助大家深入了解到OpenAI的工作和他們所開發的模型。從GPT到ChatGPT和DALL-E,和OpenAI對人工智能領域所作出的重大貢獻。

其他精彩文章

如果大家對不同的企業有興趣,亦可以閱讀以下文章

相關資料