OpenAI 的 ChatGPT 和 DALL-E：能够进行对话、画画甚至编写程式代码的人工智能

简介

OpenAI由一群顶尖科学家和企业家于2015年创立，其中包括Tesla创办人Elon Musk埃隆-马斯克和初创公司孵化器Y Combinator前主席Sam Altman萨姆-奥特曼，目标是以造福人类的方式推进人工智能领域的发展。

在这我们将看看OpenAI过去开发的一些模型包括最近爆红的ChatGPT和DALL-E，这些模型背后的训练方法和潜在用途，以及将来会如何改变我们的生活。

GPT 与ChatGPT

OpenAI开发的第一批模型是Generative Pre-training简称GPT。GPT是一个Machine Learning Model机器学习模型，在人类所写的文字、文章的大型数据库上进行监督式(Supervised Learning)和非监督式学习训练(Unsupervised Learning)。能对用户输入的文字，作出类似人类的对答。

GPT是OpenAI的一项重大成就，因为它是第一批证明电脑有能力生成类似人类回答的模型。然而，它有一些局限性，例如缺乏上下文意识。为了解决这些限制，OpenAI使用更大的数据库和更先进的训练方法开发了GPT的改进版GPT-2。

GPT-2之后是GPT-3，它有能力执行更广泛的工作，包括对文章翻译、作总结和问题回答等。GPT-3在一个超过80亿个字的数据连上进行了训练，并能够生成类似人类的文本，甚至一般人无法区分GPT-3写与人类写的文本。

后来，在这些基础上，OpenAI还开发了最近爆红的ChatGPT。ChatGPT是一个在人类对话的大型数据库上训练的聊天机器人模型，能够进行自然的、近似真人的对话。目前ChatGPT已被用于各种程式，包括一些客户服务和虚拟助理。

这些模型是如何训练的？

监督式学习Supervised Learning

在监督式学习模型中，电脑模型是在一个labelled有标记的数据库上训练的，每个input输入都有对应正确的output输出，目标是让模型学会如何从input输入推算出output输出，并以此作出预测。

例如，假设我们想建立一个模型，根据房子的大小和位置来预测它的价格。我们可以在房屋数据库上训练一个监督学习模型，其中包括每个房屋的大小和位置，以及其价格。该模型将学习将某些尺寸和位置与某些价格联系起来，然后我们可以使用该模型根据房子的尺寸和位置对其价格进行预测。

另一个例子是电子邮件的垃圾邮件过滤器。我们可以在被标记为正常邮件和垃圾邮件的数据库上进行训练，该模型将学习识别正常与垃圾邮件的特徵，然后我们可以使用该模型，自动将新的电子邮件分类为正常邮件和垃圾邮件。

无监督式学习Unsupervised Learning

无监督式学习是在一个没有标记的数据库上训练模型，并且不提供正确的output输出。这容许模型学习数据中的模式和关系，然后来进行预测。

无监督学习的一个例子是clustering聚类，根据不同数据点之间的相似性归类。例如，我们可以使用无监督学习，根据客户的购买模式，将具有类似模式的客户归为不同类别，并以此作出商品推荐。

强化学习Reinforcement learning

OpenAI还使用了其他训练方法，如reinforcement learning 强化学习，在这种学习中，电脑模型学会与身处的环境互动，并以接受奖励或惩罚进行学习，最终学会如何将奖励最大化。

一个简单例子是一隻狗学习听从命令坐下。当狗坐下时，主人会给予它奖励，随着时间的推移，狗学会将坐下的动作与奖励联系起来，学会了听从命令而坐，以使奖励最大化。

另一个例子是自动驾驶汽车学习如何在城市中导航。汽车模型因遵守道路规则并安全到达目的地而获得奖励，通过试验和错误学习，并根据所获得的奖励或惩罚调整其行动，最终学会了在城市中导航，

潜在用途

ChatGPT有大量的潜在用途，其中之一就是程式开发者行业。有很多软件开发者已经在使用ChatGPT进行debug，甚至编写代码，一些区块链开发者甚至能够找到智能合约中潜在的黑客攻击点或漏洞，预防了被黑客窃取数百万美元的机会。一些3D艺术家使用ChatGPT来生成3D模型，大大节省了他们写代码和debug的时间，把专注投放在创作。

我自己亦试用了chatGPT，你可能已经猜到了，这篇文章的大部分是由ChatGPT写的，它能够用英文写文章，我想让它用中文写，但内容看起来有点不同，我猜是因为模型是在大量的英文数据库上训练的，中文的部分比较少。ChatGPT为我节省了大量的时间，让我可以专注于其他工作。我试着让chatGPT为我编辑简历，试着让它解释一些非常专业的金融知识，到目前为止，它做得很完美。但它不会给你投资建议，相信我，我已经试过了。

人工智能的潜力确实是无限的。

DALL-E

OpenAI还开发了DALL-E，一个能够从文字描述中生成图像的机器学习模型。Deep Learning Language-based Image Generator(简称DALL-E)是在一个「文字对应图像」的数据库上训练出来的，能够基于用户提供的文字描述生成图像。例如，你可以输入 “用毕加索风格画一幅画”，DALL-E会生成大量毕加索风格的图像，你可以通过输入具体要求来添加更多细节。

DALL-E有可能彻底改变一些行业，如平面设计和广告。有了DALL-E，设计师和营销人员可以根据文字描述生成定制图像，在设计过程中节省时间和精力。DALL-E还可用于其他应用，如图像搜索和基于图像的推荐系统。

与其他组织的合作

目前OpenAI已与其他组织进行了一些合作，以共同推动人工智能领域。例如与微软合作，为自然语言处理和图像识别开发机器学习模型。它还与国际奥林匹克委员会（IOC）合作，探索人工智能在体育中的应用。其中一个例子是使用人工智能来分析体育数据，找寻可用于提高体育成绩的趋势和训练模式。通过与微软和国际奥委会这样的组织合作，OpenAI能够有效利用其他组织的专业知识和资源，在人工智能领域取得重大进展。

来自风险资本的投资

据报道，OpenAI正在商谈以招标方式出售股份，不少Venture Capital风险投资公司Thrive Capital（曾投资Instagram和Slack）和Founders Fund（由Paypal创始人Peter Thiel创立，曾投资Airbnb、Spotify和Palantir）正在谈判购买这些股份，预计是次交易将高达3亿美元，公司价值将达到290亿美元左右，这笔交易将使OpenAI的估值比1年前高出一倍。

另一方面，微软也在就增加对OpenAI的投资进行深入谈判，该公司在2019年向OpenAI投资了10亿美元，并成为其商业化合作伙伴。他们目前正在研究ChatGPT聊天机器人的准确性，并计划将其纳入微软自己的搜索引擎Bing中，目前Bing占全球搜索引擎流量的9%，而谷歌以83%的份额佔据主导地位。

结语

希望以上内容有助大家深入了解到OpenAI的工作和他们所开发的模型。从GPT到ChatGPT和DALL-E，和OpenAI对人工智能领域所作出的重大贡献。

简介

GPT 与ChatGPT

这些模型是如何训练的？

监督式学习Supervised Learning

无监督式学习Unsupervised Learning

强化学习Reinforcement learning

潜在用途

DALL-E

与其他组织的合作

来自风险资本的投资

结语

相关资料

相關文章

13F报告是什麽？13F机构持仓哪里看？

被动型与主动型ETF比较，投资者应如何选择？

「新手入门」ETF是甚麽? 5分钟轻松弄懂ETF

英国王室是如何赚钱的？一文了解现时英国王室拥有的三个主要收入来源