您的位置首页 >企业 >

OpenAI推出了将其研究商业化的API

导读 给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识

给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识与大家分享。希望大家看完之后会喜欢。

OpenAI今天宣布推出新的API,以访问研究人员开发的新自然语言处理模型,包括最近发布的GPT-3。该公司声称,与大多数为用例设计的人工智能系统不同,该应用编程接口提供了一个通用的“文本输入,文本输出”界面,使用户能够尝试几乎所有的英语任务。

根据OpenAI的说法,API在前两个月免费提供Beta版本,只有合格的客户才能获得访问权限——这是一个注册过程。(研究人员来自Algolia、Koko、MessageBird、树苗、Replica、Casetext、Quizlet、Reddit等公司,以及米德尔伯里研究所等。在发布前进行了试点项目。该公司表示,API将支付费用,并使其与合作伙伴密切合作,看看在现实世界中使用人工智能系统时会遇到什么挑战。

“这一领域的进展速度意味着总会有令人惊讶的AI新应用,有积极的,也有消极的。对于明显有害的用例(如骚扰、垃圾邮件、激进化或干扰),我们将终止API访问。”OpenAI在他的博客中写道。“[这种]模式让我们更容易应对技术滥用。因为我们模型的下游用例很难预测,所以通过API发布并随着时间的推移扩大访问范围会更安全,而不是发布开源模型,在开源模型中,如果访问结果是有害的,就无法调整。”

给定任何文本提示,OpenAI的应用编程接口返回文本完成,以尝试大致匹配提供给它的模式。开发人员可以通过只展示一些例子来展示他们想要做什么,这样他们就可以“编程”它。它的成功取决于任务的复杂性。该应用编程接口还可以通过训练样本数据集或从用户或标签提供商的手动反馈中学习来提高其在特定任务上的性能。

例如,API可以在不使用关键字的情况下识别自然语言查询的相关内容。它还可以进行复杂的讨论——简短的提示,即生成涵盖从太空旅行到历史的一系列主题的对话,并将文本转换为简化的摘要。它甚至可以根据函数名和注释来完成代码。生成具有建议类别的电子表格;并使用一些有代表性的例子将自然语言转换成Unix命令。

“我们设计的API不仅对任何人来说都很容易使用,而且足够灵活,可以让机器学习团队更高效地工作。事实上,我们的许多团队现在都在使用API,这样他们就可以专注于机器学习研究,而不是分布式系统问题。”OpenAI继续说道。“我们希望API将使强大的AI系统更容易被小型企业和组织访问。”

OpenAI发布了从计算机视觉到自然语言处理(NLP)的AI子领域研究,其既定任务是安全创建超智能软件。这家初创公司始于2015年,是一家非营利组织,但后来被重组为一家盈利公司,在投资工具OpenAI LP下有上限。

OpenAI可能会遭到AI社区的强烈反对,称API将为其正在进行的研究、安全和政策工作提供财政支持。当然,OpenAI的进步并不便宜——光是GPT-3的内存需求估计就超过了350GB,训练成本超过了1200万美元。为了给他们提供资金,OpenAI此前从创始成员和投资者那里获得了10亿美元的捐赠,从微软那里获得了10亿美元的投资,其中一部分用于开发运行在Azure上的AI超级计算机。到目前为止,OpenAI LP已经吸引了雷德霍夫曼慈善基金会和科斯拉风险投资公司的资金。

根据OpenAI的说法,随着API通过其学术访问计划继续研究包括第三方研究人员在内的潜在滥用,API还将为基于它的大规模模型的开发提供信息。OpenAI表示,随着时间的推移,我们的目标是对API的潜在危害形成“透彻的了解”,不断完善工具和流程,将这些危害降到最低。

减少有害偏见和其他负面影响是整个行业的一个艰巨问题,非常重要。最终,我们的API模型确实会产生偏差,这种偏差有时会出现在生成的文本中。“OpenAI写道。”(这就是为什么)我们正在与用户合作开发用户指南,帮助他们相互学习,并在实践中缓解这些问题。【我们也】与用户紧密合作,深入了解他们的使用案例,并开发工具来标记和干预有害偏见,【并且】我们将对有害偏见、公平性和代表性进行自己的研究,这将有助于我们与用户沟通。"

过去,OpenAI采用谨慎且有争议的缓解方法。由于担心恶意演员滥用和伪造Deepfake的潜在自动化,GPT-2在去年2月首次亮相时选择不共享该模型的所有四个版本,从而在一系列任务中取得了领先的结果。批评这一决定的人说,未能公布源代码对社会和缺乏资源复制模型或其结果的科学家构成了潜在威胁。其他人称之为推广unt的负责人。

随后,OpenAI发布了几个更小、更简单的GPT-2版本,并研究了它们的接收和训练数据集。在判断“没有强有力的证据”滥用后,它在12月发布了一个完整的模型——并接受了从互联网上抓取的800万个文本文档的培训。

本文就为大家讲解到这里了。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!