您的位置首页 >技术 >

释放数据

“没有勇气飞翔的翅膀有什么好处?”当我想到领先的人工智能技术提供商之间的开源热潮时,这些智慧的话就浮现在脑海。包括IBM,Google和Facebook在内的顶级公司已经开放了其人工智能软件工具的源代码,使开发人员可以在自己的设备和应用程序中使用它们。对于公司本身和整个AI业务而言,这无疑是一件好事。

但是,开源只是其中的一部分。与前几代软件不同,没有数据集就无法使用AI算法。与开放源代码政策相反,这些公司保持了封闭数据的立场,their积了庞大的信息库,这是开发更好的AI技术的竞争优势。

从本质上讲,这些公司给了我们翅膀-但否认了我们的天空。顶尖科技公司需要的是勇于停止ho积信息并拥抱开放数据,使世界其他地方可以访问AI认知引擎发挥其全部潜力所需的信息。

丰富的数据变得更加丰富。

在AI时代,新的1%出现了。上层外壳由拥有机器学习技术和大量信息的公司组成。

一些公司被称为AI业务的“超级富豪”,包括Google,Facebook,亚马逊和微软。据报道,尽管世界上这些公司很少,但它们在机器学习领域比其他所有人都拥有巨大的优势,因为它们可以访问大量的干净,结构化数据。

训练机器学习算法需要这些数据,从而为它们提供在现实世界中自行运行所需的基本信息。例如,将通过查看大量描绘猫科动物的图像来训练旨在识别照片中的猫的对象识别算法。这些图像必须具有某种结构,即,必须使用正确地指示它们在描绘猫的关键字来标记它们。

训练数据的数量越大,算法将执行得越好,更多的信息提供了更多可用于查找模式的示例。相反,训练数据不足会导致算法产生不合格的结果,有时甚至使创建者感到非常尴尬。

因此,AI算法的实用性本质上与高质量数据的可用性有关。在这方面,AI算法与其他类型的软件根本不同,后者的代码本身很有价值,没有任何其他数据。

因此,当一家公司开源AI认知引擎(例如翻译工具)时,就与开源诸如电子表格之类的传统软件不同。如果不同时提供对数据的访问,则打开并不是真正的打开。

心胸狭窄。

这样的数据拒绝绝非偶然。相反,这是保持竞争优势的有意策略的一部分。凭借众所周知的且分布良好的AI模型,数据集是可以与竞争对手隔离开来并与竞争对手隔离的一种商品。

这就是顶级技术公司积are数据的原因。例如,IBM不想购买The Weather Channel的数据业务,因为它想知道明天塔拉哈西市是否会下雨。

天气是驱动全球GDP的第一大因素。通过将Weather Channel庞大的与气候相关的信息库与其Watson AI相结合,IBM可以带头为私营企业预测天气,从而使其能够进行从预测冬季能源需求到预测作物单产的所有工作。

这给IBM带来了巨大的市场影响力和内在的优势,这是其他公司难以匹敌的。

Google,Facebook和其他公司在各自领域具有类似的优势,拥有大量的消费者和社交媒体数据,可用于训练非常有价值的AI任务,从市场营销的情感分析到照片的对象识别再到自然语言处理用户界面。

开放季节。

技术巨头提供的开放式AI软件工具的示例包括:

Google的TensorFlow,用于构建和训练神经网络。

Microsoft的Computational Network Toolkit,可用于包括机器翻译,图像识别,图像字幕,文本处理,语言理解和语言建模的应用程序。

IBM的SystemML,可用于创建定制的机器学习软件。

Facebook的深度学习技术,该公司已将其捐赠给名为Torch的开源软件项目。

通过这些计划,这些公司实质上是在提供大量的人力和知识产权投资产品。但是,这些努力远非无私的。通过扩散技术,公司旨在建立习惯于使用其工具的大型开发人员社区,并将其建立为AI市场的标准。

此外,由于AI的真正价值被锁定在其专有数据中,因此这些公司通过放弃其软件工具而损失不多。

数据转储。

那么,如何才能说服公司为了AI业务的更大利益而放弃其珍贵的数据呢?在一个名为“运动”的优步计划中可以找到一个例子,该计划公开了该公司车队收集的有关城市交通模式的数据。通过Uber Movement网站,城市规划者可以收集信息以帮助改善交通状况。

优步有什么用?该公司不会自行进行道路规划和建设,因此将这些信息提供给规划师可以使政府进行更改,从而改善驾驶条件。这样可以改善Uber车辆的用户体验。

对于拥有大量数据宝藏的AI技术公司而言,可能还有其他机会开放信息访问渠道,以激发广泛的社会利益。这些好处可能会间接增加对其技术的需求。

人工智能市场已准备就绪-现在,所有大型企业所需要做的就是通过勇于开放自己的数据来为腾飞做准备。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。