在人工智能领域企业仍然不关心自己的数据

2020-04-20 10:00:14

数据是推动人工智能和机器学习举措的原材料，但实际上不可能是那么原始。它需要尽可能准确、及时和完善-否则人工智能将带来错误或有偏见的结果。在这个阶段，大多数企业还没有完全锁定在人工智能工作中使用的数据的可行性。

人工智能中代码级别的潜在偏差已在诸如凯茜·奥尼尔的数学销毁武器等工作中得到了很好的记录，这要求在驱动从信誉到公司业绩的所有决策的算法中提高透明度。

根据O‘Reilly的Latestsurvey，1388名数据科学家、管理人员和IT专业人员对人工智能的采用进行了调查，数据也需要加以研究，这样做的努力才刚刚开始。调查发现，人工智能的努力正在从原型走向生产，但组织支持仍然是一个障碍。报告的作者Roger Magoulas和Steve Swoyer报告说，“数据治理尚未成为优先事项”，他们指出，只有大约五分之一的答复者“实施了支持和补充人工智能项目的正式数据治理程序和/或工具。

从业人员和高管认识到，数据治理是人工智能的迫切要求，一些人确实打算实施更多的数据治理。四分之一的受访者（26%）表示，他们的组织可能会在未来一年建立正式的数据治理程序或工具，至少35%的人预计在未来三年内这样做。然而，这意味着近三分之二的人工智能采用者仍然缺乏强大的数据治理机制。

马古拉斯州和斯沃耶州说：“人工智能的采用者，就像世界各地的组织一样，似乎把数据治理当作一种添加剂，而不是一种基本成分。” 他们敦促人工智能采用者从一开始就将数据来源、数据谱系、一致的数据定义和丰富的元数据管理等最佳做法和机制纳入其人工智能项目。他们补充说：“将数据治理视为软件开发中类似的过于保守性。” 数据治理是确保人工智能成果的透明度。

欧赖利的调查还发现，TensorFlow引线是最广泛采用的人工智能工具，被近55%的受访者引用。在去年的调查中，TensorFlow也是首选。 Magoulas和Swoyer观察到，Python相关工具也继续主导着AI开发场景。 “与人工智能相关的五种最流行的工具中有四种要么是基于Python的工具，要么是通过Python工具、库、模式和项目进行排序。” 随着TensorFlow的发展，这包括学习（48%）、Py火炬（36%）和Keras（34%）。

在机器学习技术方面，监督学习仍然是最受欢迎的，在73%的成熟人工智能网站中使用。在前一年的调查中，监督学习也起到了带头作用。深度学习遵循约66%，基于模型的方法遵循60%.. 大多数公司都在使用多种方法。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢

标签：人工智能