人工智能的培训方式:如何扩展?

云栖息地编号信息:[点击查看更多行业信息]

在这里,您可以找到来自不同行业的第一手云信息。你还在等什么?来吧。

机器学习似乎已经成为每个人追求的雄心勃勃的目标,超过80%的公司至少研究一个人工智能项目。

人工智能的培训方式:如何扩展?

资料来源:unsplash

开始之前,最好问自己以下三个问题:

"这个机器学习模型有多精确?"

培训需要多长时间?”

“你需要多少培训数据?”

用户通常想知道新模型加载需要多长时间,以及在性能或推广方面有多有效。他们想要一种基于性能来衡量整体成本的方法。不幸的是,上述问题的答案不能解决这个问题。

它们甚至具有误导性。

模特训练只是冰山一角。获取正确的数据集以及清理、存储、聚合、标记、建立可靠的数据流和基础设施管道需要巨大的成本,但大多数用户和人工智能/移动实验室公司忽略了这一点。

根据最近的研究,该公司将80%以上的时间花在人工智能/移动实验室项目的数据准备和工程上。换句话说,如果大部分精力集中在建造和训练模型上,总的工程工作量和成本可能是预期的五倍。

此外,机器学习模糊了用户和软件开发人员之间的界限。

AIaaS或MLaaS已经开始出现。随着数据的增长,云模型也在不断改进。这就是为什么多边投资协定比SaaS更具挑战性。

人工智能的培训方式:如何扩展?

资料来源:黄巴士底

机器模型从训练数据中学习,因此如果没有高质量的数据,模型就不能很好地工作。在大多数情况下,用户不知道生成或注释适当数据集的最佳实践。

系统性能不佳时,用户通常会责怪模型。因此,人工智能/移动学习公司通常花费大量的时间和资源在培训和与用户合作上,以确保数据质量,这成为人工智能公司和客户的共同责任。

例如,为了在生产线上培训缺陷检测模型,计算机视觉公司需要与客户合作,在正确的角度和位置安装摄像机,检查分辨率和帧速率,并确保每个场景都有足够的正负培训样本。

有时机器人或车辆需要手动操作,因此使用机器人或自动驾驶汽车应用程序收集数据更加耗时和昂贵。

即使经过培训课程和阅读所有用户手册和指南,您仍然无法完全控制用户生成的数据。一家机器视觉相机公司告诉我,他们的工程师将手动验证所有数据,以确保其输入完整。

人工智能的培训方式:如何扩展?

资料来源:unsplash

所有这些经常被忽视的额外培训、人工检查、数据清理和标记任务将为人工智能带来巨大的间接成本。这就是为什么应该构建更多可扩展的人工智能/人工语言项目。那么如何解决这个问题呢?

可扩展性是关键。确定大量客户愿意购买的正确用例,并使用相同的模型架构来解决它们。最后,您需要为没有标准产品的不同公司构建和培训不同的模型。

尽可能提供自助服务。尽可能自动化培训和数据管道,以提高运营效率并减少对人工的依赖。与内部工具或自动化相比,公司更重视对开放客户可见的功能,但前者将很快获得回报。您需要确保为内部流程自动化分配足够的资源。

最后,确定并跟踪成本,尤其是隐性成本。工程师花了多少时间来清理、过滤或聚合数据?他们花了多长时间来确保第三方正确完成评论?他们需要多长时间来帮助客户设置环境并正确收集数据?其中有多少可以自动化或外包?

通往训练的道路可能既艰难又漫长,但迟早会有一些问题需要面对。

[云起在线教室]产品和技术专家每天分享!

课程地址:https://yqh.aliyun.com/live

立即加入社区,与专家面对面,并了解课程的最新进展!

[云栖在线课堂社区]https://c.tb.cn/F3.Z8gvnK

发布者:2020-04-14

作者:核心阅读

这篇文章来自“51CTO”。如果你知道相关信息,你可以注意“51CTO”。