云栖息地编号信息:[点击查看更多行业信息]
在这里,您可以找到来自不同行业的第一手云信息。你还在等什么?来吧。
机器学习似乎已经成为每个人追求的雄心勃勃的目标,超过80%的公司至少研究一个人工智能项目。
资料来源:unsplash
开始之前,最好问自己以下三个问题:
"这个机器学习模型有多精确?"
“培训需要多长时间?”
“你需要多少培训数据?”
用户通常想知道新模型加载需要多长时间,以及在性能或推广方面有多有效。他们想要一种基于性能来衡量整体成本的方法。不幸的是,上述问题的答案不能解决这个问题。
它们甚至具有误导性。
模特训练只是冰山一角。获取正确的数据集以及清理、存储、聚合、标记、建立可靠的数据流和基础设施管道需要巨大的成本,但大多数用户和人工智能/移动实验室公司忽略了这一点。
根据最近的研究,该公司将80%以上的时间花在人工智能/移动实验室项目的数据准备和工程上。换句话说,如果大部分精力集中在建造和训练模型上,总的工程工作量和成本可能是预期的五倍。
此外,机器学习模糊了用户和软件开发人员之间的界限。
AIaaS或MLaaS已经开始出现。随着数据的增长,云模型也在不断改进。这就是为什么多边投资协定比SaaS更具挑战性。
资料来源:黄巴士底
机器模型从训练数据中学习,因此如果没有高质量的数据,模型就不能很好地工作。在大多数情况下,用户不知道生成或注释适当数据集的最佳实践。
当系统性能不佳时,用户通常会责怪模型。因此,人工智能/移动学习公司通常花费大量的时间和资源在培训和与用户合作上,以确保数据质量,这成为人工智能公司和客户的共同责任。
例如,为了在生产线上培训缺陷检测模型,计算机视觉公司需要与客户合作,在正确的角度和位置安装摄像机,检查分辨率和帧速率,并确保每个场景都有足够的正负培训样本。
有时机器人或车辆需要手动操作,因此使用机器人或自动驾驶汽车应用程序收集数据更加耗时和昂贵。
即使经过培训课程和阅读所有用户手册和指南,您仍然无法完全控制用户生成的数据。一家机器视觉相机公司告诉我,他们的工程师将手动验证所有数据,以确保其输入完整。
资料来源:unsplash
所有这些经常被忽视的额外培训、人工检查、数据清理和标记任务将为人工智能带来巨大的间接成本。这就是为什么应该构建更多可扩展的人工智能/人工语言项目。那么如何解决这个问题呢?
可扩展性是关键。确定大量客户愿意购买的正确用例,并使用相同的模型架构来解决它们。最后,您需要为没有标准产品的不同公司构建和培训不同的模型。
尽可能提供自助服务。尽可能自动化培训和数据管道,以提高运营效率并减少对人工的依赖。与内部工具或自动化相比,公司更重视对开放客户可见的功能,但前者将很快获得回报。您需要确保为内部流程自动化分配足够的资源。
最后,确定并跟踪成本,尤其是隐性成本。工程师花了多少时间来清理、过滤或聚合数据?他们花了多长时间来确保第三方正确完成评论?他们需要多长时间来帮助客户设置环境并正确收集数据?其中有多少可以自动化或外包?
通往训练的道路可能既艰难又漫长,但迟早会有一些问题需要面对。
[云起在线教室]产品和技术专家每天分享!
课程地址:https://yqh.aliyun.com/live
立即加入社区,与专家面对面,并了解课程的最新进展!
[云栖在线课堂社区]https://c.tb.cn/F3.Z8gvnK
发布者:2020-04-14
作者:核心阅读
这篇文章来自“51CTO”。如果你知道相关信息,你可以注意“51CTO”。
发表评论