你是否真的需求机器学习?

云栖号资讯:【点击检查更多职业资讯】
在这里您能够找到不同职业的第一手的上云资讯,还在等什么,快来!

文中内容并非是从理论上去讨论哪些问题能够经过机器学习处理,而是意在协助那些没有数据科学家的团队了解运用机器学习是否真的有用。
机器学习当时境况奇妙。

机器学习的可行性已得到充分证明,简直一切最受欢迎的移动运用都或多或少运用了该项技能,从中可见一斑。但这一生态体系没有彻底老练到任何一位初学者都能够敏捷运用自若的程度。

关于团队而言,决议何时引进机器学习技能并非易事,尤其是关于短少数据科学家的团队。虽然软件工程人员一般对机器学习具有更高层次的了解,但他们一般短少范畴常识,难以断定自己所面临的问题是否适用机器学习处理。

文中内容并非从理论上去讨论讲哪些问题能够经过机器学习处理,而是意在协助那些没有数据科学家的团队了解运用机器学习是否会有用。

是否有其他人运用机器学习处理了相似的问题?

假如团队中没有任何经历丰富的机器学习工程师或数据科学家,那么是很难答复“是否有或许经过机器学习来处理某个问题?”

假如团队中短少数据科学家,应该怎么办?

  • 本身成为机器学习专家。这样你能够自己剖析问题,断定机器学习处理方案的可行性。
  • 聘任机器学习专家,完结上述作业。
  • 调研是否有其他人用机器学习处理了相似的问题。

前两个选项耗精力耗财力,而后者或许只需花一天时刻查找一下。

相关调研的长处,便是有助于确认作业的着手点。鉴于团队中没有数据科学家,不太或许针对问题规划出适用的模型架构。例如,假如需求构建一个客户支撑署理,那么能够去了解一下其他公司的做法。当然,你一定会涉及到 Rasa 和 Google Meena。

了解运用哪些模型和办法处理了相似的问题,有助于团队清晰作业的着手点。例如,工程师 Robert Lucian 构建了一款得到广泛运用的个性化车牌读取器。Lucian 的处理方案便是依赖于一些已有的方针检测和文本提取模型。

Lucian 在在文章中提及,他仅仅调研了其他人在相似范畴中正在运用的办法,从而着手完结了自己项目中的机器学习部分。他终究找到了那些专门针对车牌而调优的模型,及用于文本提取的有用模型。这样,他很快将两者参加到出产环境中。

是否具有相关的数据来历(无需考虑数据是否是自己的)?

除非你的问题运用原始预练习模型处理了,不然模型都需求运用相关数据进行练习。

例如,构建一个引荐体系引擎,需求用户材料特点以及阅读习气等数据。而构建一款客户支撑署理,则需求文档手册进行练习。为使模型适用于特定范畴,需求运用相应范畴数据进行练习。

可是,练习数据不必是自己具有的。即使并没有做杂乱的用户数据搜集,也可借助于一些揭露可用的数据。

例如,数月前开端盛行的文本类冒险游戏“AI Dungeon”,便是根据机器学习构建的。

你是否真的需求机器学习?

虽然游戏开发工程师 Nick Walton 只经过从 choiceyourstory.com 上抓取 50 MB 的文本做模型调优,但该游戏仍能够与当时最先进的模型相媲美。其成功应归功于搬迁学习,该技能将模型的“常识”(该游戏中运用了 OpenAI 的 GPT-2)搬迁到新的模型,并运用很小的数据集对更特定范畴做了调优,例如游戏中的地牢探索者的故事情形。

相关于其他处理方案而言,运用机器学习的成效是否显着?

在许多状况下,机器学习仅仅一种可作业的东西,但并非最优的东西。假如机器学习并不能供给比其它处理方案显着的长处,那么就不值得为此支付额定的开支。

对此问题的剖析,可借助于下列几个根本考量:

首要,除机器学习外,是否还有其它处理方案?

关于语音辨认、计算机视觉等许多运用,机器学习现在是最适用的处理方案。

其次, 其它处理方案是否能复现机器学习的猜测质量?

例如,在树立一个引荐体系中,假如搜集的用户数据不多,而且只要 100 条博客帖子可供引荐,那么运用根本的标签体系就彻底能够。假如用户喜爱 Javascript,那么就向用户展现一切具有“Javascript”标签的文章:

你是否真的需求机器学习?

可是,假如策划构建一个巨大的内容库,而且其间办理了很多的用户数据,那么机器学习关于完结个性化引荐的作用是绝无仅有的。
第三,其他处理办法是否具有机器学习那样的可扩展性?

机器学习的首要许诺之一,便是其灵活性足以消除那些传统上需求人工干预的流程中的人力参加。例如,库存办理是一个十分冗杂的作业,产品一般信息不完整,列出方法也不一致,导致常常需求手动处理。

在产品数量不多的状况下,人工处理彻底能够替代机器学习。可是关于很多的产品,人工做比对是不现实的。例如,处理一百万种产品,需求许多人花费很多时刻。而 Glisten 等产品运用机器学习剖析产品数据,可快速完结此类作业:

你是否真的需求机器学习?

何时何处适用机器学习

事实上,虽然机器学习有着许多优越性,但却往往运用在许多毫无意义的场景中。这导致许多人遍及对机器学习持怀疑态度,“不过又是一轮炒作罢了”。

现实状况是,就像其它一切广为运用的技能相同,机器学习仅仅在某些状况下的抱负处理方案,而并不适用于一切状况。项目上手时,最难的便是断定该项目是否需求运用机器学习,尤其是关于缺少该范畴经历的团队,期望本文能对正处于苍茫中的团队有所助益。

假如读者对怎么在出产环境中运用机器学习感兴趣,欢迎拜访 Cortex 示例代码库。

Cortex 项目地址:
https://github.com/cortexlabs/cortex/tree/master/examples

【云栖号在线讲堂】每天都有产品技能专家共享!
课程地址:https://yqh.aliyun.com/zhibo

当即参加社群,与专家面临面,及时了解课程最新动态!
【云栖号在线讲堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时刻:2020-05-06
本文作者:Caleb Kaiser
本文来自:“InfoQ”,了解相关信息能够重视“InfoQ”