云计算服务团队提供机器学习功能的系统不仅是一个错误,而且也是危险的。

一家公司的云平台在一个周末发生故障,该公司云计算运营团队试图研究和探讨发生了什么问题。似乎有几个系统与一个先进的新的库存管理系统相关,这个系统启用了机器学习,但出现了问题。对其进行检测之后的结论如下:  

•将原始数据从运营数据库移动到训练数据库的批处理以及自动恢复过程失败。而在周末工作的运维团队成员试图重新提交,但并不是一次性全部提交,而是进行了四次更新,导致训练数据库处于不稳定状态。

•这导致机器学习系统中的知识模型使用错误的数据进行训练,并要求删除知识库中的新信息,并重建模型。  

•此外,一些外部数据馈送(例如定价和税务数据)同时更新到训练数据库。尽管这些工作正常,但考虑到运营数据不是很好,也需要退出知识库。  

•该系统两天内无法使用,考虑到生产力下降、客户不满以及公关问题,使该公司损失了400万美元。  

随着企业越来越多地使用“物美价廉”的基于云计算的机器学习系统,人们发现利用机器学习的系统操作起来非常复杂。企业运营小组希望降低困难程度和复杂性,但发现面临训练不足、人手不足和资金不足的问题。  

云计算运营团队可以通过相当容易的转换来处理基于云计算的数据库、存储、计算。考虑到基于云计算的系统与传统系统类似,大多数情况都是如此。

但是,运营团队在很大程度上还没有采用基于机器学习的系统。这些系统具有专门的用途,以及必须以某种方式监视和管理的专用系统,如数据库和知识引擎。这是当前运营团队失败的地方。  

这种情况很容易理解,但大多数企业都不会喜欢,因为它意味着花费更多资金用于机器学习的云计算运营,可能导致放弃。机器学习系统是一种技术链,如果小心使用,它们非常有效。如果处理不当,可能无法检测到故障,将会很危险。如果系统使用由此产生的错误知识,那么最终可能会出现严重的问题,而在造成很大的损害之前,这些问题可能无法被发现。似乎其风险大于回报。

【凡本网注明来源非中国IDC圈的作品,均转载自其它媒体,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。】

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-09-08 10:32:11
市场情报 亚马逊云科技针对人工智能/机器学习工作负载推出多项存储新服务及功能
存储服务的新功能重点包括为支持人工智能/机器学习、大数据分析等数据密集型工作负载进一步提升Amazon Elastic File System(Amazon EFS)读取和写入性能,以及Amazon Elas <详情>
2023-07-24 16:26:35
市场情报 亚马逊云科技人工智能与机器学习技术助力科学家绘制完整的脑部地图
艾伦研究所数据和技术主管Shoaib Mufti带领团队与亚马逊云科技合作,将利用这张脑图创建全球大的脑细胞开源数据库。这是人类首次对关于哺乳动物大脑结构和功能的大规模数据 <详情>
2022-12-06 11:10:00
云资讯 亚马逊云科技推出八项Amazon SageMaker全新功能
2022年12月5日 ,亚马逊云科技在2022 re:Invent全球大会上宣布,为端到端机器学习服务Amazon SageMaker 推出八项新功能。 <详情>
2022-09-05 11:47:04
云资讯 亚马逊云科技推动AI/ML创新三大驱动力 加速人工智能与机器学习的规模化落地
亚马逊云科技通过三大AI/ML创新驱动力——处理海量多样化数据、加速推动产业规模化落地以及赋能更多AI开发者,加速推动各行业创新。 <详情>
2022-05-11 11:18:03
云资讯 亚马逊云科技:在云中打造统一数据基础底座是企业实现数智融合有效途径
数据与智能的统一和融合,意味着数据构建和实施项目更加高效,数据在两者之间能够无缝流转,企业可以快速具备相关能力,推动自身数字化转型迈向新的高度。 <详情>