机器学习和人工智能将会继续深入IT服务领域,并为软件工程师开发的应用程序提供补充。如果IT团队想跟上发展步伐,就需要提高他们的机器学习技能。

2

云计算服务为构建和部署人工智能和机器学习应用程序所需的一系列功能提供支持。在许多方面,人工智能系统的管理方式与IT专业人士在云平台中熟悉的其他软件非常相似。但只是因为可以部署应用程序,并不意味着可以成功地部署机器学习模型。

虽然这些共同点可能会促进过渡,但也存在着显著的差异。除了软件工程技能之外,组织的IT团队成员还需要拥有特定的机器学习和人工智能知识。除了技术专长之外,他们还需要了解目前可用的云计算工具来支持他们团队的计划。

IT专业人士需要探索在云端成功使用人工智能所需的五种机器学习技能,并了解亚马逊、微软和谷歌提供支持这些技能的产品。虽然这些技能有一些重叠,但不会有全能的技能。通过培养具有这些技能的团队成员,可以让组织获得利用基于云计算的机器学习的优势。

1. 数据工程

如果IT专业人员想在云平台实施任何类型的人工智能策略,都需要了解数据工程。数据工程包含一系列要求数据整理和工作流开发的技能,以及一些软件架构的知识。

IT专业知识的不同领域可以分解为IT专业人员应该完成的不同任务。例如,数据整理通常涉及数据源标识、数据提取、数据质量评估、数据集成和管道开发,以在生产环境中执行这些操作。

数据工程师应该能够轻松地使用关系数据库、NoSQL数据库和对象存储系统。Python是一种流行的编程语言,可以与批处理和流处理平台(如apachebeam)和分布式计算平台(如apachespark)一起使用。即使IT人员不是精通Python程序的专家,掌握一些Python语言的知识将使其能够从大量的开源工具中获取数据工程和机器学习。

数据工程在所有主要云平台中都得到了很好的支持。AWS公司提供了全面的服务来支持数据工程,例如AWS Glue,适用于Apache Kafka的Amazon Managed Streaming(MSK)和各种Amazon Kinesis服务。AWS Glue是数据目录以及提取、转换和加载(ETL)服务,其中包括对计划作业的支持。MSK是数据工程管道的有用构建块,而Kinesis服务对于部署可扩展流处理管道特别有用。

谷歌云平台提供了Cloud Dataflow,这是一项托管的Apache Beam服务,可以支持批处理和Steam处理。对于ETL流程,谷歌云平台提供了基于Hadoop的数据集成服务。

Microsoft Azure也提供了几种托管数据工具,例如Azure Cosmos DB、Data Catalog和Data Lake Analytics等。

2. 建立模型

机器学习是一门正在不断发展和进步的学科,IT人员可以通过研究和开发机器学习算法来从事自己的职业。

IT团队使用工程师提供的数据来构建模型和创建可以提出建议,预测值和对项目进行分类的软件。重要的是要了解机器学习的基础知识,即使许多模型构建过程都是在云中自动完成的。

作为模型构建者,需要了解数据和业务目标,制定问题的解决方案,并了解如何将其与现有系统集成的工作。

市场上的一些产品包括谷歌公司的Cloud AutoML,这是可以帮助组织使用结构化数据以及图像、视频和自然语言来构建自定义模型的服务,而无需对机器学习有更多的了解。 微软Azure在Visual Studio中提供了ML.NET模型构建器,该模型构建器提供了用于构建、训练和部署模型的界面。Amazon SageMaker是另一项托管服务,用于在云中构建和部署机器学习模型。

这些工具可以选择算法,确定数据中哪些特征或属性最有用,并使用称之为超参数调整的过程优化模型。这些服务扩展了机器学习和人工智能策略的潜在用途。正如人们驾驶汽车不必成为汽车机械工程师一样,IT专业人员也不需要获得机器学习的研究生学位来构建有效的模型。

3. 公平与偏差检测

算法做出的决策直接而显著地影响个人。例如,金融服务使用人工智能来做出有关信贷的决策,这可能会无意中对特定人群产生偏见。这不仅可能有拒绝信贷对个人带来的影响,而且还会使金融机构面临违反《平等信贷机会法》等法规的风险。

这些看似艰巨的任务对于人工智能和机器学习模型是必不可少的。检测模型中的偏差可能需要具有统计和机器学习技能,但是与模型构建一样,某些繁重的工作可以由机器完成。

FairML是用于审核预测模型的开源工具,可帮助开发人员识别工作中的偏见。检测模型偏差的经验还可以为数据工程和模型构建过程提供帮助。谷歌云的公平性工具在市场上领先,其中包括假设分析工具、公平性指标和可解释的人工智能服务。

4. 模型性能评估

模型构建过程的一部分是评估机器学习模型的性能。例如,根据准确性和召回率对分类器进行评估。回归模型(例如那些预测房屋出售价格的模型)是通过测量平均误差率来评估的。

如今表现良好的模型将来可能会表现不佳。问题不在于该模型是否以某种方式被破坏,而是该模型是根据不再反映其使用环境的数据进行训练的。即使没有突然的重大事件,也会发生数据漂移。重要的是评估模型并在生产中继续对其进行监视。

Amazon SageMaker、Azure Machine Learning Studio和Google Cloud AutoML等服务包括一系列模型性能评估工具。

5. 领域知识

领域知识并不是一种特定的机器学习技能,但它是成功的机器学习策略中最重要的部分之一。

每个行业都有一定的知识体系,必须以某种能力进行研究,尤其对于构建算法的决策者。机器学习模型受到约束以反映用于训练它们的数据。具有领域知识的IT人员对于知道在哪里应用人工智能,并评估其有效性至关重要。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-04-29 17:05:44
市场情报 零数科技:推动数据要素流通,服务人工智能发展
4月29日下午,由中国信息协会主办,上海零数科技有限公司、中国信息协会数据要素专业委员会共同承办,蚂蚁区块链科技(上海)有限公司、青岛数据集团联合协办的“2025数字中 <详情>
2025-04-25 11:08:36
市场情报 2025第三届区域银行数字化转型与技术应用峰会圆满落幕
作为国内最大的CIO社交平台,信众智年初新增金融板块,旨在打造一个跨行业的CIO、科技高管专家智库和知识输出变现平台,目前已经汇聚了约六万的高管人群。同时,平台提供会 <详情>
2025-04-23 16:50:00
市场情报 AI生态暗战升级,科技巨头铁幕下的终极博弈
一场围绕AI与智能体的标准、协议及生态的暗战已然蓄势待发。 在美剧《权力的游戏》中,不到终局,主角归属始终成谜。如今的AI行业,正上演着同样扣人心弦的戏码。​这并非 <详情>
2025-04-09 09:36:38
市场情报 易立德:国产替代破局之路, ETRX研发套件驱动工业创新升级
近年来,国家出台一系列政策支持国产工业软件发展,鼓励企业在关键领域使用国产软件,降低对国外技术的依赖。易立德的自研软件契合这一趋势,成为众多企业国产化转型的优质 <详情>
2025-04-07 17:21:20
云资讯 Meta迄今最强AI模型Llama 4现已在亚马逊云科技上正式可用
亚马逊云科技始终通过与如Meta等领先的AI公司紧密合作,确保客户能在第一时间使用最新模型。 <详情>
供需牵引 生态共筑——2025中国智算产业生态发展大会成功举办
2025-06-30 12:46:35
亚马逊云科技:Agentic AI处于爆发前夜 要做企业AI创新的首选
2025-06-27 17:35:02
CIDC探路汕头跨境数字枢纽:共绘跨境数据流通与算力协同新蓝图
2025-06-24 14:17:46
第一线陈姵妏:专有算网即服务 破解企业AI部署“升效-降本”难题
2025-06-24 14:13:07
阿喀琉斯之踵?!阿里云核心域名遭劫持
2025-06-24 14:08:46
破局生态壁垒,共筑算力未来——2025中国智算产业生态发展大会即将启幕
2025-06-24 13:57:58
红帽AI来了!让开源成为企业AI最优解
2025-06-24 10:49:47
完整议程揭秘 五大参会理由!2025中国智算产业生态发展大会即将启幕
2025-06-24 09:27:59
“数”启新程,“智”赢未来:和林格尔新区绿色算力与人工智能高质量发展之路
2025-06-23 17:32:10
瑞银实地探访星际之门:未来的希望还是空置的野心?
2025-06-23 16:48:30
投资45亿、3000P,灵武智慧算力科创谷项目预计于6月底完成主体结构封顶
2025-06-23 16:45:55
《绿色数据中心评价》落地 246家绿色数据中心背后价值何在?
2025-06-23 16:44:29
智擎破局:中电电气重塑绿色智能数据中心新范式
2025-06-23 16:41:53
统一算力“度量衡” 工信部发布《算力互联互通行动计划》
2025-06-23 16:39:31
GPU算力不低于7500P 新疆源动绿能AI智算中心启动建设
2025-06-23 16:38:17