机器学习和人工智能将会继续深入IT服务领域,并为软件工程师开发的应用程序提供补充。如果IT团队想跟上发展步伐,就需要提高他们的机器学习技能。

2

云计算服务为构建和部署人工智能和机器学习应用程序所需的一系列功能提供支持。在许多方面,人工智能系统的管理方式与IT专业人士在云平台中熟悉的其他软件非常相似。但只是因为可以部署应用程序,并不意味着可以成功地部署机器学习模型。

虽然这些共同点可能会促进过渡,但也存在着显著的差异。除了软件工程技能之外,组织的IT团队成员还需要拥有特定的机器学习和人工智能知识。除了技术专长之外,他们还需要了解目前可用的云计算工具来支持他们团队的计划。

IT专业人士需要探索在云端成功使用人工智能所需的五种机器学习技能,并了解亚马逊、微软和谷歌提供支持这些技能的产品。虽然这些技能有一些重叠,但不会有全能的技能。通过培养具有这些技能的团队成员,可以让组织获得利用基于云计算的机器学习的优势。

1. 数据工程

如果IT专业人员想在云平台实施任何类型的人工智能策略,都需要了解数据工程。数据工程包含一系列要求数据整理和工作流开发的技能,以及一些软件架构的知识。

IT专业知识的不同领域可以分解为IT专业人员应该完成的不同任务。例如,数据整理通常涉及数据源标识、数据提取、数据质量评估、数据集成和管道开发,以在生产环境中执行这些操作。

数据工程师应该能够轻松地使用关系数据库、NoSQL数据库和对象存储系统。Python是一种流行的编程语言,可以与批处理和流处理平台(如apachebeam)和分布式计算平台(如apachespark)一起使用。即使IT人员不是精通Python程序的专家,掌握一些Python语言的知识将使其能够从大量的开源工具中获取数据工程和机器学习。

数据工程在所有主要云平台中都得到了很好的支持。AWS公司提供了全面的服务来支持数据工程,例如AWS Glue,适用于Apache Kafka的Amazon Managed Streaming(MSK)和各种Amazon Kinesis服务。AWS Glue是数据目录以及提取、转换和加载(ETL)服务,其中包括对计划作业的支持。MSK是数据工程管道的有用构建块,而Kinesis服务对于部署可扩展流处理管道特别有用。

谷歌云平台提供了Cloud Dataflow,这是一项托管的Apache Beam服务,可以支持批处理和Steam处理。对于ETL流程,谷歌云平台提供了基于Hadoop的数据集成服务。

Microsoft Azure也提供了几种托管数据工具,例如Azure Cosmos DB、Data Catalog和Data Lake Analytics等。

2. 建立模型

机器学习是一门正在不断发展和进步的学科,IT人员可以通过研究和开发机器学习算法来从事自己的职业。

IT团队使用工程师提供的数据来构建模型和创建可以提出建议,预测值和对项目进行分类的软件。重要的是要了解机器学习的基础知识,即使许多模型构建过程都是在云中自动完成的。

作为模型构建者,需要了解数据和业务目标,制定问题的解决方案,并了解如何将其与现有系统集成的工作。

市场上的一些产品包括谷歌公司的Cloud AutoML,这是可以帮助组织使用结构化数据以及图像、视频和自然语言来构建自定义模型的服务,而无需对机器学习有更多的了解。 微软Azure在Visual Studio中提供了ML.NET模型构建器,该模型构建器提供了用于构建、训练和部署模型的界面。Amazon SageMaker是另一项托管服务,用于在云中构建和部署机器学习模型。

这些工具可以选择算法,确定数据中哪些特征或属性最有用,并使用称之为超参数调整的过程优化模型。这些服务扩展了机器学习和人工智能策略的潜在用途。正如人们驾驶汽车不必成为汽车机械工程师一样,IT专业人员也不需要获得机器学习的研究生学位来构建有效的模型。

3. 公平与偏差检测

算法做出的决策直接而显著地影响个人。例如,金融服务使用人工智能来做出有关信贷的决策,这可能会无意中对特定人群产生偏见。这不仅可能有拒绝信贷对个人带来的影响,而且还会使金融机构面临违反《平等信贷机会法》等法规的风险。

这些看似艰巨的任务对于人工智能和机器学习模型是必不可少的。检测模型中的偏差可能需要具有统计和机器学习技能,但是与模型构建一样,某些繁重的工作可以由机器完成。

FairML是用于审核预测模型的开源工具,可帮助开发人员识别工作中的偏见。检测模型偏差的经验还可以为数据工程和模型构建过程提供帮助。谷歌云的公平性工具在市场上领先,其中包括假设分析工具、公平性指标和可解释的人工智能服务。

4. 模型性能评估

模型构建过程的一部分是评估机器学习模型的性能。例如,根据准确性和召回率对分类器进行评估。回归模型(例如那些预测房屋出售价格的模型)是通过测量平均误差率来评估的。

如今表现良好的模型将来可能会表现不佳。问题不在于该模型是否以某种方式被破坏,而是该模型是根据不再反映其使用环境的数据进行训练的。即使没有突然的重大事件,也会发生数据漂移。重要的是评估模型并在生产中继续对其进行监视。

Amazon SageMaker、Azure Machine Learning Studio和Google Cloud AutoML等服务包括一系列模型性能评估工具。

5. 领域知识

领域知识并不是一种特定的机器学习技能,但它是成功的机器学习策略中最重要的部分之一。

每个行业都有一定的知识体系,必须以某种能力进行研究,尤其对于构建算法的决策者。机器学习模型受到约束以反映用于训练它们的数据。具有领域知识的IT人员对于知道在哪里应用人工智能,并评估其有效性至关重要。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-04-29 17:05:44
市场情报 零数科技:推动数据要素流通,服务人工智能发展
4月29日下午,由中国信息协会主办,上海零数科技有限公司、中国信息协会数据要素专业委员会共同承办,蚂蚁区块链科技(上海)有限公司、青岛数据集团联合协办的“2025数字中 <详情>
2025-04-25 11:08:36
市场情报 2025第三届区域银行数字化转型与技术应用峰会圆满落幕
作为国内最大的CIO社交平台,信众智年初新增金融板块,旨在打造一个跨行业的CIO、科技高管专家智库和知识输出变现平台,目前已经汇聚了约六万的高管人群。同时,平台提供会 <详情>
2025-04-23 16:50:00
市场情报 AI生态暗战升级,科技巨头铁幕下的终极博弈
一场围绕AI与智能体的标准、协议及生态的暗战已然蓄势待发。 在美剧《权力的游戏》中,不到终局,主角归属始终成谜。如今的AI行业,正上演着同样扣人心弦的戏码。​这并非 <详情>
2025-04-09 09:36:38
市场情报 易立德:国产替代破局之路, ETRX研发套件驱动工业创新升级
近年来,国家出台一系列政策支持国产工业软件发展,鼓励企业在关键领域使用国产软件,降低对国外技术的依赖。易立德的自研软件契合这一趋势,成为众多企业国产化转型的优质 <详情>
2025-04-07 17:21:20
云资讯 Meta迄今最强AI模型Llama 4现已在亚马逊云科技上正式可用
亚马逊云科技始终通过与如Meta等领先的AI公司紧密合作,确保客户能在第一时间使用最新模型。 <详情>
scaleFabric首发:中科曙光全栈自研突破,大规模智算互联的国产底座来了
2026-03-13 22:15:13
57亿算力大单落地(哈密28、德令哈15、百度8.4)、阿里143亿将交付、润泽238亿港元重仓香港、16项目15智算6备案、中移50亿1.5万P中心封顶
2026-03-11 14:25:00
“算力绿洲”——中东地区数据中心及云项目盘点
2026-03-11 11:33:28
数据中心她力量:AIGC 浪潮下,八位领军者原声解构算力新周期
2026-03-11 11:31:08
深度|泰国算力交付全面提速,AWS、Google、微软、阿里云、TikTok五大巨头押注EEC走廊
2026-03-11 11:23:00
总金额超9.6亿元,同一联合体连中宁夏两大算力项目
2026-03-10 11:40:29
1.2亿,廊坊市云风数据中心机电EPC项目公布中标结果
2026-03-10 11:38:22
Oracle与OpenAI放弃星际之门旗舰数据中心扩建计划
2026-03-10 11:36:30
中兴通讯2025年营收1339亿元,算力营收同比增150%,构筑AI端到端全栈竞争力
2026-03-06 21:37:00
定档 6 月 25 日,2026中国智算产业大会火热招商中~
2026-03-06 10:32:00
维谛技术(Vertiv):雅砻江畔,智算新篇|全国首个高海拔岩洞智算中心如何点亮绿色算力新纪元
2026-03-04 16:52:20
“不明物体撞击” AWS阿联酋数据中心受损起火
2026-03-03 09:50:56
算力租赁行业涨价潮持续 或于2027年缓解
2026-03-03 09:48:36
某银行巨资「爆改」老机房;智算大单惨遭「弃标」;某大厂110亿购AI服务器;某公司高价托管「液冷机柜」丨算力情报局Vol.05
2026-03-03 09:46:00
白宫:AI巨头有义务自行解决电力需求
2026-03-02 10:17:52