与其他基于云的产品一样,Azure中的认知服务让企业用户能够更容易地使用AI服务。但是,其价格和整合仍然是一大挑战。
在企业用户中,云服务是AI应用的一个关键推手。对于Azure用户来说,一套被称为微软认知服务的产品正是发挥着这样的作用。
对于企业用户而言,人工智能即服务让他们能够较容易地使用上执行机器学习和深度学习等算法的应用,且无需购买和建设用于执行算法的昂贵定制基础设施。它还允许开发人员使用相同的后端代码为Windows、iOS、Android和浏览器客户端提供AI功能。
大多数的主流云供应商们都提供了一套基于AI的功能集(并在不断完善之),而微软认知服务则是目前大的功能集之一。以下简单列举了其主要功能以及与其他Azure服务和应用场景的集成选项。
微软认知服务组合有哪些内容?
与大多数AI产品类似,微软认知服务主要关注图像、语音、语言和非结构化数据分析。其产品组合拥有着超过二十个以上的服务,相关API和软件开发者工具包(SDK)可分为六类:
视觉:图像分析、对象识别和面部识别等功能;语音:转录口语和不同语种的文本翻译;语言:分析自然语言的服务,具体包括拼写检查、情绪分析以及对元数据和逻辑部分或断句的解析文本;知识:分析和映射数据的功能,以求发现诸如推荐或查询自动完成等任务的关系与模式;搜索:与Bing搜索引擎集成的服务,包括图像与新闻搜索API;以及实验室:仍处于开发阶段的各种实验性服务,具体包括基于手势的控制、地图路线规划与物流、路线与距离优化以及基于位置的分析。企业应用与应用程序
与那些模拟企业用户现有IT功能的众多云服务(例如计算实例、对象存储与数据库)不同,微软认知服务旨在实现全新的应用类型,而不是使用现有的。其中大多数的服务涉及了对之前难以处理的数据类型的分析,例如照片、视频、语音、位置和非结构化文本等。因此,人工智能和机器学习的应用场景高度依赖于企业用户的经营业务、其可用数据源以及其员工的创造性。
微软认知服务的一些企业应用示例包括:
一家荷兰家具企业使用建议API来为客户提供建议,例如经常一起购买的商品或基于过去订单历史的建议。一家企业使用微软的计算机视觉、人脸与表情API在各种不同的非结构化内容(包括文本、图像和视频等)中自动提取元数据。这家企业可以通过扫描视频来识别出每个人脸所表现出的情绪,然后为其打上标签,如幸福、悲伤或惊讶等。Uber使用人脸API来验证驾车司机与帐户登记的注册司机是否是同一人。
正如这些应用示例所示,销售支持、客户关系管理、安全、对话UI和图像/视频分析是微软认知服务的主要应用领域。
学习曲线与潜在挑战
对于已经非常熟悉云应用开发的开发人员来说,微软认知服务的学习曲线是很短的;而那些不了解云应用开发的员工也只需很少的编码就可以实现认知服务与Azure Logic Apps的集成。
但是,这些服务不是没有其挑战的。例如,很难将基于云的应用与内部数据源相连,无论这些数据源是驻留在中心数据库内还是分布在远程系统和末端传感器上。在部署生产AI应用之前,应实施混合网络和数据集成策略。开发人员还应当使用微软的免费服务层来进一步熟悉AI服务、API和SDK,从而开发和测试应用程序。
定价与可用性
微软公司通常会根据每月每个服务的API调用次数来为其认知服务定价。但是,鉴于服务的多样性以及企业用户的使用方式,其定价可能会令人困惑,特别是因为有几种定价模式都在并行使用:
表情、人脸、语言智能服务、Bing“语音-文本”和Bing“文本-语音”API 的定价都是按照每千次生产API事务调用来计算的,与开发/测试定价层不同,有限次的(通常为1千次)API事务调用是免费使用的。 Bing Long Form Speech API服务则是按照语音分析的单位时间(按分钟分摊)来计算的。建议和文本分析API是根据四个层次设定API事务调用数量的固定价格来收费,超出配额部分需超额收费。
企业用户可以通过免费层来测俄式这些服务,免费层为用户每月都提供了一定有限数量的API事务调用次数,其中超出限量将限制使用,不收取超额费用。使用Azure的在线定价计算器可根据特定应用程序需求来估算费用。
目前,微软认知服务仅在Azur众多区域中的一小部分中可用。大部分服务站美国西部或者在不依赖数据中心的区域可用。在西中部和东二美国区域以及西欧和东南亚,其中部分服务可用。