微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋
在Build 2018大会召开12天后,微软将其AI新战略从西雅图搬到了北京。
这是微软首次在北京举办的大规模人工智能大会。
微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋携微软技术院士黄学东、微软最新成立的云计算与人工智能事业部全球高级副总裁郭昱廷、微软(亚洲)互联网工程院副院长李笛上台,全面展示了微软在人工智能领域的技术、资源以及合作部署。
此次大会,微软推出多款新品方案以及合作计划,彰显出微软全面押注AI,争夺云计算与边缘计算市场的决心。
下面,智能菌为大家梳理了微软在中国AI市场的布局策略:
Azure:微软AI新时代的宏愿
与微软不久前举办的Build大会相同,微软此次在中国召开的人工智能大会也将重点放在了基于Azure的智能云与边缘计算上。
微软之前宣布了Azure IoT Edge开源,据悉,Azure IoT Edge能够在Linux和Windows上运行,能够允许开发者进行扩展、添加功能,并部署到任何环境中。
数据显示,到2020年全球智能边缘设备的总数将超过200亿台,微软对Azure IoT Edge物联网服务寄予厚望。
会上,微软还发布了最新的Azure Sphere预览,这是一款为联网微控制器(MCU)提供工业级安全保障的完整平台级解决方案。Azure Sphere方案将提供经过特殊设计的安全芯片、安全操作系统和云端安全。
目前,每年全球有90亿片微控制器被安装到从家用电器到工厂设备的各种机器中,但只有1%具有联网功能,Azure Sphere力图打开这一市场。
微软基于Azure云的认知服务于两年前推出,主要是以API的形式为开发者提供AI能力,覆盖语音、视觉、语言、机器翻译、OCR识别等24项服务。目前,微软已经有超过100万开发者使用认知服务。其中,据黄学东介绍,微软的语音和翻译新产品包括统一语音解决方案、量身定制功能、麦克风阵列开发系统。
微软还介绍了微软智能云上的一项托管服务Azure Batch AI,这项服务允许数据科学家和人工智能开发者以非常简单的方式利用包括GPU在内的Azure云计算资源对人工智能模型进行训练。
在对话式交互领域,微软重点介绍了Azure Bot Services对话机器人服务,目前已经累计有30万开发者采用该服务开发。对话机器人服务能够根据业务需求进行定制,还支持发布到微软小娜(Cortana)上。
不管是针对物联网的Azure IoT Edge,还是MCU解决方案Azure Sphere,托管服务Azure Batch AI,对话机器人服务Azure Bot Services,还是微软认知服务,微软都在加速基于Azure的全面AI部署方案。
据沈向洋透露,Azure智能云已覆盖全球50多个区域,并获得超过70项安全合规认证”。“Azure汇聚了微软在人工智能领域的全部投入与技术积累,是开发、部署、运行人工智能的最佳云平台,同时也是将智能云与智能边缘融会贯通的关键环节。”
由此可见,新战略下微软对于Azure的重视程度早已超过了Windows。
从平台级开发商切入,大规模收割市场
在微软Build大会上,纳德拉提出了微软未来的新定位,即致力于成就“智能云与智能边缘”时代的数字化转型。
要想实现这一目标,有Azure和一系列的技术平台基础后,还需要大规模的应用。
这一次,微软放下身段,大量吸引平台级开发商深度合作。
在Build大会上,微软也已经与亚马逊合作,将微软小娜结合到Alexa智能音箱中,让用户通过Alexa调用小娜及其背后的人工智能服务。
微软还宣布与高通合作打造运行Azure IoT Edge的视觉人工智能开发工具包,开发者可以利用Azure 机器学习服务及高通视觉智能平台与高通人工智能引擎的硬件加速开发应用解决方案,摄像头也可以用于更高级的Azure服务,例如机器学习、流分析和认知服务,并且可以从云端下载到边缘环境中在本地运行。
而在此次会议上,微软再次展示了其与无人机制造商大疆创新(DJI)达成的深度合作,后者将利用微软Azure IoT Edge服务开发适用于农业、建筑行业、公共安全及更多应用场景的解决方案。
微软还与合作伙伴小米生态链企业香蕉合作展示了基于微软认知服务开发的魔芋AI翻译机,能够提供14种语言的实时语音翻译。中国移动也正在与微软在语音识别、机器翻译技术应用方面展开深入合作。
会上,微软合作伙伴才云科技展示了利用Azure Batch AI服务为唯品会开发了容器化的人工智能解决方案,将其海外业务团队的效率提升了85%,对100万张图片进行分析标签化处理的时间缩短到之前的1%,让AI系统迭代的速度获得了极大的提升。
微软还推出“3个100”计划,将筛选Azure机器学习、Visual Studio Tools for AI等100项微软人工智能服务与开发工具,携手来自100家具有影响力的企业的开发者和数据科学家,共同创造出100个针对关键行业的人工智能解决方案和落地场景。
在这个计划中,微软将持续不断地提供产品与技术支持,和这些有影响力的公司以及他们的开发者和数据科学家开展形式不同的架构研讨和极客编程,以制造业、零售业、金融服务业为主要切入点,结合客户实际应用特点,从生产、制造、售卖、体验、营销、售后、服务、反馈等全阶段全过程落地实际应用场景,助力企业数字化转型。
沈向洋表示,中国开发者是微软生态系统中关键的组成部分。目前微软在中国拥有40多万开发者,其中超过10万人在使用微软人工智能进行开发。
微软AI的另一级:小冰在中国市场加速落地,将开放全双工语音技术
微软小冰是面向情商(EQ)维度发展的人工智能系统,已在五个国家落地。目前,微软小冰也在加速落地。
今天的大会上,微软小冰团队宣布了一项人工智能内容创造的全新技能,针对儿童市场推出定制化有声童话故事,将于儿童节正式上线。在这项定制故事的技能中,家长可以设置童话故事的主人公和故事倾向,如更偏教育意义等,然后安排微软小冰完成创作。
微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐。
据微软小冰团队相关人员介绍,小冰在短短20秒内即可完成一集约10分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准,而且该项服务目前完全免费。
微软小冰为助盲公益机构红丹丹提供中国大的公版儿童有声读物全集“小冰姐姐讲故事”,囊括上千小时的童话故事、科普百科、名人轶事等有声读物。红丹丹服务的104所盲校的学生和少年儿童都可以通过心目图书馆找到这些内容。
李笛介绍,截止目前微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等。在有声读物领域,微软已拥有接近4万集有声童话内容。6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。
此外,李笛还在会上宣布,微软将很快向合作伙伴和开发者开放“全双工语音技术(Full Duplex)”,开发者可以使用这项技术打造自己的对话应用。
一年多以前,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流。
今年4月,微软正式在美国和中国同步宣布了Full Duplex感官,并已完成产品化落地。小米生态链企业亿联客开发的Yeelight语音助手成为全球首个搭载全双工语音交互感官的智能设备。
联合中国多所大学布局AI教育,推在线AI学院
会上,微软亚洲研究院宣布讲联手北京大学、中国科学技术大学、西安交通大学、浙江大学共同发起共建“新一代人工智能开放科研教育平台”。这一平台将聚焦于中国人工智能领域的科研、教学和生态建设。
另外,为了推动全民AI,微软还推出在线人工智能学院,目标是一年内培养出10 万余名人工智能人才,将免费提供包括AI基础、核心技术和高阶应用在内的总共250课时的12门人工智能学分课程,覆盖10项应用技能。完成课程学习的用户,还可申请微软专业学位课程(MPP)作为职业技能认证。
在支持诸如TensorFlow、CNTK等业界主流的深度学习平台的同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。
目前,已经有15家公司支持ONNX,并且还有更多公司正在加入进来。现在已经有PyTorch等六种顶级框架支持ONNX,其它框架则可以通过转换器获得支持。
在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。
微软Project Brainwave能利用Azure上最先进的FPGA基础架构完成实时的人工智能处理。用户只需通过实时的单一批数据,就能得到以往需要多得多的批数据处理才能得到的性能,实现人工智能的实时计算。而且,FPGA运算不仅仅只在云端提,也可以通过Azure Stack混合云在本地提供FPGA。
沈向洋宣布,微软将充分发挥其在人工智能领域的全部优势技术和资源,与中国产、学、研各界展开全方位合作,为科研教育打造一流平台、为企业创新开发先进方案、为全民AI提供免费培训;与此同时,微软将认知服务扩展到智能边缘,推出ONNX项目及ML.NET开源跨平台人工智能开发框架,以18项创新技术、工具、服务,全力助推中国开发者。
微软亚洲研究院:Azure背后的AI实力支撑
作为美国以外规模大、功能最全的研究机构,微软亚洲研究院近几年在计算机视觉、自然语言理解等方面取得了很多突破:
2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%,胜过人类; 2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平; 2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数; 2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。
微软亚洲研究院开发的OCR技术,为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。目前手写识别OCR引擎V3.0版本的精度达到了70.5%,已经部署于微软认知服务,可供开发者用于自己开发的智能应用。