株洲新闻网

首页 > 正文

深度学习再迎高光时刻 百度PaddlePaddle亮“成绩单”

www.xahq.cn2019-08-08
?

4月23日,首届WAVE SUMMIT 2019深度学习开发者峰会在北京举行。超过1,000名“开发”的开发人员和AI专家和学者见证了真正意义上的中国第一个深度学习开发者活动。可以看出,深度学习是对它的亮点时刻的欢迎。

百度高级副总裁,深度学习与应用国家工程实验室主任王海峰在会上表示,“深度学习将人工智能推向工业生产阶段,深度学习框架是操作系统。智能时代“。他认为:深度学习该技术已经具备了很强的多功能性,正在将人工智能推向工业生产阶段,呈现出标准化,自动化和模块化的特点。深度学习框架基于下一代,芯片,大型计算机系统以及各种商业模型和工业应用。它是智能时代的操作系统。

img_pic_1556163187_0.jpeg

PaddlePad全景首次曝光11项新功能和服务引人注目

作为最早研究深度学习技术的公司之一,百度于2013年建立了世界上第一家深度学习研究机构。经过沉淀和积累,百度PaddlePaddle于2016年正式开源,成为中国第一个也是唯一一个开源和完整功能的终端。 - 深层学习平台。 2017年,经国家发展和改革委员会批准,百度领导建立了国家唯一的深度学习技术和应用国家工程实验室。百度在深度学习领域的实力显而易见。

核心技术是该国的重武器。 PaddlePaddle是一个为期三年的开源软件,在深度学习开发者峰会上交出了“成绩单”。

百度深度学习技术平台总监马艳军首次推出了PaddlePaddle全景图。它将核心框架,工具组件和服务平台集成到端到端的开源深度学习平台中,包括支持实际应用程序和实现工业级应用程序的模型。大规模数据场景的分布式培训功能,支持多种异构硬件的高速推理引擎等。这次发布了11项新功能和服务,包括用于各种深度学习开发,培训和预测链接的“硬通货”。如PaddleNLP,视频识别工具集,Paddle Serving,PaddleSlim和AutoDL Design。该网站还公布了“亿元人民币”AI Studio计算支持计划,首次公布PaddlePaddle中文名称“飞桨”。

马艳君说:“百度不仅提供深度学习框架,而且提供完整的工具组件和服务平台紧密相关和灵活组合,涵盖所有初学者,零基础算法工程师,算法工程师,研究人员,平台。功能覆盖更完整,覆盖的用户更全面,每个部分的开放更顺畅。“

img_pic_1556163187_1.jpeg

首先,核心框架层开辟了从开发到培训再到预测的一整套功能。在开发过程中,PaddlePaddle开辟了60多个真实业务场景验证的官方模型,涵盖了视觉,NLP和推荐等AI核心技术领域,并已成为最官方支持模式的最深学习平台。 PaddleCV的新版本和业界首款视频识别工具集。用于工业应用的中文NLP工具集PaddleNLP在共享框架代码中实现了多种自然语言处理模型,减少了开发人员在开发过程中的重复工作。它具有最好的内部语义表示模型和基于用户大数据训练的应用任务模型。该模型源于工业实践,实现了工业级应用效果。

第一个重发布视频识别工具集为开发人员提供了一系列视频理解,视频编辑和视频生成任务。它开辟了七个视频分类经典模型,共享一组配置文件,共享一组数据读取和评估代码,覆盖主流视频识别方向领先模型,实现一键效率。配置进行培训和预测。

在培训课程中,大规模分布式培训从三个方面进行了升级。首先,多机多卡的全面高效支持提高了速度;其次,在CPU的应用场景中,为大规模稀疏特征设计并开放了大规模稀疏参数服务器,开发人员可以轻松下载相关镜像;分布式培训支持在各种容器上进行高速操作,同时支持使用PaddlePaddle在K8S生态系统中进行培训。

在数据处理方面,优化分布式IO并提高远程文件系统的流读取能力。 GPU多机多卡同步训练通过增加稀疏通信能力来提高带宽不敏感的训练能力。在低带宽网络带宽网络环境中,如10G网络,同步训练可以加速10次。

在开发和培训之后,将模型部署到各种应用场景是关键的一步。部署过程需要高速推理引擎。在此基础上,为了在更多硬件上部署,通常需要进行模型压缩。在实际使用中,它还需要软硬功能的支持。基于此,PaddlePaddle已经准备了一个完整的端到端全流程部署解决方案,并将继续扩展对各种类型硬件的支持。基于多硬件支持,PaddlePaddle提供了全面的领先底层加速库和推理引擎。 Paddle Serving的新版本支持在服务器端快速部署。不仅如此,模型体积压缩库PaddleSlim对于开发人员来说也是一个“惊喜”,对于已经很小的MobileNet模型,它仍然可以实现超过70%的体积压缩而不会失去模型效果。

灵活性,效率和易用性是PaddlePaddle如此受欢迎的重要原因。在许多新版本和大量升级中,工具组件尤为突出。这一次,PaddlePaddle不仅开辟了AutoDL Design,升级了PARL,还提出并发布了PaddleHub,这是一种预训练的一站式管理工具。

传统神经网络的结构设计是由人们根据经验设计的,而连续调整训练是为了获得最佳效果,这个过程更加复杂,费时费力。 AutoDL Design的自动化网络结构设计是深度学习和深度学习设计,现在已经超越了人类专家设计的网络效果。升级后的学习工具PARL在算法覆盖,高性能通信和并行训练方面拥有广泛的支持和扩展。易于使用的预训练模型管理工具PaddleHub提供三种功能,包括训练前模型管理,命令行一键式使用和迁移学习。十行代码允许开发人员完成模型迁移。

百度投入1亿元的免费计算能力有望被打破

大数据、大模型、大计算能力是深度学习发展的重要因素。计算能力的重要性是不言而喻的。百度已经投入了1亿元的免费计算能力,迫使普通开发者去打破这种能力。马延军宣布,百度的一站式开发平台ai studio已经启动了一个计算支持程序。”我们提供了1亿的免费计算能力,帮助开发者取得成功。”据报道,免费计算能力主要有两种模式,第一种是一人一卡模式,V100培训卡包括16G视频内存,最高的2t存储空间。另一种是远程集群模式,飞桨提供了一个高性能的集群,供开发者免费使用。

深度学习的标准化、自动化和模块化,推动人工智能进入工业生产阶段,进一步为工业升级提供强大的“助力”。基于PaddlePaddle,北京林业大学开发的信息素诱捕器害虫智能监测系统是基于红脂肪的大小。该系统的应用大大降低了害虫监测的人工成本。过去,手工测试需要一周的工作量,现在可以在一小时内自动检测。中国科学院遥感与数字地球研究所应用了更快的地理信息系统模型,结合特征提取网络和区域方案网络,以及具有综合注意力机制的V3 V3网络进行地质分析。遥感图像的t检测和语义分割。从而实现了主要工程目标的提取和建设用地变更图的绘制。支持国家对重大项目用地扩大和变化进行监测,有效管理和控制土地资源利用。

一方面,深度学习的发展是技术的不断创新和突破,另一方面,要建立一个完整健康的生态学。在大学,百度提供深入的教师培训,并通过协作教育基金和AI Studio教育版,培养深度学习领域的大学生;在开发者社区,PaddlePaddle提供免费在线课程,免费计算支持,以及不间断的活动互动活动,继续推动深度学习技术的发展;在企业方面,不仅是黄埔学院,还有“AI快速通道”计划和人工智能技术的生态支持计划,预计将深入支持1000家AI企业。

此外,百度还为开发人员精心打造了深度学习“江湖”。它不仅有一个公开课,教授深度学习“武术作弊”,而且还有一个“真实战斗”的开发者市场。满足深度学习开发人员的需求,从“心灵”到“面对面”。

这个由数千名开发人员组成的深度学习开发者峰会肯定会在中国引发前所未有的深度学习浪潮。加快深度学习技术和工业应用的发展必将成为历史上不可磨灭的标志。

热门浏览
热门排行榜
热门标签
日期归档