找回密码
 立即注册
查看: 599|回复: 4

使用飞桨paddlepaddle安全吗?

[复制链接]

14

主题

0

回帖

57

积分

版主

积分
57
发表于 2023-5-4 18:39:14 | 显示全部楼层 |阅读模式
请问使用飞桨paddlepaddle安全吗?他会不会后台偷偷记录一些信息发送给百度?比如使用信息,测试成果,训练数据样本等。
回复

使用道具 举报

0

主题

1

回帖

4

积分

新手上路

积分
4
发表于 2023-5-4 18:39:45 | 显示全部楼层
不要搞什么阴谋论!!不如去担心某app,某购物软件,某娱乐软件,某流氓软件会不会记录你的信息并上传。
PaddlePaddle是国内做的比较好,也比较成熟的深度学习开源框架,面向的是所有开发者,是一个源于产业实践的开源深度学习平台。
PaddlePaddle的代码是完全开源的,除了百度内部的开发者,也有很多外部开发者给PaddlePaddle贡献代码。作为一个star数18K+,Contributor超过600的开源项目,真没必要也不会去想做『收集用户信息』的事情。

另外,PaddlePaddle下也有很多开源的项目,做的都很不错:
比如PaddleOCR:
https://github.com/PaddlePaddle/PaddleOCR/PaddleDetection:

https://github.com/PaddlePaddle/PaddleDetection
不一一列举了,大家可以去看看:
https://github.com/PaddlePaddle
回复

使用道具 举报

0

主题

2

回帖

18

积分

新手上路

积分
18
发表于 2023-5-4 18:39:57 | 显示全部楼层
导读:8月13日,中国自动化学会常务理事、百度首席技术官、深度学习技术及应用国家工程研究中心王海峰主任出席2021中国自动化大会并作题为“AI 大生产平台”的报告,王海峰主任在报告中指出人工智能是驱动新一轮科技革命与产业变革的战略性技术,深度学习框架与平台下接芯片,上承应用,处于人工智能技术体系的关键位置。并重点介绍了飞桨作为我国自主研发、功能丰富、开源开放的产业级深度学习平台,具备显著的标准化、自动化和模块化的工业大生产特征,正在赋能各行各业融合创新,推动产业智能化升级,促进经济高质量发展。
人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,实现AI产业的广泛应用是其中重要的一环,而在产业应用过程中怎样更高效、更低门槛的使用人工智能平台,这是AI技术能否深入产业的核心问题。
一、 人工智能进入工业大生产阶段
纵观世界经济社会发展的历史,如图1所示,第一次工业革命为人类带来机械技术,第二次工业革命为人类带来电气技术,第三次工业革命为人类带来信息技术,第四次工业革命为人类带来人工智能技术。四次工业革命有一个共同的特点,其核心技术都具有非常强的通用性。例如,虽然机械技术刚开始的应用是在特定行业中,但是随着技术发展会迅速普遍应用于各行各业。同时,当这些技术广泛应用于各行各业,并进入工业大生产阶段的时候,它们都呈现了较强的标准化、自动化和模块化的工业大生产特征。


图1 工业革命发展历程

从技术本身来看,人工智能技术几十年的发展史,是包含人工规则、统计机器学习和深度学习等不同阶段,并持续变迁的过程。下面以人工智能的经典技术方向为例说明。

(一) 语音识别
早期的语音识别,往往使用单一的模式匹配技术进行模式和特征的分析。随着技术发展出现了马尔可夫模型,这时语音识别技术有了一定的标准化和通用性。但仍存在一些问题,例如存在假设约束,训练容易饱和等。虽然语音识别技术整体采用马尔可夫模型,但是信号的处理、声学建模、语言建模、噪声处理等子模块往往使用的技术并不是标准化的。当语音识别发展到深度学习阶段时,这些假设约束就消失了,由于训练主要利用大规模的语音数据集,同时子模块还可以实现端到端的优化,这时标准化、自动化、模块化的工业大生产特征就显现出来。

(二) 文字识别
文字识别,也经历过类似的过程,早期主要使用的是人工规则加机器学习的技术方案。例如,一个典型的OCR的系统可以分为若干个模块,一张图片经过区域的检测、行分割、字分割、单字的识别之后会进行语言模型解码及后处理,最终实现OCR识别功能。但在小模块处理过程中误差会逐级累积,并且也需要用到很多启发式特征。应用深度学习技术之后,开发中的每个阶段目标较为明确,大体分为检测、识别两大模块,之后使用大量数据进行模型训练,最后进行模型部署。
随着技术的快速发展,文字识别中检测、识别这两个阶段如今融合成一个功能,实现了端到端的识别,而且可以进行多任务的联合训练,这时标准化、自动化和模块化的特征就越来越显著。

(三) 自然语言处理
自然语言处理中的早期机器翻译系统也是需要写入大量的人工规则,并且涉及到专业领域知识,同时开发成本和迁移成本都非常高。随着技术的迭代发展,行业开始使用各种统计机器学习的模型,例如最大熵的模型、支持向量机等模型,这时计算机可以进行一些自动训练,但是人仍需参与特征工程和训练模型的选择,并没有实现工业级的标准化。使用深度学习模型以后,这种标准化和自动化的程度全面提升。

(四) 机器翻译
机器翻译也是如此,其发展经历了从完全人工参与到半人工参与,最后实现全自动学习的三个过程。早期主要是人工转写规则的系统,发展到中期时转变成统计机器翻译,如今已经进化成神经网络机器翻译,这时的机器可以实现端到端翻译系统的训练。
由于深度学习技术的广泛应用,语音、视觉、自然语言处理等技术的研发变得更加标准化、自动化和模块化,深度学习正在推动人工智能进入工业大生产阶段。

二、 飞桨产业级深度学习开源开放平台
深度学习平台向下对接芯片,向上承接各种应用,它本身又包括开发、训练、推理、部署的核心框架,同时完整的深度学习平台有很多模型库、开发套件、工具组件等辅助工具。总体而言,深度学习平台相当于智能时代的操作系统。

但深度学习技术发展和大规模产业化面临挑战,在开发阶段,由于深度学习模型实现非常复杂,灵活和高效难以兼顾,所以导致开发周期也较长。另外,虽然大模型有非常好的效果,但是它的训练效率却非常低。同时,模型训练过程与模型结构、硬件平台有较强的耦合性,训练异常处理也很复杂。在推理阶段,由于深度学习推理面向端、边、云等各种场景,加上硬件类型复杂多样,这就导致部署非常困难,同时推理的速度也较慢。

为了解决开发、训练、推理部署等方面的问题,我们开发了一个完整的产业级深度学习开源开放平台。该平台包括开发、训练和推理部署核心框架,同时有各种模型库,例如,自然语言处理的Paddle NLP,计算机视觉的PaddleCV等等。大模型现在取得了非常好的效果,所以我们在模型库中也专门提供了一系列的大模型。语义理解、图像分类、目标检测、图像分割等都会提供相应的一整套开发套件,以及各种工具组件,包括预训练模型应用工具、全流程开发、可视化分析、安全与隐私、资源管理和调度等等工具。此外,还包括自动化深度学习、强化学习、联邦学习,以及AI支持科学计算、生物计算和量子机器学习等工具。

另外,在AI Studio深度学习社区中,每个人都可以使人工智能技术应用于自己的场景,并开发自己的产品进行技术创新、业务拓展或者科学研究,等等。

飞桨平台具备以下四个重要的核心技术优势。第一,开发便捷的深度学习框架;第二,超大规模训练技术;第三,多端多平台的高性能推理;第四,产业界模型库。

(一) 开发便捷的深度学习框架
深度学习框架通常涉及两种开发形式,一种是静态图,另一种是动态图。静态图比较高效,动态图较为灵活,为了兼顾这种高效和灵活,我们设计了编程一致的计算表示,实现动静统一的开发体验。如下图所示,一方面,高层接口同时具备动态图和静态图的接口,两者通过计算图表示来进行静态图执行和推理部署。另一方面,动态图接口也可以最终转为静态图执行和推理部署。同时,飞桨的深度学习框架还提供各种简洁易用的高层API进行封装和代码简化。


图2 深度学习框架

(二) 超大规模训练技术
为了实现超大规模的深度学习模型训练,需要开发一系列的深度学习模型训练技术,主要包含端到端的自适应分布式训练、自动感知硬件环境、多维混合并行策略、异步流水线执行四部分,如图3所示。


图3 大规模深度学习模型训练技术

(三) 多端多平台的高性能推理
使用多端多平台训推一体工具链,可以提升整个开发流程的效率。由于模型部署的环境非常复杂,涉及到多种操作系统和硬件以及不同的框架。飞桨提供的训推一体工具链是一整套软硬件兼容的环境,可以满足模型训练、模型的优化,推理部署整个流程,如图4所示。利用这些工具链,开发者可以根据应用场景和软硬件的环境,训练和部署自己的深度学习模型。


图4 多端多平台训推一体工具链

飞桨框架使用硬件统一接入的方式进行硬件的适配,既包括算子开发,也有子图/整图接入方案、深度学习编译器方案和神经网络交换格式方案。目前飞桨适配兼容深度学习训练、推理,以及FPGA的芯片,平台适配的芯片已经超过30款,既有国际上的主流厂商英特尔、英伟达提供的芯片,也有众多国产芯片。

为了促进AI产业链的适配升级,2020年飞桨与合作伙伴联合发起飞桨硬件生态圈。2021年,为了更好适配主流芯片,飞桨携手硬件厂商软硬件一体协同优化。今年,飞桨与硬件伙伴合作进一步深化,实现了全面的共创,合作方式包括联合研发、资源共享、联合授权,以及培训赋能等。

(四) 产业界模型库
飞桨的产业级模型库已经支持非常广泛的应用场景,提供了超过500个开源模型。如下图所示,从底层的框架层到模型库与开发套件、算法层、任务层,每个部分都有很多种模型。绝大多数开发者并不需要从头调用底层的深度学习框架,而是直接使用模型库配上开发套件和工具组件,就可以在自己的应用场景中完成对应的任务。


图5 产业界模型库

三、 飞桨模型库:文心大模型

   文心大模型是飞桨模型库中现在发展非常快、效果非常好的系列深度学习模型。它本身非常丰富,包括基础的自然语言处理、计算机视觉,以及跨模态大模型、生物计算大模型等。鹏城-百度∙文心大模型是飞桨和鹏城实验室一起联合研制的知识增强大模型,这是世界上第一个千亿级知识增强自然语言处理大模型。

除了这些基础大模型以外,还有一些模型与产业密切相关。在能源行业,飞桨与国家电网联合研制发布了国网-百度∙文心大模型。在金融行业,与浦发银行联合研制发布了浦发-百度∙文心。在航天领域,与中国航天联合发布了航天-百度∙文心大模型。除了这些行业大模型外,飞桨还提供相应的配套工具和平台,包含数据标注与处理、大模型精调、轻量化、部署开发工具等,助力模型的落地部署。

鹏城-百度∙文心是世界上第一个千亿级的知识增强大模型,但何为知识增强?深度学习很擅长从大规模数据里去自主学习,但实际上知识对于人工智能和人都是非常重要的,因为知识的传承对人类进步有非常重要的推动作用。如何让深度学习系统能从数据和知识中进行融合学习,这是我们需要解决的。文心知识增强大模型从大规模知识和海量数据中融合学习,得到了更好的基于语义单元学习的模型。

知识增强大模型有很好的通用性,虽然训练基础大模型成本较高,但是它的优点是可以进行集约化的开发。例如,在自然语言处理中,大模型可以并行处理学习任务。另一方面,它的泛化性非常好,只需要少量的场景或者任务数据做一次精调,就可以得到非常好的效果。同时,由于有了这样基础的大模型和工具平台的支撑,开发门槛进一步降低。综合这些优势,大模型可以大幅降低AI应用的门槛。

鹏城-百度∙文心作为世界上第一个千亿级知识增强大模型,其参数规模已经达到2600亿。该模型同时在文本分类、问答、对话、新闻分类、观点抽取、语义相似度、阅读理解等60多个任务上表现出了非常好的效果。它在知识增强的算法、融合大规模数据与知识、基于大规模训练技术等方面具有优势。鹏城-百度∙文心模型可以把语言理解和生成两个任务同时进行学习,我们使用该模型完成了《苦练本手,方能妙手随成》的高考作文,如图6所示,实现了秒级成文,评分超过75%考生的效果。为了面向任务来进一步提升大模型的效果,我们融合层次化的预训练,使得模型可以同时进行多任务的统一学习,这就诞生了ERNIE 3.0 Zeus大模型,在短文本匹配、自然语言推理等多个零样本任务上取得了非常好的效果。


图6 AI模型写高考作文

我们再来看一下计算机视觉,多任务统一学习的视觉大模型,在20多项视觉任务上都得到了最好的效果。跨模态大模型,具备图文双向生成能力,可以利用图片生成文字、也可以利用文字生成图片。例如,给模型输入一句话便可生成描述的图像,或者看到一幅图像利用语言来进行描述,如下图所示。还可以进行视觉问答,例如,提问图中车辆的数量,或者提问猫此刻在干什么,机器都会自动回答。


图7 跨模态大模型图文生成能力

除了经典的一些任务,如自然语言处理、计算机视觉等,大模型已经开始应用于其他领域。在生物计算领域,我们研究了化合物的表征学习,包括分析蛋白质的结构,实验证明该模型可以达到很好的效果。电力行业中的国网-百度∙文心大模型采用了文心大模型的ERNIE 3.0,同时加入电力行业的数据,以及国家电网特有的电力专业知识库,进而可以应用于国家电网的各种任务。对于一些具体的任务比如电力实体的判别,电力文档的判别等基础任务,该模型表现很出色。金融行业的浦发-百度∙文心大模型,利用浦发银行的财报、合同、文档、客服数据等进行训练,然后应用于金融行业的具体任务中,通过反馈该模型也得到了较好的效果。

四、 飞桨平台助力普惠 AI,加速产业智能化
百度飞桨是中国首个自主研发、开源开放的产业级深度学习平台,目前平台已经累积有477万的开发者,使用飞桨的企事业单位已经有18万家,创建的模型有56万个。中国信通院深度学习平台发展报告最新发布的数据显示,飞桨是中国应用规模第一的深度学习框架和赋能平台。另外,据IDC报告,飞桨稳居中国深度学习平台市场综合份额第一。国际开源社区github上,飞桨在中国深度学习项目中活跃度排名第一。同时,飞桨也在通过校企合作,着重助力 AI 复合型人才培养,过去两年间,飞桨与各合作单位联合培养的人才已经超过两百万。飞桨与全国900所高校合作为4000余名教师提供深度学习培训,支撑270余所高校开设学分课程,举办了80多场AI赛事。

在飞桨深度学习开源开放平台的支撑下,人人都能成为智能应用的开发者。基于飞桨开发的“围圈晒盐图像智能识别和辅助诊断”系统,相比传统的人工作业模式,监测更高效准确,可以较好辅助人工进行判断,大大降低了人工成本。另外,有一位12岁的小开发者,自己调用飞桨识别模块接口,开发实现了从识别巧克力豆到检测口罩佩戴的一个小程序。下图展示的是一个对人工智能发展特别感兴趣的80多岁老专家的学习时长,他在飞桨的平台上持续300多天学习AI技术,并且自主开发了很多应用,同时他也把在学习使用飞桨过程中的一些经验分享给单位的年轻人,带领大家一起学习和应用AI技术。


图8 AI学习行为热力图

在企业应用飞桨的过程中有两个比较重要的支撑平台,如图9所示,一个是面向零门槛AI应用开发的平台EasyDL,提供非常丰富的工具链,基本上不用了解深度学习技术就可以使用平台开发应用。EasyDL使用标准化流程、模块化组件和自动化服务,将选择模型类型、上传深度学习中的标注数据、训练、部署集成化,最快15分钟即可获取定制模型。另一个是面向全功能AI算法开发的平台BML,主要是面向深度学习开发者,可以自主选择建模方式来进行AI算法的开发。


图9 产业应用开发平台

下面是一些AI应用的具体例子。例如,工厂生产选用EasyDL物体检测算法训练喷油嘴瑕疵检测模型,并通过EasyEdge部署到工厂生产线上。EasyDL物体检测算法的使用场景包括生产环境的安全监控、医疗镜检的识别、超市的商品检测、智能垃圾分类、地面气象观测等等。传统听音质检过度依赖人力和经验,不仅产品质量受检测工人水平影响,而且对人的听觉伤害较大。使用AI异音检测,使人力得到了解放,同时质检效果也得到较大的提升。运维也是如此,传统运维需要工艺知识的传承,靠师傅的传帮带传授经验,同时一些维修的历史知识无序,容易出现查找难、耗时多,问题解决效率低的问题。采用基于企业知识图谱的智能搜索运维系统可以让知识高效的流转起来,使得运维的工作效率大大提高。水是生命之源,在水务行业中,水站工人需要24小时轮班进行管道巡检,实时监测水务运行设备使用情况,同时在供水高峰时期需要进行水的调节调度,传统水务的各个环节流程亟待转型升级。采用智能水务系统后,预测模型的精度可以达到99%以上,人员效率、污水处理率等方面都得到较大的提高。

五、 总结
飞桨深度学习平台以及大模型技术已经广泛应用于各行各业。在制造业中,AI技术应用于外观质量检测、安全巡检、排产排程、调度优化、工艺仿真、工艺参数优化等方面;在城市建设上,AI技术广泛应用于河道垃圾的识别、违章建筑的识别、渣土车识别、车辆违规停放的识别等场景;在能源领域,AI技术在输电线路通道的可视化、变电站设备的缺陷识别等方面也广泛使用;另外,金融行业及媒体行业的数据分析也离不开AI技术。同时AI技术也催生了一些新业态和模式,甚至新的职业,如图9所示,随着人工智能技术的更广泛应用,AI训练师、5G云代驾,包括最近火热的AI手语主播等也在不断涌现。


图10 新业态、新模式

最后,希望通过AI大生产平台能让人工智能技术赋能千行百业,惠及千家万户!
<hr/>*本文根据作者在2021中国自动化大会所作报告速记整理而成。

报告人简介


王海峰,百度首席技术官、深度学习技术及应用国家工程研究中心主任。王海峰是自然语言处理领域最重要的国际学术组织ACL首位华人主席,ACL会士,ACL亚太分会创始主席。还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士等。获国家技术发明二等奖、国家科技进步二等奖、光华工程科技奖、中国专利金奖、首届全国创新争先奖、首个吴文俊人工智能杰出贡献奖等。已发表学术论文200多篇,已授权专利150余项。
回复

使用道具 举报

0

主题

4

回帖

16

积分

新手上路

积分
16
发表于 2023-5-4 18:40:38 | 显示全部楼层
中国科技核心技术的反超从AI开始

中国AI发展在全球处于什么样的地位,一直都有争议。有的说中国AI起步不晚,与美国处于同一起跑线,也有的说中国在一些技术上还有差距。
沙利文刚刚发布《中国深度学习软件框架市场研究报告(2021)》(以下简称《报告》),对中国市场上主流深度学习软件框架从多维度进行评分对比,结果显示,百度竞争力综合排名第一,在应用能力、技术能力和生态能力层面均具备显著优势。《报告》中称:“百度飞桨PaddlePaddle不仅具备深厚的技术积累,在产业实践落地层面亦存在极强的竞争优势。”
在此之前,IDC报告显示,2021年飞桨位居中国深度学习平台市场综合份额第一。也就是说,百度飞桨不仅在市场份额上,超过了谷歌的TensorFlow和Mate(脸书)的PyTorch,并且在全方位的综合竞争力上也得到广泛认可。
从信息化到数字化,再到智能化,科技对社会的改变在逐步加深,AI对社会的改变会更深远、更彻底。这次《报告》是对百度在AI底层技术的认同,其已经具备与谷歌、Mate三足鼎立的实力。同时,也是对中国科技产业在AI时代能力的一次肯定,中国科技产业的核心技术长期受制于人,而在AI时代这种局面终于得以扭转,我国人工智能技术开发者和使用者不必依赖于国外平台,同时还可进一步培育自主可控的AI开发应用生态。有了这样的优势,未来中国在AI创新方面就有了更高的起点,AI的落地也将进一步提速。
「 01 」掌握“灵魂”,贯通上下


什么是人工智能深度学习软件框架?为什么这个领域会大厂云集?
这一轮人工智能爆发深度学习是关键技术,比如计算机视觉和自然语言处理等技术的成熟和落地让很多行业智能应用可以成为现实。深度学习软件框架是一种底层开发工具,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体的平台,有了这个平台可以支持各种深度学习技术快速落地,相当于AI时代的“轮子”。
说得再通俗一些,大家通常认为深度学习框架是“AI时代的操作系统”,如同PC时代的操作系统Windows、移动互联网时代的IOS和安卓,与和芯片一起构成了人工智能的基础设施。
在整个人工智能技术体系中,深度学习框架处于贯通上下的腰部位置,下接芯片、上承应用,是一个关键枢纽,是推动AI应用大规模落地的关键力量,重要性日益凸显。
也正是因为深度学习框架产业地位特殊,其成熟度影响面也非常大。
对内,即从科技行业的角度来看,AI产业的参与主体,几乎涵盖整个信息产业,云计算、芯片、ICT设备、互联网、软件、智能技术服务等等,深度学习框架的发展会对科技产业自身的产品形态、运行模式产生很大变革,同时也对整个科技产业的发展有着整体带动效应。
对外,即从全社会层面看,整个社会正在走向智能时代,无论是传统行业还是人们的日常生活,所有的细分场景都在加速AI化。AI正在重塑传统行业模式,重塑我们的生活,重塑整个社会,为经济社会输出独一无二的未来价值。深度学习框架这个“轮子”造好,整个社会经济的转型升级也就会更顺畅。
对比PC时代、移动互联网时代操作系统的影响力,就知道今天深度学习框架的重要性。头部企业都努力构建开源的深度学习软件框架生态,试图形成应用接口和硬件适配的双向主导权。《报告》中有这样一段描述:由于转换至其他框架会一定程度上影响模型性能、增加二次研发成本,长此以往,大量应用将深度依赖原有软件框架进行训练和推断,形成产业默认的事实接口标准。此外,框架市场份额领先的人工智能头部企业正在依托框架与智能芯片适配构建标准化硬件接口,有望进一步增强其对智能芯片的话语权。
也正是如此重要,全球科技巨头纷纷入局,包括美国的谷歌、Mate(脸书)、微软,中国的百度、腾讯、华为、阿里等,各自携不同的优势进入。
中国科技产业起步晚,不少核心技术缺失受制于人。如果中国开发者主要依赖于国外的框架进行研发,这将面临着核心技术容易形成代差,也有可能面临技术封锁带来的危害,当然还有很重要的一点是数据安全。AI是又一轮科技竞赛,中国科技自立自强的角度,需要有自己的核心技术以及相应的产业生态。中国已将人工智能上升为国家战略,在“十四五”规划中,深度学习框架被列入“新一代人工智能”领域,成为国家重点支持的前沿创新技术。
深度学习框架重要,但是做起来非常难,跟操作系统一样,投入高、周期长、风险大。今天,有实力布局这一领域的基本都是有技术、有资金的巨头。作为开启下一个AI时代的钥匙,深度学习框架是大厂的必争之地,背后也是国家科技竞争力必争之地。
「 02 」巨头逐鹿,格局初定


在AI领域,百度是中国市场一个坚定的先行者,旗下的飞桨也是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。近两年,飞桨的技术体系越来越完善,百度给予开发者的支持力度大,并且因为更贴近中国客户的需求,越来越多的成功案例落地,飞桨的认知度和认可度也不断提升。
根据IDC报告,2021年飞桨已经成为中国市场份额第一的深度学习框架,市场地位得以初步确立,TensorFlow等框架的主流地位亦受到挑战。但是借助本土优势取得市场份额的第一还不足够,作为产业长期发展的底层技术,想要在国际竞争中取得领先,需要具备更全面的竞争力才能在长跑中取胜。


这一次沙利文的《报告》根据评价深度学习软件框架在应用、产品、生态能力三个维度的综合表现,对比主流深度学习软件框架厂商的综合竞争力。报告结果得出:深度学习软件框架厂商中百度竞争力综合排名第一,在应用能力、技术能力和生态能力层面均具备显著优势。这是飞桨在获得市场份额第一后,又一次重大突破。竞争力综合排名第一意味着飞桨具备了全面与Google的TensorFlow、 Meta(脸书)的PyTorch全面抗衡的实力。
首先,应用能力,也就是指行业渗透的广度与深度,本质也是客户认可度。市场应用覆盖范围越广,就更能体现企业具备更强和更完善的能力去满足不同客户的定制需求。针对不同场景的解决方案数量越多,则证明该厂商在企业应用深度方面远超于其他厂商,其产品能够拥有更好的兼容和适应性,进而能够为用户提供稳定且更加有保障的使用体验。


这一点,从飞桨在市场份额上的优势就可以看出,飞桨已经得到中国客户的广泛认可,不断渗透关键行业以及新兴的前沿行业,包括农业,交通、制造、药物研发、疫苗设计和精准医疗等等。在沙利文的报告中,飞桨在应用能力方面为5分,有着明显优势。
在农业领域,与京东方联手打造的智慧植物工厂,通过机器24小时自动照看、多方位呵护蔬菜生长采收;在制造业领域,在上海哲元的生产线上用机器替代人工进行全流程智能化检测,大大提升效率的同时也降低了成本;在能源领域,与华夏天信机器人有限公司合作,开发出的输煤胶带智能巡检机器人,不仅能实现高频次、无间歇巡检,还能通过摄像仪将实时视频回传并智能识别分析,一次性解决了工作效率、恶劣环境、作业安全等多项难题;在交通领域,成都国铁利用飞桨PaddleDetection等套件解决了AI算法难题,研发了一套“轨道在线智能巡检系统”,实现对轨道巡检图片的实时检测;在互联网领域,网易云音乐选择应用百度飞桨PGL图神经网络技术来迭代升级云音乐的推荐系统,能够为云音乐处理高达百亿级别的大规模数据……
其次,产品能力,这是对框架技术的完整性、创新性的评估,包括功能完备性、产业级模型库丰富度、深度学习工具链及企业级平台、服务质量等多个维度。


从产品完整度来看,飞桨经过几年的积累,集深度学习核心框架、基础模型库、端到端开发套件和丰富的工具组件于一体,还包括飞桨企业版EasyDL和BML,以及人工智能学习与实训社区AI Studio。截至目前,基于飞桨开发的模型数量已经有47.6万个,核心框架贯穿开发、训练、推理部署三个环节,基础模型库覆盖CV、NLP、推荐、语音、知识增强的文心大模型,服务的开发者数量已经达到406万,并在270多所高校开设了AI学分课程。
从沙利文的评估可以看出,飞桨在产品能力上已经可以与国际巨头一较高低,这也从一个侧面证明了中国AI技术并不落后。
第三,生态能力,生态能力越强,则证明深度学习软件框架被更加广泛和频繁的使用,其生态合作、产业协作能力越强,这个指标能代表可持续发展的能力以及发展的速度。任何产业的竞争最后都是生态的竞争,特别是AI,AI的实现涉及的产业链条非常长,生态合作、产业协作决定护城河有多深。
百度深谙此道,不仅为开发者提供一个好用的底层框架,还投入了大量人力、物力来打造一个友好度更高、适用性更强的生态。飞桨用短短几年时间构建了全球前三、中国第一的AI开发者生态,凝聚了406万开发者、创建47.6万个模型,服务15.7万家企事业单位——当然,这是截止去年底的数据。如今,飞桨的生态正在加速度成长,相信在5月20日的WAVE SUMMIT 2022,还会有更令人振奋的数据展现。
过去十年,是AI产业爬坡的十年,也是产业打地基的十年、产业链格局重构的十年。在打地基的十年中,深度学习框架是一个关键竞争要素。可以将这一次对综合竞争力的评估看作一次阶段性的小考。
从这份报告可以看出,深度学习框架已经从百花齐放到巨头逐鹿的阶段。百度作为中国AI的一面旗帜,在应用能力、产品能力、生态能力已经构筑起了一定的竞争壁垒,可以与谷歌、Mate(脸书)正面交锋。这代表了中国AI的产业能力,也代表了中国在AI领域的竞争力。
「 03 」夯实地基,加速前行


百度为什么可以取得这样的成绩?是AI在百度的战略地位决定的。很多企业将AI作为创新业务或是一条业务线,而百度将AI看作公司级战略,并不是在一两个点上发力,公司会面向未来做长远的、全面的、系统的布局。这样的布局,并不会很快见效,甚至需要有“板凳甘坐十年冷”的决心和觉悟。
就以研发为例来看,我们知道深度学习框架投入高、周期长、风险大,百度持续在这个领域投入,瞄准核心技术取得多项突破。据《百度人工智能专利白皮书2022》显示2021年,百度核心研发占百度核心收入23%,研发强度位列中国民营500强首位。截至2022年4月,百度全球人工智能专利申请超过2.2万件,其中,中国专利申请量超过1.6万件,中国授权专利超过4600件。根据相关报告,在中国人工智能高价值专利及创新驱动力评测结果中,百度位列第一。
专利有多重要?看看通信行业几十年的历程就知道,越早介入、越掌握核心技术、积累越多,就能吃到更多的产业红利。将专利技术握在自己手里,意味着有机会建立行业标准,也有能力影响行业的走向。
企业的竞争力是国家竞争力的一个表现。早在2017年,国家发改委正式批复,由百度牵头筹建深度学习技术及应用国家工程实验室,堪称“深度学习国家队”。今年4月26日,实验室升级为深度学习技术及应用国家工程研究中心,将重点面向国家重大战略任务和重点工程建设需求,开展关键核心技术研究,探索创新联合体模式,加速科技成果工程化、产业化。
飞桨是实验室的成果之一,飞桨的成功也代表了国家队的成功。这次百度获得第一,也是中国科技自主创新、科技自立自强的一个缩影。在AI时代,中国科技产业不必再看国际巨头的脸色,也不会再处处受制于人。
沙利文报告在对主流框架综合评价的基础上,认为深度学习技术已然迈入升级优化阶段,带动相关产业高速蓬勃发展。根据技术成熟度曲线,任何一个新技术都会有缓慢爬坡的阶段,也就是打地基的阶段。从这两年的应用落地情况来看,AI已经开始进入快速爬升期。“板凳甘坐十年冷”为的是打好地基,地基打得越稳,后期盖楼就会又快又好。百度飞桨“小考”领先,在后面的加速跑中也将处于优势地位。
值得期待的是,5月20日,深度学习技术及应用国家工程研究中心主办、飞桨承办的WAVE SUMMIT 2022 深度学习开发者峰会将在线上和开发者见面。从这两年发展的态势来看,AI的价值已经在千行百业中得到验证,将有更多的开发者愿意投身其中,也将有更多的企业客户愿意身体力行。相信WAVE SUMMIT 2022上,我们能看到更多的开发者,更多创新的成功案例,百度也会给出更多的生态支持政策。
回复

使用道具 举报

0

主题

2

回帖

18

积分

新手上路

积分
18
发表于 2023-5-4 18:41:30 | 显示全部楼层
paddlepaddle是开源深度学习框架。
这个框架是面向全球的开发者发布的,全世界的开发者都可以查看框架的源代码,要是有后门,估计早就有开发者发现了。
要是实在觉得不安全的话,可以先下载全部代码,再离线训练、离线部署。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2025-1-5 07:18 , Processed in 0.062214 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表