当前位置:宜家16分钟视频百度云 > 宜家16分钟视频百度云夏目彩春所有的视频2018 >
宜家16分钟视频百度云夏目彩春所有的视频2018 百度发布五大硬核NLP技术新品及更新!CTO王海峰谈语言与知识技术十年布局
来源:未知发布时间:2020-09-04 07:15

4、百度大脑智能创作平台

智东西8月25日消息,今天,百度在百度大脑语言与知识技术峰会上发布语义理解技术与平台文心(ERNIE)、智能文档分析平台TextMind、AI同传会议解决方案3项新产品,以及智能创作平台和智能对话定制与服务平台UNIT的多项升级。

智东西(公众号:zhidxcom)

其中,“多”指支持多种格式,TextMind目前可解析6种格式、20类文档;“快”指显著提高企业文档处理效率,比如,可将企业报销时间从3-5个工作日缩短至1分钟;“好”指效果好,基于TextMind预置的文档解析能力,企业开箱即用,实现零门槛定制;“省”指文档规范化解析可帮助企业降低人力成本80%以上。

在百度语言和知识技术发展的过程中,其技术已应用到搜索、翻译、地图、信息流和智能硬件等产品,并广泛应用于金融、医疗、教育和能源等各行各业,在为社会提供全方位智能服务的同时,加速产业智能化升级。

据了解,这些新产品发布与升级覆盖语言理语言生成、对话、机器翻译4大NLP(自然语言理解)领域重点研究方向。

5、UNIT:智能对话定制与服务平台

结语:百度NLP技术版图的十年布局

作为机器认知世界的重要基础,知识图谱是以结构化的形式描述真实世界中的实体属性、关系等。

“我们始终把握技术发展和产业发展两个趋势。”王海峰谈到,从研究方法上看,百度初期以规则和统计技术为主,探索深度学习、语义匹配框架、多语言神经网络及翻译等技术,近两年还扩展到知识增强的深度学习。

TextMind的底层基于OCR和NLP技术,以文档解析为核心能力,支持文档对比、文档审核等功能。同时,TextMind还结合了知识图谱的能力,能帮助企业在合同审核时能发现更多的隐含法律风险。

王海峰对百度NLP技术布局的部分关键技术进行了解读,并分享了部分最新进展。

吴华谈到,算力是语言与知识技术发展中面临的另一大挑战,超大规模深度学习模型带来显著效果提升的同时,算力的需求也呈现出指数级的增长。

二是表格问答能力升级。百度通过对表格的分析和自动化构建,基于表格内在知识能力,能够自动理解用户提出的问题,并分析出相应答案。此外表格问答还具备较好的口语化交互效果,支持在对话场景中使用。

在NLP技术领域,还有一个重要的任务是语言生成,主要研究如何让机器使用自然语言进行表达和写作。

1、知识图谱技术

2019年,百度发布了具备持续学习和知识增强的语义理解框架ERNIE,语言理解能力得到了大幅提升。而今年宜家16分钟视频百度云夏目彩春所有的视频2018,百度在ERNIE核心技术基础上延展开发了语义理解技术与平台宜家16分钟视频百度云夏目彩春所有的视频2018,并取名为“文心”宜家16分钟视频百度云夏目彩春所有的视频2018,意义取自《文心雕龙》。

2、TextMind:智能文档分析平台

据王海峰介绍宜家16分钟视频百度云夏目彩春所有的视频2018,如今百度打造了一个多元异构知识图谱宜家16分钟视频百度云夏目彩春所有的视频2018,拥有超过50亿实体和5500亿事实宜家16分钟视频百度云夏目彩春所有的视频2018,并在不断演进和更新宜家16分钟视频百度云夏目彩春所有的视频2018,已应用于各行各业宜家16分钟视频百度云夏目彩春所有的视频2018,每日调用次数超过400亿次。

例如宜家16分钟视频百度云夏目彩春所有的视频2018,开发者只需上传业务数据表格宜家16分钟视频百度云夏目彩春所有的视频2018,经过UNIT一分钟自动分析后宜家16分钟视频百度云夏目彩春所有的视频2018,产出的问答机器人就可以准确回答大部分基于这些表格的事实性问题;加之1小时左右的人工辅助调优宜家16分钟视频百度云夏目彩春所有的视频2018,问答机器人达到的水平相当于以往通过至少2周的人工整理FAQ建设的问答系统的水平。

一是小样本意图理解能力升级。每个意图将提供大约10个标注样本就能达到高准确率的意图识别宜家16分钟视频百度云夏目彩春所有的视频2018,显著降低数据标注的成本。

历经11年的发展宜家16分钟视频百度云夏目彩春所有的视频2018,如今百度已形成了完整的NLP技术布局宜家16分钟视频百度云夏目彩春所有的视频2018,包括知识图谱、语言理解与生成技术,以及应用系统等。

目前,文心已经广泛用于百度产品中,包括搜索引擎、推荐系统、智能音箱、智能客服等。同时,文心已累计支持超过20000名开发者,应用场景覆盖金融、通信、教育、电商等各行各业,显著提升企业应用效果和效率。

三、发布两大计划,助力语言与知识技术发展

随着百度大脑语言与知识技术的广泛落地应用,百度已经收获了许多行业成果。据王海峰介绍,百度大脑语言与知识技术已获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。

据介绍,文心基于深度学习平台飞桨打造,集成了预训练模型、全面的NLP算法集、端到端开发套件和平台。文心将减少开发者90%数据标注量、90%算力投入、85%模型开发时长,为开发者提供一站式NLP开发与服务,从而降低NLP定制开发的成本。

▲百度CTO王海峰

在知识的加持下,百度的语言理解相关技术也不断增强。

3、AI同传会议解决方案

据百度技术委员会主席吴华介绍,千言一期项目由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对话、阅读理解等7大任务,20余个中文开源数据集。

从研究对象上看,词、短语、橘子以及篇章都是百度的研究对象。

例如,在智能策划方面,百度大脑创作平台上汇聚了全网数据资源,利用知识图谱与自然语言处理的技术对数据深度的理解和分析,围绕媒体行业推出系列智能策划场景方案,高时效性的汇聚全网主流媒体线索,关联分析得到行业地域的热点信息。

一、三大新品发布与两大产品升级,丰富落地应用

同时,百度还研制了知识增强的跨模态深度语义理解方法,通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现从“看清”到“看懂”、从“听清”到“听懂”,即图像和语言、语音和语言的一体化理解。

峰会上,百度集团副总裁吴甜以理解、生成、对话、翻译四大方向,分别介绍了三款百度语言与知识技术的新产品,以及两项新升级。

为了突破语言与知识技术在研发过程中面临的数据匮乏、算力不足的瓶颈,百度联合中国计算机学会、中国中文信息学会共同发布全球最大中文自然语言处理“千言”数据共建计划。

下一个十年,百度的NLP技术布局还会给我们带来哪些惊喜?它能否推动行业离通用人工智能(AGI)的目标更近一步?我们拭目以待。

展开全文

如王海峰所说,语言与知识技术是人工智能认知能力的核心。回顾这场峰会,我们也能看到过去十年百度在语言与知识领域的技术发展和产业布局,如今已逐步构建起一套成熟和丰富的NLP技术版图。

TextMind是百度面向企业文本智能化需求,推出的智能文档分析平台,主要面向文档解析、文书审核等场景。

为了让开发者更加高效的获得高质量的对话理解能力,此次百度升级了UNIT的3大特性,包括任务式对话理解、表格问答和新对话引擎,将数据标注成本进一步降低到30%以上,并融合通用对话能力提升交互体验。

基于语言生成技术,百度还结合了其他语言和知识技术,并应用到百度智能创作平台,在各个环节全方位帮助用户进行智能创作。

基于搜索引擎,从多元异构的大规模数据中能构建非常庞大的知识图谱。基于此,百度提出了一整套构建方案,包括无标签大数据、开放知识挖掘技术知识体系、自学习技术,以及融合多源异构数据的知识补全和整合技术等。

现场,吴甜还为大家展示了如何只用一台电脑和一部手机,就能快速搭建一套同传服务,只需点点鼠标、打几个字,就能快速获得专业的同传服务。

此次,百度大脑智能创作平台针对媒体的应用场景,更新了智能策划、智能采编、智能审校3大媒体场景方案,帮助媒体人更快、更好地进行创作。

自平台推出以来,它已自动创作文章超过200万篇,图文转视频能力已有7000多用户,已生产短视频15万个,相当于一个人至少100年的工作量,并已落地人民日报、央视网等20多家媒体机构。

百度提出知识增强的语义理解框架文心(ERNIE),即在深度学习的基础上融入知识,具备人类一样的学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史,并且超越人类得分。

其中,文心基于深度学习平台飞桨打造,能够为用户提供一站式能力,将为开发者减少90%数据标注量、90%算力投入、85%模型开发时长,进一步降低NLP定制开发的成本。

未来三年,百度计划面向超20个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖知识图谱、语言理解、语言生成、跨模态融合、NLP 应用系统等多个领域。

随着AI技术的发展,应用场景变的愈发复杂,百度的研究对象也从语言扩展到语音、视觉等多模态信息,探索跨模态语义理解技术,例如语音一体化、图像语言一体化等。

百度提出了基于多流机制的语言生成预训练技术,在语言生成过程中兼顾词、短语等不同粒度的语义信息,显著提升生成和应用效果。

2、语言理解技术

值得一提的是,百度还联合中国计算机学会、中国中文信息学会,共同发起中文自然语言处理数据共建计划——千言,同时百度技术委员会主席吴华还发布了百度语言与知识技术算力共享计划。

在王海峰看来,要让自然语言表达灵活,其普遍语言结构分析和语义理解难度很大。因此,以语言和知识为研究对象,研究如何让机器像人一样掌握知识,理解语言的NLP技术对AI技术的发展至关重要。

原标题:百度发布五大硬核NLP技术新品及更新!CTO王海峰谈语言与知识技术十年布局

二、百度语言与知识技术的十年布局发展

同时,UNIT基于最新升级的依存句法分析技术和通用关键词识别技术,为开发者带来了词槽修饰关系的识别能力。

百度千言目标覆盖更丰富的任务类型,从语义理解、知识融合、跨模态融合等角度推动技术进步,同时提供能进行多维度综合评价的数据集。

1、文心(ERNIE):语义理解技术与平台

三是新一代融合任务式对话和通用对话引擎。该引擎通过通用对话的主动式人性化交互,进一步提升用户体验,同时动态分析当前对话进程,以适当推荐引导的方式尝试触发任务,满足用户的具体需求。

文 | 韦世玮

吴甜介绍,TextMind核心优势为“多、快、好、省”。

2019年初,百度上线了智能创作平台,尤其在媒体行业进行了重点深入,通过辅助创作和自动创作等多项能力,辅助用户进行内容创作、图文转换视频等工作。

未来,随着NLP技术的不断突破创新,百度也将在产品上继续保持探索,进一步赋能智能搜索、智能推荐、智慧城市、智慧医疗等各行各业。

从研究方向上看,从语言分析、语言生成、知识图谱及翻译拓展到深度与理解,完整的技术体系也促进了各项技术的融合发展。

在现场,王海峰向大家分享了百度的语言和知识技术在过去十年是如何布局发展的。

值得一提的是,用户在会议前可以根据会议设计的特定领域进行属于定制,来应对各类专业议题中独有的词义,让翻译更准确。同时,用户在会议中也可以随时进行术语干预,并实时生效,会议结束后还能自动生成会议记录并保存到网盘中。

因此,吴华正式发布了语言与知识算力共享计划,通过百度AI STUDIO平台,百度将提供价值一亿元的免费算力支持,帮助广大开发者更好地专注技术创新。

百度自2017年推出同传系统以来,其AI同传已逐步构建起较为丰富的产品形态,包括桌面助手、翻译、同传功能等。这次百度则面向会议场景,发布AI同传会议解决方案,覆盖会议全场景、全流程。

除此之外,百度CTO王海峰也来到现场,为大家分享百度大脑发展历程的同时,也从知识图谱、语言理解与生成技术等方面介绍了百度完整的语言与知识技术布局。

《以家人之名》被前半部分亲情戏感动得稀里哗啦,想不到九年后凌霄和贺子秋归来,却变成了爱情戏,这个也是大家很担心的,《下一站是幸福》结局也是很不理想,跌到6分,同一个编剧的《以家人之名》豆瓣评分从之前8.5分跌到8.2分,现在又掉了0.2分。

原标题:计划生育时抢着生,二胎开放却不生了,其中的阻力究竟是什么

原标题:连载-帕金森病术前评估和手术适应证等 | 孟凡刚张建国

目前,《明日之子4》每个乐队的成员组成已经基本确定,接下来的赛程除了和硬糖少女的合作舞台外,就是半决赛和总决赛。如果龙总和节目组不改赛制的话,他们将不会再进行拆队重组,而是以目前的组合走到最后。

原标题:精致名家好礼物,元祖雪月饼惊喜过七夕

原标题:美众院通过250亿美元法案 为美国邮政提供资金

原标题:她是人人都想娶的女星,古天乐苦苦追求而不得,今52岁韵味…

据海外网消息 美国当地时间8月24日,TikTok正式在美国对特朗普政府提起诉讼,主张废除特朗普8月6日发布的行政令,并主张禁止美国商务部实施该行政令。字节跳动方面在一份新闻稿中的透露了诉状的相关内容,并称此次诉讼由TikTok和字节跳动联合提告,诉讼对象包括美国总统特朗普、美国商务部长罗斯和美国商务部。

原标题:细数生活中的有毒食物,病从口入不是说着玩的!

药品、食品、化妆品等都会在包装上明确标注保质期,过期了就不能再接着使用了。但家里很多日常用品的“隐形”保质期你了解吗?这些日常用品你有多久没换过了?

近日,某部官兵到某医疗点献血。献血过程中,有的战友出现晕厥情况。本期健康沙龙邀请解放军总医院京南医疗区副主任医师张会明,给大家谈谈如何科学安全献血。

当前位置: > 篮球 > 正文

新京报快讯 据银保监会官网消息,近日,一些媒体记者就市场上较为关心的问题,采访了中国银保监会新闻发言人,采访情况汇总如下。

原标题:学会了这个,还怕早餐吃不好?