上海品茶

您的当前位置: 上海品茶 > 上海品茶 > 行业知识 > 什么是自然语言处理(NLP)?工作原理是?发展历程一览

什么是自然语言处理(NLP)?工作原理是?发展历程一览

目前自然语言处理(Natural Language Processing,NLP)已成为机器学习的研究热点之一,本文将介绍自然语言处理的概念、工作原理及发展历程,助您初步了解自然语言处理技术。

自然语言处理

1.自然语言处理

自然语言处理技术是指将人与人之间的交流,人与计算机之间的交流抽象成数学语言模型,通过计算机方法处理这些被抽象化定义的问题。用一句话概括,就是通过自然语言处理,能够让计算机像人一样理解人类世界中的自然语言。

2.自然语言处理技术工作原理

自然语言处理通过机器学习(ML)进行。机器学习系统像其他任何形式的数据一样存储单词及其组合方式。将短语、句子,有时甚至整本书的内容都输入机器学习引擎,并根据语法规则和人们的现实语言习惯(或两者兼而有之)进行处理。然后,计算机使用这些数据来查找模式并推断出下一步的工作。以翻译软件为例:在法语中,“我要去公园”是“Jevaisauparc”,因此机器学习预测“我要去商店”也将以“Jevaisau”开头。

3.自然语言处理技术发展历程

(1)萌芽期

20世纪40年代到20世纪50年代是自然语言处理的萌芽期,在这个时期的三项研究:图灵算法计算模型,乔姆斯基关于形式语言的研究,香农的信息论与编码,为自然语言处理打下了坚实的基础。此后机器翻译在各个国家流行起来,机器翻译中用到的一些技术反过来也促进了自然语言处理的发展。

(2)发展期

20世纪60年代到20世纪80年代是自然语言处理的发展期。

这一时期的主要特点是各个科学领域之间广泛合作,在自然语言处理领域取得令人振奋的成绩。

这一时期的另一个突破进展是 Hidden Markov Model 和 Noisy channel model and decoding model 这些统计学方法在自然语言处理中的应用。自然语言处理方法不再单纯基于语法规则、句子间关系分析以及逻辑分析。

这一时期主流研究倾向于重新评价之前被否定的有限状态模型,这种模型重新被主流学者所重视。此外相关概率模型还被应用于词性标注,句法剖析,语音识别,关联分析。

(3)繁荣期

20世纪90年代初期,NLP领域研究进入了繁荣期。进入这一时期的里程碑是在基于规则的技术中引入语料库方法,通过将语料预处理,变成结构化数据,将其转化为语料知识库,将语料之间的关系转化为知识图谱。这种方法极大地提高机器翻译的准确率。

以上梳理了自然语言处理技术的定义、原理及发展历程,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告行业知识栏目。

本文由@2200 发布于三个皮匠报告网站,未经授权禁止转载。

推荐阅读:

9-4NLP技术在短视频场景中的应用实践.pdf

字母点评:2021年中国人工智能产品采购指南:机器学习平台(21页).pdf

机器学习是指什么?分类有哪些?应用场景一览

什么是深度学习?与机器学习是何关系?常用的技术有哪些?

本文由作者2200发布,版权归原作者所有,禁止转载。本文仅代表作者个人观点,与本网无关。本文文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关报告

2021年诺泰生物公司小分子和多肽业务分析报告(17页).pdf
2021年诺泰生物公司小分子和多肽业务分析报告(17页).pdf

在多肽药物方面,长链多肽药物的大生产难度极大、技术门槛极高,目前行业内绝大多数厂家仅能达到单批量克级、百克级的水平。经过多年自主研发,在多肽药物合成、纯化及生产控制等各个方面,公司掌握了一系列行业领先的核心技术,成功建立了基于固液融合的多肽规模化生产技术平台,具备了侧链化学修饰多肽、长链修饰多肽数公斤级的

2021年诺泰生物公司业务布局与盈利能力分析报告(20页).pdf
2021年诺泰生物公司业务布局与盈利能力分析报告(20页).pdf

备注:按每年 300 个工作天数作为计算基数;按照代表性产品的产量、反应釜的体积来衡量产能和产能利用率,因此产能利用率有超过 100%的情况。公司已将 CDMO 业务拓展至多肽领域。公司为前沿生物的国家 1 类多肽创新药艾博韦泰提供原料药的定制生产服务,目前已完成工艺试生产批和验证批,并已在 CDE 原辅包

2021年中国 CDMO 行业前景与诺泰生物公司盈利能力分析报告(-1页).pdf
2021年中国 CDMO 行业前景与诺泰生物公司盈利能力分析报告(-1页).pdf

多肽药物具有广阔的市场空间。由于多肽药物具有较高的活性及选择性,其在治疗 复杂疾病方面优势明显,目前主要应用于慢病治疗。目前,国际上的多肽药物主要分布 在 7 大疾病治疗领域,包括罕见病、肿瘤、糖尿病、胃肠道、骨科、免疫、心血管疾病 等,其中罕见病、肿瘤和糖尿病是拉动多肽药物市场的“三驾马车”。随着多肽药物

诺泰生物-小分子+多肽双轮驱动长期发展值得期待-210714(14页).pdf
诺泰生物-小分子+多肽双轮驱动长期发展值得期待-210714(14页).pdf

 多肽是由多个氨基酸通过脱水缩合形成肽键连接而成的一类化合物,其连接方式与蛋白质相同,但多肽的分子量一般远小于蛋白质,且大于小分子,因多肽药物相比于小分子药物有众多优点,近几年发展速度较快。根据 IQVIA 数据,2007 年全球多肽药物制剂市场规模约为 123.9 亿美元,到 2017 年已增至 340.5

【公司研究】诺泰生物-小分子CDMO高成长多肽特色业务逐渐发力-210429(21页).pdf
【公司研究】诺泰生物-小分子CDMO高成长多肽特色业务逐渐发力-210429(21页).pdf

中国 CDMO 作为一个近 20 年成长起来的新兴产业,海外需求是重要的发展推动力(以合全药业、凯莱英、九洲药业、博腾股份、康龙化成等为代表的头部企业海外收入占比超过 80%)。过去 20 年时间,离岸外包的承接海外订单,国内 CDMO 产业逐渐建立、健全、完善并提升了自身的 EHS、研发/开发/生产体系,

【公司研究】诺泰生物-CDMO及自主选择产品齐发力发展驶入快车道-210606(41页).pdf
【公司研究】诺泰生物-CDMO及自主选择产品齐发力发展驶入快车道-210606(41页).pdf

 比伐卢定等。化学合成法适用于化学结构较为简单的多肽,对于结构比较复杂、长度比较长的多肽,化学合成法的难度较高。化学合成多肽主要有液相合成和固相合成两种方法,其中液相反应是以N-保护氨基酸为起始原料,逐步连接氨基酸残基的过程,可以采用分段合成的汇聚式路线。其每一步反应都需要将中间体分离纯化后,再进入下一步反应

【公司研究】诺泰生物-CDMOCMO+高端仿制药+创新药三发驱动且看公司璀璨成长-210526(22页).pdf
【公司研究】诺泰生物-CDMOCMO+高端仿制药+创新药三发驱动且看公司璀璨成长-210526(22页).pdf

公司已将 CDMO 业务拓展至多肽领域。公司为前沿生物的国家 1 类多肽创新药艾博韦泰提供原料药的定制生产服务,目前已完成工艺试生产批和验证批,并已在 CDE 原辅包登记平台登记。未来有望以自身的多肽研发技术能力为基础,进一步拓展CDMO 多肽领域业务,助力公司长期快速发展。二、自主选择产品业务超高速增长, 

诺泰生物-深度报告:原料药基因C(D)MO启航-220320(23页).pdf
诺泰生物-深度报告:原料药基因C(D)MO启航-220320(23页).pdf

http:/ 1/25 请务必阅读正文之后的免责条款部分 Table_main 深度报告 诺泰生物诺泰生物(688076) 报告日期:2022 年 3 月 20 日 原料药基因,原料药基因,C(D)MOC(D)MO 启航启航 诺泰生物深度报告 table_zw 公司研究化学制药行业 报告导读报告导读 我们

会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部