自然语言处理和人工智能:方法论和相关解释

自然语言处理和人工智能:方法论和相关解释

自然语言处理(NLP)是指人工智能的一个分支,主要集中在计算机上,可以像人一样分析和理解书面文本和口语。如今,NLP以各种不同的方式广泛应用于企业。

NLP混合了统计机器学习模型和计算语言学(基于规则的人类语言建模),这些技术用于使计算机能够处理人类语言,以理解人类说话者和作家所说或所写的内容。

NLP在很多情况下都是有用的,比如它可以用作翻译机器,在翻译文本的同时考虑作者或说话者的情绪和意图,总结大量的文本数据,并对书面或口头命令做出反应。

您可能以不同的方式看到过NLP的作用,它被用于特定的GPS系统,数字助手,如Alexa,释义工具,如释义工具。还有各种网站上用于客户服务的聊天机器人。

自然语言处理和人工智能:方法论和相关解释

此外,你会发现许多在线工具使用NLP和其他人工智能算法来生成、分析、编辑、分类和总结文本,比如论文生成器,当给出一个主题时,可以在几秒钟内编写论文,剽窃检查工具,分析提供的文本,并通过扫描数十亿个网页的文本来发现重复的内容。

自然语言处理和人工智能:方法论和相关解释

NLP主要用于解决和简化难办费力的业务流程,减少人力,帮助提高员工的工作效率。

NLP 的组成部分

NLP 包括两个不同的部分,下面分别讨论:

1、自然语言生成

自然语言生成或NLG,顾名思义,是从数据中制作具有适当含义的短语和句子的过程。

该方法分为三个阶段:

  • 文本规划:分析和恢复适用的文本
  • 句子规划:生成带有特定语气的短语和句子。
  • 文本实现:映射来推导正确的句子结构。

NLG被用于聊天机器人、分析平台、释义工具、情感分析、虚拟助手和转录工具。

自然语言理解

自然语言理解或NLU 用于从内容中提取元数据以分析、解释和理解人类语言。它用于:

  • 帮助分析所用语言的各个方面
  • 有助于以自然语言正确呈现输入内容。

相比之下,NLU 比基于 NLG 的任务更复杂,因为它需要引用:

● 词汇歧义:

一个词有时具有不同的含义,最终会改变整个文本的内容。例如,“亚历克斯看到了一只蝙蝠”。这句话含义不一,意思不明确。Alex saw a bat (a bat can be an an animal or a wooden bat) also Alex saw a bat 可能意味着 Alex 正在用锯子锯棒球棒或板球棒。

● 句法歧义:

当一个句子中排列的多个单词具有不止一种含义时,就会出现句法歧义。例如,这句话中的“I invited the person with a note”有两种意思,要么是用纸条邀请人,要么是拿着纸条邀请人。

● 指称歧义:

当一个单词或短语推导出两个或多个属性导致混淆时,就会出现这种歧义。比如, Stella认识了 Alice和Stephanie,后来她们去看了电影。这里的“他们”要么是指他们三人去看电影,要么是Alice和Stephanie遇到Stella后去看电影。

自然语言处理的应用领域

自然语言处理具有广泛的用途,下面讨论NLP的一些用法:

● 自动翻译

你可能见过翻译,它们由NLP算法驱动,帮助将一种自然语言翻译成另一种自然语言。生成的文本是流畅的,并且保留了原始文本的含义。

● 文本释义

意译需要深入的知识和实践才能取得有效的效果,NLP与其他基于人工智能的算法一起,对单词进行标记,改变它们的同义词,检测语气,并使用不同的技术重写文本,从而获得独特而引人注目的文本。

您将看到许多基于NLP的释义工具可用于此类用途。如果你想使用一个,你可以使用aiarticlespinner.co ,因为它是一个主流和著名的工具,专门用来满足释义相关的需求。

自然语言处理和人工智能:方法论和相关解释

● 命名实体识别

NLP用于识别和提取人、事物和地点名称等实体,这些实体被进一步归类为时间、地点、人名和公司,这个名字说明了它的用途。

典型的用途是学术副本的研究,SEO的内容分类等等。refrens.com 就是一个典型的例子,它在其工具中使用名称-实体识别来创建有效的发票等等。

● 情绪分析

人类的思维方式是不可预测的,因此计算机很难理解人类的语言并据此采取行动,这就是NLP的用武之地。它用于情感分析,以确定特定文本是积极的、中性的还是消极的。情绪分析可以检测趋势、客户评论、产品搜索等。

● 解决查询

NLP分析来自维基百科、各种随机文章、推特和quora答案等来源的非结构化文档,自动收集所有有用的信息来回答用户的问题。

人工智能中的自然语言处理方法

NLP管道包括一组阅读和理解人类语言的步骤。

NLP是人工智能的一个分支,它可以阅读和理解人类语言,并据此采取行动。下面是基于NLP的过程中理解文本和音频内容的一系列步骤。

句子分割或分割

这是NLP的第一步,它分析一个段落,并将其分成不同的句子,使文本更容易理解。

例如,“女巫之水是一个主题公园,位于奥地利蒂罗尔Söll的缆车中间站。中心部分是一个由池塘和小溪组成的水上公园,孩子们可以在那里玩各种水上游戏。它延伸约500米,并配有各种高山餐厅、游乐场和宠物动物园。”

在分割之后,下面是我们得到的结果:

“女巫之水是一个主题公园,位于奥地利蒂罗尔Söll缆车的中间站。”

“中心部分是一个由池塘和小溪组成的水上公园,孩子们可以在那里玩各种水上游戏。”

“它绵延约500米,并配有各种高山餐厅、游乐场和宠物动物园。”

词标记化

将段落分解成句子后,单词标记化用于将每个单词(标记)从句子中分离出来,以帮助机器理解文本背后的上下文或思想。

这里我们将使用上面示例中的一句话:“The Witches’ Water is a theme park at the middle station of the cable car at Söll in Tyrol, Austria.”

标记化后:

“The”, “Witches”, “Water”, “is”, “a”, “theme”, “park”, “at”, “the”, “middle”, “stallion”, “of”, “the”, “cable”, “car”, “at”, “Söll”, “in”, “Tyrol”, “Austria”,“.”

词干化和词根化

第三步是词干文本,其中模型分析词性以理解和提取句子的实际含义或上下文。在标记化之后,将单词分离出来,然后通过词干和规范化使用它们的根形式,单词或符号的词根形式有助于预测词性。

另一方面,词元化是通过去除某些屈折词尾使一个词恢复到标准形式,由此产生的词被称为词条。然而,这两个过程似乎有很多相似之处,唯一的区别是词干生成的词有时没有意义,而词条是实际的词。

自然语言处理和人工智能:方法论和相关解释

停词分析

文档中的重要词主要由NLP提取和集中,像“is”、“am”、“a”这样的词被NLP标记为停用词,对这些单词进行过滤主要是为了确保更多地关注那些可以推断出含义的单词,以便更好地理解文本的上下文。

依赖性解析

管道中的下一步是依赖解析,其中定义了句子中单词的关系,以明确文本的思想。一个词是父词,主要动词被指定为词根连词。

自然语言处理和人工智能:方法论和相关解释

词性 (POS) 标注

为了使文本清晰明了并且计算机可以理解,每个单词都标有其词性,这样就避免了语法问题,并指出了句子的真正含义。这是一个例子:

自然语言处理和人工智能:方法论和相关解释
自然语言处理和人工智能:方法论和相关解释

所有这些过程都相互关联,它可能看起来像一个漫长的过程,但由于这是使用机器完成的,因此由于预训练模型,只需几秒钟即可完成所有这些任务。

结语

NLP 是人工智能的一项研究和一部分,用于帮助机器理解人类语言并相应地进行交互,它广泛用于我们日常使用的许多工具的后端,例如语法检查器、翻译器和释义工具。

NLP并不总是单独执行,它现在与机器学习算法一起使用,训练机器在没有任何帮助的情况下执行繁忙的任务,并从每个任务中获得更好的结果。

参考链接:https://www.datasciencelearner.com/natural-language-processing-ai-methodology-and-correlation/

—煤油灯科技victorlamp.com翻译整理—

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论