深度学习和自然语言处理NLP
gaozhsh2020首次发布:2020年8月1日 17:26浏览量:2551
 用鼠标选中
生字  后,就能自动读出发音 
从根本上说,深度学习在 NLP 问题上的优势有三,这是传统机器学习方法所不具备的。
1.表达能力:利用深度学习,文本、图像等不同格式都可以表示为实值向量,这使得我们可以跨多种模式执行信息处理。例如,在图像检索中将查询(文本)与图像进行匹配并找到最相关图像变得可行,因为它们都可以表示为向量。
2.可训练性:深度学习让我们可以为应用执行端到端的训练,从而快速、高质量地解决问题,因为深度神经网络使得数据中的信息能在模型中被有效“编码”。例如,在神经机器翻译(NMT)中,模型完全由平行语料库(parallel corpora)自动构建,通常不需要人为干预。与统计机器翻译的传统方法相比,这显然是一个优势,特征工程对于后者是至关重要的。
3.可推广性:机器对未经训练的数据也可以执行预测。可以更为全面地理解深度学习用于 NLP 的优势与挑战。优势:
擅长模式识别问题数据驱动,且在很多问题上性能都很高端到端训练,构建系统时很少需要或不需要领域知识(当然这一点也有争议)表示学习,使得跨模式处理可行基于梯度的学习。
学习算法很简单主要是监督学习方法挑战:
(1) 不擅长推理和决策不能直接处理符号数据饥渴,在数据量较小时不适用难以处理长尾现象模型;
(2) 通常是一个黑盒子,可解释性差计算成本很高。
总之,无监督学习方法有待突破仍然缺乏理论基础。
您已浏览完毕。
高章舜,软考技术支持专家、中文“智能文”发明者、中文智能化推进者。其EMAIL是:gaozhsh2007@sina.com
高章舜主持开发的中文智能编辑系统,呈现了中文“智能体”的优美。为了发扬光大中文的优秀传统,弘扬文化自信,著作人决定第一版开源,向全社会开放本版本的使用权。如果您需要更清晰、更优美、更专业、手写体更丰富的文章格式,甚至还需要定制字体和文章格式的话,请按上一段里的EMAIL给高章舜老师发邮件。
copy right www.zhutu.net 回首页