ICENT汉英机器翻译系统中的语义模型

ICENT汉英机器翻译系统中的语义模型

一、ICENT汉英机译系统中的语义模型(论文文献综述)

王玉帛[1](2020)在《三维转换视阈下汉英机器翻译译后编辑实践与研究》文中进行了进一步梳理

刘雨婷[2](2019)在《中华典籍机器译文可接受性的调查研究 ——以《论语》为例》文中研究指明机器翻译和中华典籍英译可接受性的大量研究发现,目前从译文读者的角度,针对中华典籍机器译文的可接受性量化评估的研究还不多见。本文从《论语》文本特征出发,以可接受性理论为依托,并将读者纳入机器译文可接受性的评估模型中,提出了基于读者的可接受性评估模型,探讨了中国读者和外国读者对《论语》机器译文的可接受性及其差异。本文的可接受性是指读者基于原文和参考译文,对译文的形式和意义是否理解和是否接受,既考虑文本内的译文质量因素;又考虑文本外的读者因素。本文将《论语》译文读者分为外国读者和中国读者。外国读者为目的语读者,母语为英语,主要是来自孔子学院的学生、在华留学生和外教;中国读者为从事多年英汉翻译研究的多所高校教师,具有较高的学术水平。本文选取了刘殿爵的《论语》译本作为“参照译文”,让译文读者对机器译文分别从词汇、句法、语义、主旨和总体可接受度进行打分评价。以针对性的问卷调查、访谈法为手段,调查了《论语》机器译文在外国读者和中国读者中的接受情况。接受测试者包括外国读者32名和中国读者37名。通过数据分析和文本比较,宏观与微观相结合,定量与定性相结合,深入且系统地探讨了中国读者和外国读者对机器翻译典籍译文的可接受性差异,以及其差异形成的原因;并在其分析的基础上,为机器翻译典籍研究和中华典籍文化的外译提供建议和策略。本文的主要结论如下:(1)外国读者和中国读者对《论语》机器译文的可接受度为基本接受,中国读者对《论语》机器译文的整体可接受度比外国读者的整体可接受度更高。外国读者评价机器译文更关注词汇层面和语义层面;中国读者则更关注句法层面和主旨层面。(2)外国读者和中国读者的性别、汉语水平、《论语》阅读情况、机器翻译使用频率对机器译文总体接受度均没有显着差异,即说明二者的可接受度有一定的容错性。机器译文越容易“获得主旨,越符合”、“意义准确”这个翻译标准,中国读者对机器译文总体可接受程度则会越高。(3)本研究通过相关性分析发现,词汇、句法、语义和主旨四个评价因子与机器译文质量总体可接受度之间存在正相关关系。通过回归分析发现,外国读者的词汇可接受度和语义可接受度会对机器译文总体可接受度产生显着的正向影响,但句法可接受度和主旨可接受度并不会对机器译文总体可接受度产生影响。中国读者的句法可接受度和主旨可接受度会对机器译文总体可接受度产生显着的正向影响,但词汇可接受度和语义可接受度并不会对机器译文总体可接受度产生影响。(4)中华典籍机器译文的可接受性评估模型有效。在外国读者中,这四个因素构成的评估模型可解释译文总体可接受度69.1%;而在中国读者中,这四个因素构成的评估模型可解释译文总体可接受度92.3%。这充分说明,将语义和主旨评价因子引入读者可接受性模型具有一定的解释意义。(5)《论语》的翻译不仅要注重形式对等,更要注重意义的对等。从机器译文质量评析来看,机器翻译在词汇和主旨层面取得较大的进展,但仍存在欠译和错译的问题。有些词汇译文在形式接近原文,但意义却存在较大的差别。虽然术语翻译较为准确,但与人工翻译对比,其意义还存在细微的差别。这个问题应引起学术界高度重视,因为只有术语(尤其是文化术语)被读者理解和接受,文化意义才能正确地传达给读者,否则往往会引起文化的误读。机器翻译在句法和语义层面多存在漏译和错译问题,这是导致译文质量不高的主要因素。机器译文在句法层面多存在“中式英语”,不符合英语的表达规范;语篇缺少连接词、修辞效果不佳、文学风格不足。这些不仅是读者不能接受的原因,也是机器译文质量不高的主要原因。(6)以往的可接受性研究只停留在机器翻译典籍的文本类型和适用性的讨论上,未在文本比较层面深入和系统化的研究机器译文质量。本文基于中国读者和外国读者可接受度,对比人工译文,在词汇、句法、语义和主旨四个层面对机器译文进行了质量评析,并指出影响中华典籍机器译文的质量评析应重点关注两种情形:一是形式对等,意义不对等;二是形式不对等,意义不对等。本研究旨在抛砖引玉,在鼓励大数据技术与典籍英译结合研究的同时,希望引发更多的学者对中华典籍与机器翻译关注与思考。

唐革亮[3](2018)在《系统功能语言学视域下政治语篇中名词化翻译策略研究》文中研究指明政治语篇主要涉及国家或政党的方针政策与态度立场,是政治话语的主要表现形式,政治语篇的对外翻译直接影响到对外政治话语的传播效果,具有重要的战略意义。在我国,汉语政治语篇的翻译研究以中央重要政治文献的英译为主,资深译员、外宣工作者、翻译研究者围绕政治语篇翻译的经验体会、原则目标和策略方法等问题展开了多种层面和维度的探讨。但是,已有研究往往以宏观论述或个案分析为主,描述性和解释性不足,对汉英语言的结构差异关注较多,忽视了翻译中的选择对目标语语篇意义的建构作用。名词化具有重新识解经验的概念功能,能够将由动词识解的过程意义、形容词识解的属性意义等重新识解为事物,是主要的语法隐喻资源,在科技语篇的建构中发挥了重要作用(Halliday,1994;1998a)。汉语政治语篇及其英译文中同样存在大量名词化表达,如“现代化”modernization、“可持续发展”sustainable development、“党的建设”Party building等。然而,学界对于此类语篇中名词化表达的翻译方法及语篇建构功能却鲜有系统研究,一些翻译实践中的实际问题尚未得到有效解答,诸如如何翻译源语语篇中的名词化,如何翻译为目标语语篇中的名词化,以及翻译策略和方法选择的动因与功能等。鉴于此,研究政治语篇翻译中的名词化现象具有一定必要性,不仅可以深入了解名词化的使用情况和翻译方法,还可以揭示名词化对政治语篇及政治话语的建构作用。本研究主要在观察名词化分布的基础之上总结并概括政治语篇名词化的翻译策略和方法,发现名词化翻译的规律性特征,探究其背后的理据,阐释其在意义及社会层面的建构功能,从而为翻译实践及教学提出有价值的建议和参考。本研究针对的主要问题包括三个方面:(1)政治语篇及其翻译中汉英名词化表达具有何种分布与特征?呈现何种翻译模式和规律?(2)政治语篇翻译中名词化对等翻译具有哪些特征及建构功能?政治语篇特色名词化表达如何翻译?(3)政治语篇翻译中名词化转移翻译具有哪些特征及建构功能?受哪些因素影响?为了对以上问题进行科学系统地探究,本研究依据系统功能语言学的语法隐喻理论及系统功能翻译研究提出的“对等-转移”渐变体思想(Matthiessen,2014)为名词化的翻译策略和方法建立了描写框架。此外,本研究还以“翻译再实例化”(de Souza,2010;Yang,2015)模型为基础,对翻译过程中影响翻译策略和方法选择的主要因素建立了阐释框架。对名词化翻译实例的观察,本研究主要采用基于平行语料库的方法,对名词化的分布及翻译策略进行量化与质化分析。本研究自建的政治语篇汉英平行语料库由47篇十八大以来的重要党政文献及其官方译文组成,内容涵盖政治、经济、外交、军事、环境等多种话题,平行语料库总容量接近100万字词。本研究主要发现与结论如下:(1)名词化现象在汉语政治语篇及其英译文中大量分布。从频数来看,英语译文中名词化的使用高于汉语原文,但使用频率相当,说明目标语语篇与源语语篇的隐喻度在整体上基本保持一致,实现了文体风格的对等。此外,汉英不同名词化类型在语篇中的分布存在显着差异,汉语以转类型名词化为主,英语则以派生型名词化居多,主要受汉英语言的类型因素影响。其中,政治语篇英译文中,派生词缀-tion/-sion、-ment、-ance/-ence、-ty、-ing具有较高的使用频率,汉语原文中能产性较高的词缀为“-性”、“-率”、“-力”、“-化”、“-主义”,与英语的接触以及社会的发展是现代汉语派生名词化大量涌现的主要原因。汉语政治语篇中的高频转类词为“发展”、“建设”、“工作”、“改革”和“安全”,高频转类名词化结构为“NP+VP”结构,在没有形式标记的限制下,汉语存在大量兼类及活用的转类名词化。英语转类型名词化以单音节和双音节词居多,政治语篇英译文中出现的高频转类词为reform、work、support、use、control,这些词以名词性用法为主,表明其在共时层面的隐喻性有所削弱。短语层面的名词化结构“NP的VP”和“V-ing of”在整体上具有名词性,结构的组成成分具有一定临场性,且相对词汇层面的名词化保留了更多过程意义。(2)名词化翻译策略可概括为对等翻译和转移翻译两种,对等翻译还原了原文的名词化表达式,而转移翻译则改变了原文的识解方式,对目标语语篇意义进行重新建构。在政治语篇翻译中将汉语名词化结构翻译为对等的英语名词化是译者采取的主要翻译策略,比例达到47.7%,一方面说明了汉英名词化结构在意义和功能上的共性,另一方面也说明了译者在翻译政治语篇时倾向于保留原文中隐喻式表达,以实现语篇在意义识解方式上的对等。本研究发现名词化对等翻译包括“系统型”和“实例型”两种具体类型,前者为两种语言之间高度对应的名词化,如“重要性”importance、“全球化”globalization,后者为译者根据语境选择的临时性对等,如“环境治理”environmental improvement。但是,并非所有的汉语名词化表达都适宜翻译为对等的英语名词化,例如“化”字格和数式短语等政治语篇特色名词化表达,有时并不具备系统型对等项或不宜进行异化翻译,译者则需要采用转移翻译策略。基于名词化自身的概念功能,本研究认为名词化对等翻译策略在对外政治话语建构中具有凝练中国概念、中国道路和核心价值表述的作用。(3)转移翻译策略还可进一步分为隐喻化转移和去隐喻化转移两种具体类型。隐喻化转移翻译将原文中的非名词化表达翻译为译文中的名词化,去隐喻化转移翻译则将原文中的名词化表达翻译为其他非隐喻化结构,两者可以通过与同级其他词组转换、升级为小句、降级为零对应的翻译方法实现。其中,隐喻化转移翻译在政治语篇翻译中更为常见,比例约为去隐喻化转移翻译的三倍,说明英语的名词化选择更加丰富,在政治语篇建构中发挥了更多积极作用。对具体译例的质化分析表明语言系统因素、语篇类型因素、情景语境因素和文化语境因素在政治语篇翻译中对译者的选择产生主要影响,译者通过识解方式的转换使目标语语篇符合目标语语言系统的表达规范,顺应目标语语境,从而被目标语读者接受,在政治语篇翻译中起到了重构原文信息和结构、简化译文表达、概括原文及译文上下文语义内容、释义原文复杂语义的功能,增加了目标语语篇的可读性,从而有助于对外政治话语能见度的提升。本研究在理论视角、研究方法和体裁选取方面进一步拓展了名词化翻译研究,发现了政治语篇名词化翻译的规律性特征,分析了其背后的内在与外在因素,并从更深的意义层面阐释了其翻译策略与方法的建构功能。本研究对翻译实践与教学具有一定的启示意义和参考价值,能够提高译者的建构意识和主体意识,同时还从语言使用层面揭示了对外政治话语的表达方式与方法,为话语体系研究作以补充。

冯志伟[4](2018)在《八十老翁 平生无悔》文中研究说明我的名字叫冯志伟,生于1939年4月15日,云南省昆明市人。今年我虚岁满80岁了,应《文化学刊》之约,我在这里把这80年的生活做一个总结,以看到自己的成绩和不足。我于1945年在昆明东升小学读小学,1951年以第一名的成绩考入昆明一中,1957年考入北京大学地球化学专业本科学习,1959年弃理学文转入北京大学中文系汉语专业本科学习,1964年考入北京大学中文系

贺胜[5](2017)在《现代汉语深度语义标注语料库研究》文中研究表明当前,世界各国学者都十分重视自然语言处理的知识资源的建设,建立了许多带各种标注信息的语料库,以适应更为深入的语言研究和自然语言处理系统的需要。在中文信息处理方面,汉语标注资源急需的是句子级的资源,需要一种可以描述出句子中词语与词语之间的深度语义信息的标注语料库。因此,探求半自动、甚至自动地建设大规模深度语义标注语料库的策略、模型、技术及方法显得极为迫切。语义分析技术是自然语言处理领域中最重要也是最为困难的问题。如何实现有效、深入、自动的句子语义分析,一直是国内外从事自然语言处理的研究者们所关注的重要目标。目前,自然语言处理领域的语义研究主要集中在浅层语义分析。浅层分析虽然降低了语义分析的难度,但是只解决了动核和语义角色的配置问题,对于情态成分以及名核结构所承担角色的内部语义关系并未进行标注,因此还不是句子语义结构的完整揭示。在我们的深度语义标注语料库中,主是是针对九年制中小学语文课本语料进行语义词类和句法语义范畴标注。语义词类指词汇的所属义类。句法语义范畴指语块所对应的语义范畴信息,包括核心范畴、修饰限定范畴、情态范畴等。目前,国内外语义词典中的语义分类体系更多的都是基于自然科学或常识,与这些基于常识的各种语义分类相比,我们研制的语义词类其突出特点是语义分类取决于句法语义分析的需要,可以解决一些仅靠句法分析难以解决的问题,形成了一套面向计算机语言处理的独特的标注体系,对中文信息处理中的句法语义自动分析具有重要意义。根据该指导思想,我们在语义角色标注方法中,使用了一种与传统方法不同的处理策略,我们称之为基于语义词类和语义句型框架的语义角色标注方法,这一方法将汉语语义角色标注从节点的分类问题转化为序列标注问题,由于避开了传统的句法分析环节,使得语义角色标注摆脱了对句法分析的依赖,从而避开了汉语句法分析器造成的时间和性能限制。经测试,新的方法可以取得较高的准确率,并且大大节省了分析的时间,有利于实际应用。本文围绕现代汉语深度语义标注语料库的建设和应用,进行了一系列的相关技术研究,主要成果如下:1、针对语料库的建设和应用需要,研制开发了语义词类词典制作工具、语义词类自动标注工具、语义词类检索统计工具、句法语义范畴检索统计工具、语义词类与句法语义范畴对应关系检索统计工具、句型抽取统计工具、句模抽取统计工具、句法语义范畴辅助标注工具等应用软件,为深度语义标注语料库的建设和应用提供了很好的技术支持。2、收集、制作了 4万多条的语义词类词典,标注了词性、词类和频率等信息,为语义词类的自动标注提供了语言知识支持。3、针对语义词类的自动标注,设计了基于隐马模型的标注算法,结合基于动态规划的Viterbi算法,在训练语料规模偏小、数据稀疏较严重的情况下仍然取得了封闭测试正确率94.3%,开放测试正确率89.1%的效果。4、针对语义词类标注中的未登录词问题,提出了基于知网概念定义的未登陆词处理方案。经研究发现,语义词类系统和知网概念存在的对应关系主要体现在指称类-实体类、陈述类-事件类两个方面,并据此制定了相应处理规则。5、针对句法语义范畴中的语义角色标注,在总结比较现有主流算法的基础上,提出了基于语义词类和语义句型框架的语义角色标注算法,采用IOB策略,利用CRF模型,结合优化的特征参数,取得了分类精度超过91.8%,系统F值达78%的较好成绩。6、基于已标注的深度语义标注语料库,通过开发相关工具软件,建立了语义词类与句法语义范畴对应关系知识库、语义句型框架库、语义句模知识库,为后续的句法语义研究和应用奠定了更好的基础。基于语义词类自动标注和句法语义范畴中的语义角色标注研究,从实践上验证了语义语法学在自然语言处理中的可行性和实用性。本文的研究成果进一步丰富了语义语法学理论与方法,为实现汉语句子深层语义分析提供了新的途径,为自然语言处理领域基于语义分析的应用系统提供了一种新的技术支撑。

王琳[6](2017)在《知网机器翻译系统的分析与知识库扩展》文中提出机器翻译是利用计算机自动将一种自然语言转换成另一种自然语言的过程。目前主流的机器翻译方法有基于规则、基于统计和神经机器翻译等方法,无论是哪种机器翻译方法,语义知识应用到翻译中效果都有所提升,因此近些年来,语义备受机器翻译研究者关注。本文所研究的知网机器翻译系统正是该方法在机器翻译中的一个典型应用。知网机器翻译系统是一个基于知识的翻译系统。该系统的知识库包含知网知识库、公理规则库、翻译规则库,其中知网知识库在机器翻译中作为语言资源,公理规则为词义消歧奠定基础,翻译规则库控制翻译流程中的逻辑语义分析及译文转换生成。本文深入学习了该系统并对系统的理论依据及翻译过程进行概述,在专利、航空、中国日报语料上对系统性能进行测试,分析了知网翻译系统的优势及存在的问题。在存在的十余种问题中,对比得出未登录词和选词对翻译结果影响最为严重,特别是在航空测试语料中这两类问题表现更为突出。为了解决未登录词问题,本文对知网机器翻译系统的知网知识库进行了扩展。提出基于中心词的术语知识库自动构建方法,通过获取术语中心词的DEF来构建术语。而中心词多义的现象普遍存在,本文在知网意义群落消歧中扩展了公理规则,并对术语通过进行上下文特征扩展及译文候选排序方法排除歧义,最终构建的术语加入知网知识库中,翻译结果得到提升。为了解决译文选词问题,本文对知网机译系统的翻译规则库进行了扩展。通过扩展个性翻译规则改善译文选词,设计开发了知网翻译规则动态调试系统,该系统可以辅助用户方便地修改和追加翻译规则。利用扩展后的翻译规则库,翻译选词结果得到明显改善。

邹晓辉,邹顺鹏[7](2015)在《双语信息处理方法及原理》文中提出旨在阐述双语信息处理方法及其原理。该方法的特征在于人机双方都可按各自的特点来彼此协作或响应,具体含三个基本步骤:首先,从汉英翻译的困难发现问题;接着从跨学科、跨领域和跨行业的角度分析问题;最后,从人机分工与合作的角度解决问题。其结果是,不仅发现了大、小字符串并行的双重形式化进路,而且还发现并验证了广义双语信息处理方法的优点及其所遵循的科学原理。其意义在于:既可从理论上开阔思路,又可在实践中发挥作用。例如可兼容形式信息论的收敛性或封闭性与语义信息论的发散性或开放性;再如可采用算术和语文这样的广义双语信息处理方法驾驭强、弱两派的人工智能观点。不仅可很好地解释信息术语的约束条件,而且还可较为满意地规范不同的信息观和人工智能观的应用约束情景即兼顾人际、人机、机际、机人一系列双语应用的实际语境。

武斌[8](2007)在《面向俄文信息处理的机器翻译实验研究》文中进行了进一步梳理本文的主要内容是面向俄文信息处理的机器翻译实验研究。一般而论,要研制实用的机器翻译系统,必须要有一套完整的、逻辑性强的、适用于计算机处理的翻译理论体系。然而,通过研究俄罗斯机器翻译的历史与现状,探索机器翻译系统设计的语言学保障和程序保障,我们发现,目前国内外还没有一套比较成熟而有效的俄汉机器翻译理论。因此,如何提高俄语文本尤其是军事文本的机器翻译正确率,将是本课题研究的重点和主攻方向。在对国内外基于规则的俄汉机器翻译软件实际使用后,我们发现,如果继续沿用传统的基于语法规则的自动翻译方法,要想大幅提高俄语军事文本翻译的准确率是相当困难的。通过将几种机器翻译方法进行对比分析,我们认为,从工程实施的角度来看,以翻译记忆(Translation Memory, TM)技术为核心的计算机辅助翻译应该是最佳选择。一方面,军事文本在词语、句型、结构等方面相似度高,术语和语句的重复率大,这正是可以发挥TM技术优势之处;另一方面,军事文本的翻译对于时效性和准确率要求较高,这是其他翻译形式所无法胜任的。本文的主要学术价值在于:系统介绍了俄罗斯机器翻译研究的历史与现状,客观分析了机器翻译未来的发展方向,提出了基于TM的计算机辅助翻译系统的核心技术和实现方法。本文的研究将有助于拓宽机器翻译应用研究的范围,提高现有机器翻译系统的性能,为研制开发军事用途俄汉机译系统积累一定的经验。论文由绪论、正文四章、结论和参考文献组成。绪论部分主要介绍论文的选题动机、研究的目的和意义、学术新意及语料来源等。第一章“世界科学计算机化语境下的机器翻译研究概述”,首先对翻译与机器翻译进行界定,然后概述机器翻译研究的历史与现状,详细介绍机器翻译研究的几种基本方法。第二章“苏俄机器翻译系统解析”,首先扼要介绍《意思?文本》语言学模型理论,然后通过对几个典型机器翻译平台,包括ETAP系统、RETRANS系统以及LINGTON系统进行解析,指出各个系统针对俄文信息处理积累的经验与存在的不足。第三章“机器翻译系统评价”,首先概述机器翻译评价的理论与方法,然后运用机器翻译评价的相关理论,以机器翻译的在线资源为手段,对包括俄汉译通在内的三个俄汉机器翻译引擎进行综合评价。第四章“俄汉军用文书机器辅助翻译系统的设计与实现”,根据军用文书的语体特征,揭示基于TM技术的机器辅助翻译的优势,论述研制此类系统的语言学保障和程序保障。结论部分对本论文的理论与应用研究成果进行总结,指出尚待解决的问题。

肖薇[9](2007)在《汉英机器翻译及其在科技文摘要翻译中的误例研究与分析》文中研究说明汉英机器翻译在中文科技文摘要的翻译中被广泛运用。但由于机器翻译存在的对词语、语义、句法等方面分析过于简单,使得科技文摘要的译文往往具有不可读性。本文从机器翻译系统的三大基本方法入手,探讨了汉英机器翻译在目前阶段存在的问题,并指出建立可信赖汉英机器翻译模型的重要性。

魏瑾[10](2006)在《基于统计的汉英机器翻译技术的研究》文中研究表明随着Internet的迅速普及,机器翻译显示了日益广阔的应用前景。当前统计机器翻译的研究主要针对英语、法语、德语或其他西方语言之间的翻译,本文研究了统计机器翻译原理和技术,并在此基础上构建了一个基于统计的汉英机器翻译系统原型。我们的工作主要包括两部分:1、研究了基于单词对齐模型的汉英统计机器翻译,这部分的研究采用了基于信源信道模型的统计机器翻译方法,该方法是当前统计机器翻译研究中应用最广的方法。2、基于短语对齐模型的汉英统计机器翻译研究,这部分以第一部分工作为基础。在基于单词对齐模型的汉英机器翻译研究中,我们采用了IBM对齐模型。已有的研究表明,IBM的五个模型中,模型4的对齐效果最好,所以我们的研究以IBM模型4为基础。主要工作包括:构建汉英翻译模型、构建英语语言模型、实现解码器。具体如下:1)构建汉英翻译模型。在构建翻译模型时引入了词性信息,实验显示,引入词性信息后,提高了单词对齐的质量,参数更准确,在改进后的模型上进行搜索得到的译文质量更优。2)实现了A*和beam搜索算法。对A*搜索算法和beam算法的实验数据进行了对比,结果显示A*搜索算法在汉英统计机器翻译中表现更好。3)对A*搜索算法进行改进。A*搜索算法只扩展分值最优的结点,而汉语和英语是差别非常大的语言,在汉英机器翻译中,仅扩展最优结点会导致错误的方向,漏掉质量更好的译文。因此我们对算法进行了改进,引入了宽度搜索,为选择扩展结点制定了启发策略。实验结果显示,改进后的算法生成译文的质量有了较明显提高。4)在汉英统计机器翻译中,空单词对某些翻译的影响是非常大的。所以针对汉英翻译,对有关空单词的翻译模型进行了修改,通过实验显示,这种改进缓解了空单词对汉英翻译的不利影响。5)此外,我们通过实验对影响翻译的一些参数进行了分析,这些参数包括为汉语词选择候选英语单词的范围、A*搜索算法中假设队列的长度等,并通过实验对这些参数进行了设置。因为单词对齐模型没有考虑上下文的意义,其缺陷很明显,所以当前基于短语对齐模型的统计机器翻译成了研究的热点。我们在前面工作的基础上,进行了基于短语对齐模型的汉英统计机器翻译的研究,主要有以下工作:1)设计了将基于IBM模型训练得到的Viterbi对齐与使用集中切分和短语对齐算法(ISA)相结合的方法进行单词对齐,实验表明该方法进一步提高了训练语料单词对齐的正确率。2)我们在使用ISA算法时,通过实验为单点互信息(MI)设定了计算公式,并根据实验效果设置了MI的阀值。3)设计了使用词性信息构建对齐模板的方法。4)通过提高单词对齐的正确率,我们从训练语料中抽取了大量的短语实例,这使得在翻译过程中可以使用基于翻译记忆的方法。5)我们从训练语料中抽取了模板,翻译时先匹配模板,然后我们以IBM模型4为基础评估译文的质量,衡量译文的优劣,选出最优的译文。6)通过实验表明:由于抽取的短语实例质量较高,所以引入了翻译记忆的方法,提高了短语的翻译质量;并且通过采用对齐模板考虑了上下文的语义,在一定程度上克服了单词对齐模型在这方面的缺陷,提高了翻译的效率和正确率。

二、ICENT汉英机译系统中的语义模型(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、ICENT汉英机译系统中的语义模型(论文提纲范文)

(2)中华典籍机器译文可接受性的调查研究 ——以《论语》为例(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
    1.2 研究问题与研究假设
    1.3 研究思路与方法
    1.4 研究目的与意义
    1.5 论文框架
第二章 文献综述
    2.1 机器翻译的可接受性研究
    2.2 典籍英译的可接受性研究
    2.3 研究综述
第三章 理论框架
    3.1 可接受性理论
        3.1.1 国内外学者对可接受性的研究
        3.1.2 本文的可接受性的界定
    3.2 基于读者的机器译文可接受性评估模型
第四章 研究设计与方法
    4.1 读者对象
    4.2 研究工具
        4.2.1 语料
        4.2.2 机器翻译系统
    4.3 研究方法与过程
第五章 《论语》机器译文的读者可接受度调查
    5.1 可接受性视角下的《论语》英译文读者水平调查
    5.2 《论语》英译机器译文的读者可接受度调查
        5.2.1 词汇层面
        5.2.2 句法层面
        5.2.3 语义层面
        5.2.4 主旨层面
        5.2.5 译文的总体可接受度
    5.3 读者可接受度影响因素的相关关系及其假设检验
        5.3.1 验证假设1:相关分析
        5.3.2 读者接受水平结构变量方差分析
        5.3.3 检验假设2:分层回归分析
    5.4 小结
第六章 基于读者可接受度的《论语》机器译文质量评析
    6.1 《论语》机器译文与人工译文对比分析
        6.1.1 词汇层面
        6.1.2 句法层面
        6.1.3 语义层面
        6.1.4 主旨层面
    6.2 基于读者可接受度的《论语》机器译文质量评析
    6.3 对机器翻译典籍的可接受性评估框架的修正
    6.4 提高机器译文可接受性的对策和建议
        6.4.1 译后编辑
        6.4.2 语料库构建
        6.4.3 机器翻译质量测评
    6.5 小结
第七章 结语
    7.1 本研究的结论与创新之处
    7.2 本研究的不足与展望
参考文献
附录
致谢
附件

(3)系统功能语言学视域下政治语篇中名词化翻译策略研究(论文提纲范文)

中文摘要 英文摘要 第一章 绪论
1.1 研究背景
1.2 研究对象
1.3 研究问题
1.4 研究目标
1.5 研究意义
1.6 章节安排 第二章 文献综述
2.1 名词化研究回顾
    2.1.1 名词化的本体研究
    2.1.2 名词化的应用及实用研究
2.2 政治语篇翻译研究回顾
    2.2.1 政治语篇翻译的经验与批评
    2.2.2 政治语篇翻译的原则与目标
    2.2.3 政治语篇翻译的策略与方法
2.3 功能语言学视角的翻译研究回顾
    2.3.1 功能语言学对翻译核心问题的阐释
    2.3.2 功能语言学理论在汉英翻译研究中的应用
2.4 本章小结 第三章 理论基础
3.1 功能语言学的意义观
    3.1.1 功能观
    3.1.2 建构观
    3.1.3 进化观
    3.1.4 社会符号观
3.2 功能视角下名词化的对等与转移翻译策略
    3.2.1 名词化对经验的重新识解
    3.2.2 种族发生视角下翻译过程的再实例化模型
    3.2.3 翻译对等与转移的语法隐喻理据
    3.2.4 名词化对等与转移翻译策略
3.3 本章小结 第四章 研究方法
4.1 研究思路
    4.1.1 分析模式与步骤
    4.1.2 名词化的界定与识别
4.2 政治语篇汉英平行语料库的建设
    4.2.1 平行语料库的发展与应用
    4.2.2 语料库的构成
    4.2.3 语料的预处理
    4.2.4 语料的检索与抽样
4.3 本研究使用的参照语料库
4.4 本章小结 第五章 政治语篇及其翻译中汉英名词化的分布与类型
5.1 汉英名词化及其翻译策略分布
    5.1.1 汉英名词化的分布特征
    5.1.2 名词化对等与转移翻译策略的分布特征
5.2 汉英派生型名词化
    5.2.1 源语语篇中的汉语派生名词化
    5.2.2 目标语语篇中的英语派生名词化
5.3 汉英转类型名词化
    5.3.1 源语语篇中的汉语转类名词化
    5.3.2 目标语语篇中的英语转类名词化
5.4 汉英短语型名词化
    5.4.1 源语语篇中的汉语“NP的VP”结构
    5.4.2 目标语语篇中的英语“V-ingof”结构
5.5 本章小结 第六章 政治语篇翻译中名词化对等翻译策略
6.1 政治语篇翻译中名词化对等翻译策略的类型
    6.1.1 系统型对等
    6.1.2 实例型对等
6.2 政治语篇特色名词化表达的翻译
    6.2.1 汉语“化”字格的翻译
    6.2.2 汉语数式短语的翻译
6.3 名词化对等翻译策略与对外政治话语的建构
    6.3.1 名词化所凝练的中国概念表述
    6.3.2 名词化所凝练的中国道路表述
    6.3.3 名词化所凝练的核心价值表述
6.4 本章小结 第七章 政治语篇翻译中名词化转移翻译策略
7.1 政治语篇翻译中名词化转移翻译策略的类型
    7.1.1 隐喻化转移
    7.1.2 去隐喻化转移
7.2 政治语篇翻译中名词化转移翻译策略的影响因素
    7.2.1 语言系统因素
    7.2.2 语篇类型因素
    7.2.3 情景语境因素
    7.2.4 文化语境因素
7.3 政治语篇翻译中名词化转移翻译策略的功能
    7.3.1 重构功能
    7.3.2 简化功能
    7.3.3 概括功能
    7.3.4 释义功能
7.4 名词化转移翻译策略与对外政治话语的建构
7.5 本章小结 第八章 结论
8.1 主要发现
8.2 贡献及创新点
8.3 研究启示
8.4 研究局限及展望 参考文献 附录 后记 在学期间公开发表论文及着作情况

(4)八十老翁 平生无悔(论文提纲范文)

本期“学林人物”:冯志伟
冯志伟学术成果年表
    一、主要专着:38本
    二、主要译文:2本
    三、主要论文 (用中文、英文、法文和德文发表) , 共431篇。
    四、导读外文专着:7本
    五、序言27篇
    六、编写的讲义
    七、应用系统开发
        (一) 研制机器翻译系统5个:
        (二) 研制术语数据库3个:
    八、规范标准编制
        (一) 参与编制国家标准6个:
        (二) 主持编制国家规范3个:
        (三) 主持编写国际标准1个:
    九、编写程序
    十、国内外学术界对于冯志伟的评论文章

(5)现代汉语深度语义标注语料库研究(论文提纲范文)

摘要
Abstract
绪论
    一、学术背景与选题说明
    二、研究价值和研究目标
    三、研究思路和研究方法
    四、结构安排和基本术语
第一章 语义知识库、语料库建设概述
    第一节 语言知识库与语料库
        一、语言知识库
        二、语料库
        三、语言知识库与语料库的关系
    第二节 语义知识库建设概况
        一、词义知识库建设现状
        二、句法语义知识库建设现状
    第三节 语义语料库建设现状
第二章 深度语义标注语料库建设思路
    第一节 语义标注语料库建设的理论指导
    第二节 语料库标注规范
        一、规范制定的原则
        二、制定规范的策略
        三、加工的一致性要求
    第三节 语料库标注的原则及注意问题
        一、语料库标注的原则
        二、语料库标注应注意的问题
    第四节 《深度语义标注语料库》介绍
        一、语料的来源
        二、语料库的构成及规模
    第五节 语料库加工流程及标注样例
第三章 深度语义标注语料库的语义词类系统
    第一节 汉语语义词类系统研究概况
    第二节 汉语语义词类系统的比较
        一、语义分类为主,兼顾传统语法词类
        二、传统语法词类为纲,语义词类为目
        三、哲学观点为纲,语义词类为目
    第三节 汉语语义词类系统构建的目的
        一、为语言知识库的研究提供新思路
        二、为中文信息处理的研究提供基础
        三、服务于现代汉语语义网络的建构研究
    第四节 语义词类的分类体系
        一、语义词类系统的分类原则
        二、语义词类系统的分类框架
        三、语义词类系统的标注集
第四章 语义词类自动标注研究
    第一节 系统开发方案
        一、性能指标要求
        二、语义词类的标注困难
        三、系统开发步骤
    第二节 语义词类词典的构建
        一、词典构建方式
        二、本系统词典的结构
        三、语义词类词典制作工具的功能
    第三节 语义词类自动标注的模型算法及处理方式
        一、语言统计模型
        二、标注算法
        三、系统模型参数获取
        四、基于知网概念定义的未登陆词处理
        五、数据稀疏问题的处理
    第四节 技术实现及测试结果分析
        一、系统的开发环境
        二、技术实现
        三、系统实现描述
        四、软件功能及界面
        五、测试结果及分析
第五章 深度语义标注库的句法语义范畴系统
    第一节 句法语义研究现状
        一、国外句法语义研究
        二、汉语句法语义研究
    第二节 语义语法学的句法语义范畴体系
    第三节 句法语义范畴体系中的陈述结构框架
        一、陈述结核范畴体系
        二、基本角色范畴体系
        三、附加角色范畴体系
    第四节 句法语义范畴体系中的指称结构框架
        一、指称结核范畴体系
        二、结核/修饰范畴体系
        三、修饰范畴体系
    第五节 句法语义范畴体系中的其他句法范畴
        一、独语范畴
        二、情态范畴和语气范畴
        三、关联范畴
    第六节 句法语义范畴标注集
第六章 句法语义分析技术研究
    第一节 句法语义分析技术研究现状
    第二节 句法语义分析的常用理论分析
        一、格语法
        二、框架语义学
        三、概念依存理论
        四、依存语法理论
    第三节 句法语义分析的常用方法比较
第七章 句法语义范畴自动标注研究
    第一节 理论依据及标注任务
        一、系统开发的理论依据
        二、标注任务描述
    第二节 标注方案及标注体系
        一、标注任务方案
        二、句法语义范畴体系标记及含义
    第三节 相关语义知识库的构建
        一、语义词类与句法语义范畴对应关系知识库
        二、语义句型框架库的构建
        三、语义句模知识库的构建
    第四节 基于语义句型框架的语义角色标注研究
        一、语义角色的标注策略
        二、结核的确定
        三、条件随机场(CRF)简介
        四、特征描叙和特征选择
    第五节 测试及结果分析
        一、实验语料来源
        二、评价方法
        三、实验结果及分析
        四、句法语义范畴辅助标注工具功能介绍
结论
参考文献
附录
    一、现代汉语语义词类标注系统规范(部分)
    二、句法语义范畴标注规范(部分)

(6)知网机器翻译系统的分析与知识库扩展(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 机器翻译研究现状
    1.3 语义在机器翻译中的应用
    1.4 课题的提出
    1.5 本文组织结构
第2章 知网机器翻译系统概述
    2.1 知网知识库
    2.2 词处理器
    2.3 知网消歧
        2.3.1 推理机
        2.3.2 意义群落测定器
    2.4 知网翻译器
    2.5 本章小结
第3章 知网机器翻译系统的分析
    3.1 测试语料选取
    3.2 实验分析
        3.2.1 知网机器翻译系统的优势
        3.2.2 知网机器翻译系统中存在的问题
    3.3 本章小结
第4章 知网机器翻译系统的知网知识库扩展
    4.1 相关技术研究
    4.2 知识库的构建方法
        4.2.1 中心词获取
        4.2.2 中心词词义消歧
        4.2.3 术语DEF生成算法
    4.3 实验与分析
        4.3.1 实验语料
        4.3.2 实验及结果分析
        4.3.3 知网机器翻译结果分析
    4.4 术语知识库自动构建系统
    4.5 本章小结
第5章 知网机器翻译系统的翻译规则库扩展
    5.1 翻译规则库
    5.2 规则模板
    5.3 知网翻译规则动态调试系统
        5.3.1 监控列表
        5.3.2 翻译追踪
        5.3.3 规则生成
    5.4 本章小结
结论
参考文献
致谢
攻读硕士期间发表(含录用)的学术论文

(7)双语信息处理方法及原理(论文提纲范文)

0 引言
1 双语信息处理方法
    1.1 从汉英翻译和英汉翻译的困难发现问题
    1.2 从跨学科、跨领域和跨行业的角度分析问题
        (1)微、中、宏,融汇贯通的方略
        (2)采用双重形式化进路来协同处理“三跨”术语(见图3)
    1.3 从人机分工与合作的角度解决问题
2 结果:信息处理模型与信息基本定律的关系
3 结语

(8)面向俄文信息处理的机器翻译实验研究(论文提纲范文)

中文摘要
ABSTRACT
АВТОРЕФЕРАТ
目录
绪论
    0.1 论文的选题动机与现实性
    0.2 论文的研究对象
    0.3 论文的研究任务与目的
    0.4 论文的研究方法
    0.5 论文的新意
    0.6 论文的理论意义和实践价值
    0.7 论文的语料来源
第一章 世界科学计算机化语境下的机器翻译研究概述
    1.0 世界科学计算机化的时代背景*
    1.1 翻译与机器翻译
    1.2 机器翻译的历史与现状
    1.3 机器翻译的基本问题
第二章 苏俄机器翻译系统解析
    2.1 前苏联机器翻译思想评介*
    2.2 《意思?文本》模型理论述要*
    2.3 ETAP 机器翻译系统解析*
    2.4 成语机器翻译系统RETRANS/VISTA 解析
    2.5 认知科学制导的机器翻译研究—ЛИНГТОН系统解析
第三章 机器翻译系统评价
    3.1 关于机器翻译评价
    3.2 机译系统在线资源评介
    3.3 俄汉机译系统评价
第四章 俄汉军用文书机器辅助翻译系统的设计与实现
    4.1 俄语军用文书的语言特点
    4.2 基于翻译记忆的计算机辅助翻译*
    4.3 机器词典的构建
    4.4 系统的设计原则与实现技术
结论
    一、主要成果总结
    二、尚待解决的问题
参考文献
附录1
附录2
后记

(10)基于统计的汉英机器翻译技术的研究(论文提纲范文)

图目录
表目录
摘要
ABSTRACT
第一章 绪论
    §1.1 机器翻译的发展历史
    §1.2 国内外的机器翻译研究
    §1.3 基于规则的机器翻译方法
    §1.4 统计机器翻译
        1.4.1 当前统计机器翻译的研究概况
        1.4.2 统计机器翻译的优点和不足
    §1.5 本文的主要工作和贡献
    §1.6 本文的组织结构
第二章 统计机器翻译方法研究现状
    §2.1 基于信源信道思想的统计机器翻译方法
        2.1.1 IBM的统计机器翻译方法
        2.1.2 CMU(卡内基梅隆大学)的工作
        2.1.3 约翰·霍普金斯大学(JHU)的统计机器翻译夏季研讨班
        2.1.4 Yamada和Knight的工作——基于句法的统计翻译模型
        2.1.5 Och等人的工作
    §2.2 基于最大熵思想的统计机器翻译方法
        2.2.1 直接的最大熵模型
    §2.3 构造统计机器翻译系统的主要任务
    §2.4 本章总结
第三章 基于IBM对齐模型的汉英统计机器翻译
    §3.1 引言
    §3.2 统计机器翻译开发过程
        3.2.1 对语料进行预处理
    §3.3 基于统计的汉英机器翻译系统架构
        3.3.1 IBM对齐模型和模型4
    §3.4 构建翻译模型
        3.4.1 构建翻译模型的原理
        3.4.2 构建汉英翻译模型及其改进
    §3.5 构建语言模型
    §3.6 本章总结
第四章 基于IBM对齐模型的搜索算法的设计与实现
    §4.1 基于动态规划的beam搜索算法的研究与实现
        4.1.1 Held and Karp处理货郎担问题的算法
        4.1.2 统计机器翻译中的基于动态规划的beam搜索算法
        4.1.3 beam搜索的剪枝技术
    §4.2 A*搜索算法在汉英统计机器翻译中的实现与改进
        4.2.1 搜索图的构建
        4.2.2 对结点评分
        4.2.3 基于启发式函数的A*搜索算法及改进
    §4.3 实验及分析
        4.3.1 Beam搜索算法和A*搜索算法翻译结果的对比
        4.3.2 汉语词的候选英语单词范围的影响
        4.3.3 设定A*搜索算法中假设队列长度
        4.3.4 A*搜索算法在汉英统计机器翻译中的启发策略
    §4.4 本章小结
第五章 基于短语对齐模型的汉英统计机器翻译
    §5.1 单词对齐模型的缺陷分析
    §5.2 采用短语对齐模型对单词对齐模型进行改进
    §5.3 提高训练语料单词对齐的准确率
        5.3.1 采用Viterbi对齐优化单词对齐
        5.3.2 采用ISA进行单词对齐和短语抽取
        5.3.3 Viterbi对齐和ISA方法相结合
    §5.4 使用词性标注信息构建对齐模板
        5.4.1 抽取模板和短语
    §5.5 翻译过程的实现
        5.5.1 设计对齐模板参数
    §5.6 实验及分析
    §5.7 本章总结
结束语
致谢
作者在攻读硕士学位期间发表的论文
参考文献

四、ICENT汉英机译系统中的语义模型(论文参考文献)

  • [1]三维转换视阈下汉英机器翻译译后编辑实践与研究[D]. 王玉帛. 中国石油大学(北京), 2020
  • [2]中华典籍机器译文可接受性的调查研究 ——以《论语》为例[D]. 刘雨婷. 华南理工大学, 2019(02)
  • [3]系统功能语言学视域下政治语篇中名词化翻译策略研究[D]. 唐革亮. 东北师范大学, 2018(12)
  • [4]八十老翁 平生无悔[J]. 冯志伟. 文化学刊, 2018(03)
  • [5]现代汉语深度语义标注语料库研究[D]. 贺胜. 南京师范大学, 2017(06)
  • [6]知网机器翻译系统的分析与知识库扩展[D]. 王琳. 沈阳航空航天大学, 2017(08)
  • [7]双语信息处理方法及原理[J]. 邹晓辉,邹顺鹏. 计算机应用与软件, 2015(11)
  • [8]面向俄文信息处理的机器翻译实验研究[D]. 武斌. 中国人民解放军外国语学院, 2007(04)
  • [9]汉英机器翻译及其在科技文摘要翻译中的误例研究与分析[J]. 肖薇. 文教资料, 2007(02)
  • [10]基于统计的汉英机器翻译技术的研究[D]. 魏瑾. 国防科学技术大学, 2006(08)

标签:;  ;  ;  ;  ;  

ICENT汉英机器翻译系统中的语义模型
下载Doc文档

猜你喜欢