AIpatent: 一款集「专利机器翻译和专利词典」的综合服务平台

近日,南京深思得科技有限责任公司联合上海语智科技有限责任公司发布了专利跨语言综合服务平台“AIpatent”,并先期发布了专利机器翻译服务t.aipatent.com专利词典服务d.aipatent.com两个线上服务板块。据悉,AIpatent通过在线机器翻译、离线专利专用机器翻译引擎定制、专利专用词典、专业专利人工翻译等解决方案,消除专利从业人员在调查、检索、翻译国外专利时经常遇到的语言障碍。

t.aipatent.com 专利专用机器翻译界面

d.aipatent.com 专利专用检索词典界面

据了解,AIpatent上述两项服务的研发人员中的张方元,他曾于2007年至2012年就职于永新事务所的日本部,在涉外专利方面,有很多的经历和经验。据他介绍,在涉外专利方面,行业人员经常会遇到3个问题:

1、虽然涉外所的翻译业务收入所占比重能占到4成甚至更多,但是翻译人员大部分时间浪费在打字的重复性、低水平的劳作上。

近几年,有的涉外所引入了trados辅助翻译系统,提升了重复内容的应对效率,但是机器翻译这个终极解决方案却始终未能实现突破,市面上做引擎的有很多家,现在NMT算法公开,好像有了语料都能做引擎,但是大部分还是没有到能让翻译人从翻译的角色转变到思考(审校)的角色上来,大部分用户的感觉是:专利机器翻译,离实用化还差的远。

2、代理人遇到不会的语种的对比文件而不得不求助其他部门的语言人员或是代理人。

这样给双方工作都带来困扰,别人来问了,你不能不帮,因为将来你也会遇到语言问题要去请教对方;

3、审查员有时候引用对比文件,因为语言不通仅仅靠附图相似就给出不完全正确的审查意见。

 

据张方元介绍,为了将涉外专利工作人员,从语言的难题上解放出来,AIpatent团队,经过数年研究,推出两款专利常用工具,其分别为专利专用机器翻译服务t.aipatent.com和专利专用检索词典:d.aipatent.com

专利专用机器翻译服务 t.aipatent.com

专利机器翻译进入到神经网络时代以来,其可读性大大提高,但是在细节方面仍然需要不断地打磨。在专利领域,最近几年无论是WIPO还是欧专局,或是Google都推出了适用于专利的机器翻译服务,其中尤以Google的影响力最大,Google的机器翻译有时候异常精准,有时候断句又让人感到无厘头。算法没有太大差别的情况下,谁家打磨的更细,就意味着谁家会脱颖而出,从点滴细节做起,满足广大涉外所的语言需求,是AIpatent的使命。而在隐私性方面,有的事务所全体电脑断网,只为保证数据不泄露,定制引擎的服务需求也愈发旺盛。

张方元举了下面几个例子,说明具体产品的效果:图1至图6分别是日中、日英、英中、英日、中日、中英六个方向的权利要求的译文。

圈内人都知道权利要求的翻译是翻译时候最难的部分,那么AIpatent的机器翻译处理的如何?

图1 日中机器翻译结果

图2 日英机器翻译结果

图3 英中机器翻译结果

图4 英日机器翻译结果

图5 中日机器翻译结果

图6 中英机器翻译结果

此外,为了方便广大用户方便的修改译文以及下载译文,AIpatent创新性的在右侧增加了编辑框和下载按钮,如下图7、8所示。

图7 批量替换编辑框=可进行替换回退等操作

图8 至页面顶部、下载为tmx、excel、txt,copy、修改等快捷键一应俱全

专利专用检索词典 d.aipatent.com

在提到专利术语的痛点,张方元这样介绍,在涉外业务中,很多同行们会感同身受,有时候公司有了新客户,但需要抓紧时间确认这个客户的用词特点。有的事务所的做法是专门派人整理这个客户之前的同族,然后一篇篇去阅读,提炼出客户专属词典。有时候遇到新案件,碰到新词,首先要看别家是怎么确词的。一样要去翻别家的同族,查找相关的术语,费时费力。现在有了AIpatent的专利词典,人工做词典的事情,再也不需要了。

具体情况看下例子。

词典分为常规检索和高级检索,常规检索默认完全匹配模式,高级检索可以使用””+-等一般检索引擎的高级检索方式进行检索,比如可以同时限定公司名,IPC分类号等。

在常规检索中,如果用户检索词命中了专利词库,AIpatent专利词典会给出参考译词,并将其在专利句对库中的翻译数量按从多到少排列,给用户最直观的提示。譬如用户检索“雷达”这个词,AIpatent中英词典中日词典会有如下呈现,当然,这里的译词和传统词典有些不同,是在几千万句对库中进行分析和计算的,可以看到它在句对库中最常用的翻译。

图9

图10

而在高级检索中,用户可以设定一些条件进行检索,比如检索谷歌公司的关于“向量”的翻译,则可以如图11所示输入相关关键词,即可得到图12的结果,此外,点击公开号则可以直接链接到欧专局查看公开文档。

图11

图12

如果想查看其它公司的关于“向量”的翻译时,则得到如图13的结果。

再看下左侧公司名的排序,以及可以点击对应句对下方的公司名进行深入确认等。

图13

张方元还提到,AIpatent的机器翻译经过语智公司以及南京深思得研发团队近80人的全职团队,历经2年精细打磨。虽然现在已经迭代到V4.1,但仍然有不少补足,还在不断优化中。欢迎大家多多试用,多提反馈意见。具体试用网站为专利专用机器翻译服务t.aipatent.com)和专利专用检索词典d.aipatent.com)。

最后,张方元提到了 “AIpatent”系统的开发目标和未来规划:随着贸易战越来越激烈,“真”研发的重要性愈发凸显。古人说,知己知彼百战不殆,我们现在应该是知己的。AIpatent的理解,所谓知彼,对我们广大科研人员来说干掉语言壁垒是第一位,干掉复杂的检索逻辑,实现概念检索则是第二位。AIpatent是为了实现上述两个目标而生。计划三步走:1、提供专利多领域的高水平机器翻译服务,在此基础上实现跨语言检索;2、利用研发途中积累的大量经验,活用到相关概念挖掘中,实现概念检索;3、在1和2的基础上提供分领域专利数据定制服务,总结归纳国外某些特定领域的研发数据,提供类调查服务。