您的位置:首页 > 业界动态

我查了下机器翻译专利的申请量,于是有了些思考

发布时间:2018-10-02 22:41:02  来源:智能家电网    采编:徐彬  背景:

  近日,机器翻译受到格外关注,很多关心中译语通的朋友纷纷问询机器翻译的未来到底会是什么样子?一时间被问得也觉得需要好好思考下。于是默默地、很是认真地梳理了2015年以来中译语通在机器翻译及其核心组件语料库方向申请受理的专利情况,也想借以认真判断一下和国内巨头们的差距到底有多大。

我查了下机器翻译专利的申请量,于是有了些思考162.jpg

  为了比较准确的分析自家研发水平到底咋样,所以还是比较认真的设定了一些标准。比如,近年来机器翻译发展尤为迅速,特别是2016年神经网络算法的出现使得机器翻译技术有了突破性发展,所以选取了时间区间2015年至今,在专利分类中G06F17(特定功能的数字计算设备或数据处理设备或数据处理方法)进行比对。此外,在专利检索引擎我们使用了我们自家的JoveEye科技大数据平台(www.joveeye.com)和合享Incopat专利检索系统(www.incopat.com)交叉验证,避免俺们自家的系统搞区别对待。

  首先,为了避免遗漏,我使用最宽的条件进行检索,将“翻译”作为关键词在专利分类计算机领域进行检索,得到申请专利数量排名前10的公司列表如下:

我查了下机器翻译专利的申请量,于是有了些思考487.jpg

  然后我们再将“机器翻译”、“文本翻译”作为关键词进行检索,相关专利申请数量排名前五的公司如下:

我查了下机器翻译专利的申请量,于是有了些思考538.jpg

  还是为了避免遗漏,我们又将“语音翻译”、“图片翻译”、“图像翻译”、“视频翻译”、“字幕翻译”、“辅助翻译”、“翻译系统”、“文件翻译”、“网页翻译”作为关键词进行检索,相关专利申请数量排名前五的公司如下:

我查了下机器翻译专利的申请量,于是有了些思考644.jpg

  然后,我把“机器翻译”、“文本翻译”、“语音翻译”、“图片翻译”、“图像翻译”、“视频翻译”一起合并作为关键词检索分析,专利申请数量排名前五的公司如下:

我查了下机器翻译专利的申请量,于是有了些思考723.jpg

  至此,在机器翻译领域国内的大体情况已大概能知晓。但为了更加的严谨,我对这五家公司的专利类型做了些分析。因为在搜索过程中,我发现有些专利是指的机器翻译应用装置等相关的申请。所以,想看看真正机器翻译核心技术研发的专利情况如何。

我查了下机器翻译专利的申请量,于是有了些思考836.jpg
我查了下机器翻译专利的申请量,于是有了些思考838.jpg
我查了下机器翻译专利的申请量,于是有了些思考840.jpg
我查了下机器翻译专利的申请量,于是有了些思考842.jpg
我查了下机器翻译专利的申请量,于是有了些思考843.jpg

  考虑到搜狗和网易有道在业内的知名度,我也对他们的相关专利进行了了解,按照我第一步最宽的条件以“翻译”为关键词进行检索,结果是搜狗拥有18个,网易有道有5个。

我查了下机器翻译专利的申请量,于是有了些思考924.jpg

  在最开始我提到过,神经网络算法从2016年开始推动了机器翻译技术的发展,各家也当然会加强此算法的专利研究。我特别看了一下从2015年到2018年的情况,百度拥有8个、中译语通拥有7个、腾讯拥有2个、科大讯飞拥有2个,而且大部分发力阶段都从2017年开始。

  如果要全面分析机器翻译技术的发展,光在国内肯定是不够的。我又继续以机器翻译、文本翻译为关键词对于国外专利情况进行了检索和分析,排名前五的公司不出意外的依然是耳熟能详的国际大品牌:

我查了下机器翻译专利的申请量,于是有了些思考1144.jpg

  详细的专利列表清单如下:

我查了下机器翻译专利的申请量,于是有了些思考1158.jpg
我查了下机器翻译专利的申请量,于是有了些思考1159.jpg
我查了下机器翻译专利的申请量,于是有了些思考1161.jpg
我查了下机器翻译专利的申请量,于是有了些思考1163.jpg
我查了下机器翻译专利的申请量,于是有了些思考1165.jpg
我查了下机器翻译专利的申请量,于是有了些思考1167.jpg
我查了下机器翻译专利的申请量,于是有了些思考1168.jpg
我查了下机器翻译专利的申请量,于是有了些思考1170.jpg

  总算花了些时间,基本上从国内和国际两个范围,从大范围到小范围,分析了机器翻译领域相关专利的分布情况。基于此,几点思考与大家探讨:

  1、机器翻译最大的意义是扩大了人类认知信息的广度与深度;

  2、#新摩尔定律#“每18个月全球新增信息量是计算机有史以来全部信息量的总和”。某种意义上,今天99%以上机器翻译处理的信息,都是此前人类力所不能及的;

  3、高质量的机器翻译引擎,其单位时间内翻译的速度与质量可能都是人类无法企及的;

  4、所谓替代人类,孰优孰劣,要有比较对象和对比标准;高质量引擎,不考虑消耗的时间,仅评比翻译质量,如若还是垂直领域的,那么机器翻译超过90%以上的人类完全可能。太多的替代与不可替代的讨论,设定条件根本就不在同一个场景,如同鸡同鸭讲;

  5、不相信机器翻译,是因为没见到过更好的,但并不代表不存在,如同今天的特斯拉无人生产车间,阿里京东全自动化的包裹物流,已经可以无人工作。其实只是你没见过而已;

  6、有人问“人机耦合”是机器翻译发展的未来吗?对这个问题我做了认真思考。个人认为“人机耦合”辅助同声传译,在会议口译实践中是个伪命题。与其人机耦合不如纯机器翻译质量提高来得更靠谱。同声传译工作过程中,听说时差(EVS,Ear Voice Span)一般为2-3秒钟。同传译员耳机一侧盖住耳朵听发言人声音,另一侧耳机是不盖住耳朵,目的是要听到自己讲话的声音,以控制译员自身语音语调和语速。(我们自己带耳机唱歌的时候会有感受,听不到自己的声音跑调太正常了。)因此译员需要多任务的精力分配,听懂,翻译,重要数字记笔记,发言人表情,会议现场情况等等。在当前人类大脑多任务处理能力现状,人机耦合的概念提出显然是非专业人士的一厢情愿,显得格外格外的牵强。

  声明:本文仅为传递更多网络信息,不代表智能家电网观点和意见,仅供参考了解,更不能作为投资使用依据。


返回网站首页 本文来源:智能家电网

本文评论
老板电器亮相北京室内装饰和设计博览会 联合居然之家举办战略发布会
9月27日,北京室内装饰和设计博览会暨智能云栖生活节(原
日期:10-02
春节进入倒计时,送孩子什么礼物好?这里几个很合适
每年一到春节,家长就头疼,不知要给孩子啥礼物好?实际上
日期:01-24
华米科技发布智能芯黄山1号 很吓人的技术都有哪些
近期,华米科技2018年度新品发布会的召开,正式发布可穿戴
日期:10-02
库克尴尬!继“信号门”、“美颜门”之后,iPhone XS又陷“信号门”
2018年苹果推出的三款新iPhone可以说是今年下半年最为
日期:10-02
RW夺冠之路最强装备 魔霸2澎湃战力成就英雄
LOL洲际赛LPL冠军完美收官,RW战队力挽狂澜勇夺桂冠。RW
日期:10-02
更加适合低龄儿童的米兔智能积木--小米全新烧脑玩具
今天小米正式推出米兔智能积木,售价199元。相比之前推
日期:02-26
TrustData年度盘点:每日优鲜驱动生鲜电商整体翻倍增长
国内知名大数据机构TrustData近日公布2017年移动互联
日期:10-02
玩了一波“快闪” “共享女友”暂停运营
还记得我们前两天报道的“共享女友”么?9月14日他趣宣
日期:02-26
科技公益新玩法:一点资讯让碎片化阅读时间更有价值
打开手机刷刷资讯就可以做公益,你是否愿意参与? 4月23
日期:10-02
母亲节献礼指南,腾讯手机管家贴心守护你的她
明天就是母亲节了,有的人会选择回家陪妈妈过节,而远在外
日期:10-02
智能情趣—科技与浪漫的联姻
上天似乎格外眷顾巴黎这座城,弥漫的浪漫气息“毒害”了
日期:02-26
360手机卫士:80万勒索软件伪装传播 “免流”背后是陷阱
随着2018年《政府工作报告》取消流量“漫游费&rd
日期:10-02