-
答案 1:
现在的机器翻译技术, 包括百度翻译, 底层都是依赖于"对齐语料"对齐语料的最典型的例子就是: 罗塞塔石碑zh.wikipedia.org/wiki...baike.baidu.com/view...同样的内容, 用不同的语言的表述出来(比如石碑中的希腊文和古埃及文)这样机器就可以得到相同意思不同语言的句子, 这些内容平行的句子对, 就是对齐语料. 是机器翻译技术的数据基础. 通常的对齐语料来源, 都是比较正式的资源. 比如联合国文件, 会以多种语言发布; 新闻翻译也是高质量的数据来源.这类语料的特点就是准确, 都经过校对等过程保证对齐语料的质量. 缺点是这类语料都是标准书面语, 覆盖不到口语表达; 同时语言覆盖的范围都很小, 很多日常表达无法覆盖其中.百度这次的对齐语料, 来自于搜索引擎覆盖的互联网资源. 互联网的特点是覆盖范围广, 兼顾书面,口语, 习语等. 但缺点也比较明显, 就是语料的质量很难保证. chinadaily.com.cn/hqcj...从新闻稿里可以了解到百度翻译团队, 首要技术难点就是在语料过滤上, 将错误的对齐语料识别出来并丢弃掉. 受益于互联网语料的丰富性, 目前的百度翻译在网络流行语等非书面语上, 表现的较好. 但同时也受制于语料的准确性, 在一些中文表达比较多样的, 尤其是口语表达, 比如种属关系, 肯定句和否定句, 爱恨等反义表达上, 翻译效果还需要提高. -
答案 2:
目前的机器翻译都是基于机器学习的模式做的,中译英的效果从目前来看,各家的质量都还很烂,包括google,离人工翻译的准确度还差得非常远。机器翻译目前也不是给那些懂一些英语人用的,因为机器翻译出来的东西有可能比一般人翻译出来的还不靠谱。当前的机器翻译是给那些完全不懂英文,或者法文(中译法)的人用的,它能让你从完全不懂,变成了解一点点,然后大概猜出来是什么意思,完成从0到1的跨越,从1到100的完善工作,目前还做不了,技术所限。所以如果按照翻译准确度来评价现在所有的机器翻译引擎,可以基本上认为它们都还是一坨屎,完全不能用。但是对于零基础的外语种类来说,机器翻译做的这点事情还是有重要的意义的,而这样的场景的确是存在的,例如国内的中小企业老板做对外贸易的时候,就能通过它大概了解一些行业的状态和基本情况,当然签合同靠它就不靠谱了。所以这就是现在的在线翻译产品存在的价值,至于它不能理解not,不能正确的翻译出来英文的意思,这也没办法,它现在就是这么弱,暂时也只能做到这个地步。 -
答案 3:
试试在百度翻译“google比百度好多了”,你就明白了。 -
答案 4:
打开 Google Translation中翻日:”啪啪啪“。我也不知道这是为什么。 -
答案 5:
1.有些标题党,这和指鹿为马扯不上关系,至少和某些监狱的各种离奇死法相比,还差很远。2.如LS所说,国外对这些看得比较淡,还记得之前黄健翔的一篇博客里揭露的,往往是我们自己的相关人员比国外的外交官更加敏感。这从一个角度也说明,我们在这个环境生活久了,很容易养成自我阉割的特点。3.最后说下百度的在线翻译,LZ举的这个例子比较典型,具体原因不太好说,期待专业人士解读。但是不得不承认的是,百度在一些国内流行语上的翻译还是做的不错的,之前微博上也有一些图片。 -
答案 6:
我很包容。 -
答案 7:
楼主是想搞文字狱吗? -
答案 8:
日本的外交部门G点不至于那么敏感.不论google还是百度的翻译,都是机器干的,大众在网上越是聊得多,它们翻译出来的结果就越接近大众聊的.尤其是恶意用户提交的数据对结果影响很大.不过如果有足够长的时间让机器去学习,翻译结果最终还是会修正这些问题的.
大家怎么看待百度在线翻译指鹿为马的行为?
2012-01-19 20:10:10 来源: 点击:
相关热词搜索:
上一篇:如何解决淘宝、拍拍等卖家恶意刷信誉的行为?
下一篇:有谁在梦里体验过自由落体的感觉?