36氪记者: 王艺瑾 2018年12月7日
“人工译者一天翻译3000字到5000字就到头了,但把文章丢给机器,秒出。”
中国传统文化出海这件事,念叨了很多年,但一直收效不大。反而是中国的网络小说,在过去十年里,似乎不费吹灰之力就赢得了大批海外读者的追捧。《鬼吹灯》、《诛仙》、《锦衣夜行》和《将夜》在东南亚收揽了一大波忠实读者,《盗墓笔记》和《全职高手》也在欧美市场收获了良好口碑。
根据艾瑞咨询的《2017年中国网络文学出海白皮书》,目前海外英文网文用户约有700多万,但未来,东南亚、欧洲和美洲的英文网文的用户规模将增加至6亿左右。这无疑是一个极具潜力的市场。
但目前中国网络文学的翻译速度和质量还远不能满足这么多读者的需求,其主要原因在于网络文学版权界限模糊、翻译人员缺失、翻译效率低下和资金实力薄弱。为了解决翻译人员缺乏和效率低下的痛点,一些公司打算用人工智能做网文翻译。
36氪近日接触到的「推文科技」就是一个基于AI翻译的海外小说社区。该公司成立于2017年11月,今年7月研发了网络文学AI翻译系统,根据BLEU算法的评测对比,其文学翻译质量超过谷歌。AI机器翻译研发商「Atman」是推文科技的战略发起股东之一,为后者提供独家算法支持。
推文科技的CEO童铘说,中国的网络小说作家有800万,网络小说库存将近2000万部,但能出海的只有200到300部,剩下的都卡在“翻译”这个问题上。
虽然用AI翻译网文是一件新鲜事儿,但在网文的人工翻译领域,已经有不少玩家。拥有大量版权库的阅文集团在2017年5月上线了“起点国际”,Wuxiaworld(武侠世界)和Gravity Tales两家头部的海外中国网文翻译网站也早在2014年就已经成立。
谈及竞争优势,童铘告诉36氪,虽然这些网站具有先发优势,但他们都依靠人工翻译,而现在比较稳定的人工翻译只有近百人。与之相比,推文科技目前的AI机器能够全自动从全网监测、抓取、翻译和发布中文小说,无需经过人工审校流程,使行业效率提高3600倍(翻译1000字,人工需要1小时,AI需要1秒),成本降低到原来的1/100(翻译100万字,人工需要10万元,AI需要1000元)。
该公司称,其网文平台Babelchain在9月上线后,日均更新小说数量位居国内第二(仅次于起点国际),月活用户5万,连续两个月用户量实现100%增长率。
Babelchain网页
推文科技的COO赵嘉敏说:“人工译者一天翻译3000字到5000字就到头了,但把文章丢给机器,秒出。”赵嘉敏是译言网的联合创始人,也是凯文·凯利在中国的唯一出版人。他相信,未来必然是大规模的人机协同。
当然,即使AI技术确实能提高翻译速度和作品数量,但机器真的能保证小说翻译的文学性和艺术性吗?
针对这个问题,赵嘉敏说:“我做翻译做了这么多年,我很清楚人工智能今天到了一个什么样的水准。打个比方说,人类译者平均分是70分的话,今天人工智能的分数绝对不低于70分。”
目前,推文科技要求机器翻译做到流畅和准确,但下一步是解决古诗词翻译“信达雅”的问题,这需要聘请翻译专家来帮助训练机器。近日,该公司与西湖大学前沿技术研究所张岳教授团队签署了独家合作协议,在机器学习算法和自然语言识别领域开展联合研究。
谈及网文需求量大的原因,童铘表示,网络小说的成瘾性要比传统文学强很多,因为每一部网文通常都是200万字以上,娱乐性强,而且是一个长期更新连载的过程,在这个追更过程中,读者会自动形成社区贴吧进行讨论。
这种高粘度的阅读习惯,也使得付费阅读成为平台盈利的一种可能。目前,海外网文平台大多依靠广告、打赏和众筹作为主要收入来源,但Babelchain还处于积累用户的阶段,全网免费阅读。
推文科技目前最大的成本在于研发。他们目前的版权合作方是免费为其提供中文内容,后期二者会采取版权分成形式。
谈及此次创业是否在单纯追逐人工智能的风口,童铘说,与其说是追逐AI,不如说是一直等待AI技术成熟。此前,他在新华社《参考消息》担任新媒体中心主任时就发现,即使翻译团队里有100多个极其资深的翻译专家,也只能支撑报纸出版的需求,难以应对新媒体转型时对翻译作品数量的要求。直到2016年谷歌提出神经网络算法,机器翻译质量大幅提升,他才找到提高翻译效率的办法。
推文科技曾于今年8月获得数百万元人民币的天使轮融资,目前已开放Pre-A轮融资窗口,计划募集150万-200万美元,用于AI机器翻译发布网络升级、出海版权库建设、C端产品研发和优化、以及海外用户社区运营。该公司的最终目标,不只是让中国的网络小说出海,而是利用AI让好故事在全球跨语言传播。
0 条评论