专访北大计算机研究所副所长汤帜:探索区块链版权保护但不炒概念,数字出版产业已到成熟期

每经记者 张虹蕾/2018-04-02/ 分类:专访/阅读:
作为当代中国印刷业革命的先行者,计算机汉字激光照排技术创始人王选的“得意门生”,北京大学计算机科学技术研究所副所长汤帜已经在新闻出版应用技术领域征战已近30年。 ...

汤帜对《每日经济新闻》(以下简称NBD)记者表示,经过将近20年的探索,整个数字出版行业在技术上已经趋于成熟,而近两年发力的点则是文档处理和知识服务技术的升级。

北京大学计算机科学技术研究所副所长汤帜

每经记者 张虹蕾 北京摄影报道

作为当代中国印刷业革命的先行者,计算机汉字激光照排技术创始人王选的“得意门生”,北京大学计算机科学技术研究所(以下简称北大计算机研究所)副所长汤帜已经在新闻出版应用技术领域征战已近30年。

从跨进北大校门算起,今年已经是汤帜在北大学习和工作的第35个年头。自1987年师从王选教授攻读硕士研究生开始,汤帜就把全部的精力投入到软件的研究与开发。汤帜对于我国自有知识产权软件领域有两大贡献,分别为方正飞腾排版与方正阿帕比数字版权保护系统。

业界对于汤帜的美誉颇多,有人说汤帜率领的团队的努力带活了一个产业,把Adobe等强敌挡在国外。而在北京大学计算机科学技术研究所35周年之际,《每日经济新闻》记者专访汤帜,和他一起探讨中国数字出版产业近年来的变革之路。

汤帜对《每日经济新闻》(以下简称NBD)记者表示,经过将近20年的探索,整个数字出版行业在技术上已经趋于成熟,而近两年发力的点则是文档处理和知识服务技术的升级。

谈行业变革:2C赶超2B市场 深度内容待挖掘

NBD:行业起步的十多年来,我国数字出版产业产生了哪些变化?

汤帜:2000年初,国内互联网环境不够成熟,未形成个人支付习惯,数字出版基本没有2C市场,主要面向2B领域的机构服务。上述模式持续将近十几年,产业具备一定规模时,互联网风暴被掀起,网络文学也开始获取流量,近几年2C网络文学市场的用户量超过2B市场。

NBD:网络文学也催生内容付费潮流的发展,这对数字出版行业带来哪些变化?

汤帜:从技术角度看,网络文学以文字为主,一般基于网页浏览,对于文档处理技术要求较低。值得注意的是,虽然B2C市场看起来规模很大,但一些低俗猎奇文章充斥市场;相较于网络文学,内容有深度的专业电子书,特别是科技类电子书的B2C规模较小,这一市场销量大幅度提升还需时间。

NBD:对于上述市场现象,有解决途径吗?

汤帜:文档处理技术的升级或许是一个打开专业类市场的“突破口”。不同于网络文学的纯文字,专业类书籍则涵盖图表、公式,在处理复杂版式的过程中,需要用到“门槛高”技术。此外,要想解决上述市场现象,还需要产业界各方共同努力。

谈发展突破:结合新技术挖掘应用点

NBD:数字版权保护技术目前是否已经很成熟,还需要攻克哪些难题?

汤帜:经历将近20年的探索应用,数字版权保护技术已进入成熟期。但不可忽视的是,随着技术更新迭代,也要求研究机构作出相应思考,为现有的数字版权保护锦上添花。

比如,北大计算机研究所也会探索区块链在版权保护中应用,但目前究竟新技术能够产生怎样的化学反应尚不可预知。此外,作为研究机构,也不会关注热点概念“炒作”,而是去挖掘真正能够结合应用具体落地点。

从研究层面和技术层面来看,我希望能够用先进的技术带来更好的阅读体验;但从市场角度来讲,出版方也需要有动力驱动,技术推广程度和也和受众素质及整体行业环境相关。希望阿帕比这类公司能根据此前技术积累不断革新,引领行业发展。

NBD:您目前是研究者,此前也在企业作出相应指导,您认为一些数字出版的研究怎样才能更好落地?

汤帜:从2000年开始带领团队研究技术,就一直沿着研究、开发、应用一条龙的模式去思考,研究成果和企业应用基本能够达到无缝衔接。而现在出现的变化则是,市场上数字出版的公司越来越多,我们也用开放的心态面对市场,不会拘泥于方正或者阿帕比某几家公司,而是把合适的技术提供给更需要的企业。

例如,眼下化学公式的检索技术,在药物成分分析领域对于这一技术的需求十分迫切,就可以和相关单位达成合作和研究,在药物分子库的构建领域,提供分子式自动识别、检索等技术。

谈技术演进:促进版权保护 降低人工成本

NBD:阿帕比系统技术特点是什么?

汤帜:阿帕比技术是从2000年开始做的,彼时,中国的数字版权刚刚起步,模式也仅是网络电子图书的在线购买。阿帕比技术主要的技术特点包括两个,一个是数字版权保护技术实现了产业链各环节的保护;另一个是实现了版式和流式融合的CEBX文档技术,使一个文档既支持原版原式的阅读或打印,也支持在移动终端高质量地实时排版阅读。

阿帕比技术支持出版社、图书馆、电子运营商、读者等各个环节的版权保护技术,使得整个产业链条形成透明的交易环境,有利于出版社看到交易情况,定制相应机制,形成良性循环。

NBD:技术革新是否也会降低人工成本?

汤帜:是的,目前大家都在做移动数字阅读,移动阅读需要把PDF文件转换为其他流式阅读的格式,需要很多人工校对的工作。因此,我们研究版面分析与理解技术,使PDF转化为移动阅读格式时自动化程度更高,目前版面复杂的文档转化能够达到80%~90%准确度,未来希望结合人工智能等技术将转化准确率提升到99%以上。版面分析与理解技术还可以把表格、数学公式等复杂版面转换为结构化、语义化的信息。例如,针对上市公司年报的PDF文档,可以把其中的表格转换为Excel数据。


TAG:
阅读:
Copyright © 2018 火火财经 版权所有
二维码
意见反馈 二维码