【百道编按】电子书的出现使得市场上充斥着各种各样的内容,这是前所未有的景象。想要打破“内容之墙”,把更多合适的作品推荐给读者,这是新时代出版人的愿望。Trajectory的算法为解决图书发现性的问题提供了一种新思路。
关键词情感分析——波士顿Trajectory“自然语言处理”(NLP)系统的一部分,正被用于应对饱和市场中图书“可发现性”的挑战。
什么是图书“可发现性”呢?
有两个关键性因素:
正如许多人指出的那样,“可发现性”对于常常读书的人们而言,并不是一个问题。在他们的桌边、在他们的Kindle里,读者们拥有足够多的书,足够他们读好几辈子的时间了。电子书的出现使得市场上充斥着各种各样的内容,这是前所未有的景象,这意味着,即使现在所有的人都停止写作和出版,人们也永远不会缺乏优秀的阅读材料。
但图书出版人想要让图书打破内容之墙(包括数字游戏、视频、电视、电影,等等),进而让图书接触到更多的消费者。对他们而言,“可发现性”就成为一种必需。尽管作者群体的规模迅速增大,但读者人数却没有快速增加,甚至可能变得更少了,他们的注意力一直在被各种各样的东西所吸引——电子娱乐让他们无法离开智能手机,不是吗?正如佩恩所言,想要吸引读者,就必须向他们展示某些和他们的兴趣爱好相近的东西——从而帮助他们找到/发现符合自己的品味和兴趣的书籍。
在零售业,亚马逊一直为人所称道。Netflix的算法是根据类似电影评分的机制进行推荐,而亚马逊则不同,后者展现在客户面前的产品——图书或其他类别——已经把销售算法做到了极致 。我们并不是对这种方法表示不敬。 与购物篮里的东西进行比较,就会发现西雅图(亚马逊总部)的算法华而不实。
但这些都是销售算法。Trajectory所做的事与这些给人留下深刻印象的神奇代码是不一样的。
Trajectory的算法是混乱的文本,是图书的实物产品,是满足读者梦想的材料。根据这个文本中的材料,波士顿总部分析出一本书的“情绪”、“强度”和“复杂度”。
下面的图展示了部分“向量”——如果你愿意,可以将之看作叙事元素,这些“向量”进入书本之中,然后通过Trajectory的“自然语言处理”(NLP)作为电脑智能输出。在那些机器里发生的过程当然远不及由标准构成的泡沫那般丰富,但我们可以把它当作一种对图书进行比较的潜在方式,这样,就能看到在作品和作品之间能够存在多少联系,从而帮助读者发现适合自己的好书。
直到现在,“可发现性”的负担仍然落在销售数据之上。
与之相对应,Trajectory通过与“零售点”——在线零售商和经销商——进行沟通展开工作,主要有两个方面内容:
在Trajectory数据库里添加新书,这样就有更多的文献可以用来做对比;
让科技用户成为新的零售点,因此在他们对读者的推荐中——这些推荐的信息都来自Trajectory不断深化的数据库——会包含更多关于图书和他们自身的内容,而较少谈到销售数据。
但正如布莱恩特那般偏执,他和他能力出众的内容总监斯科特·比蒂都说,他们坚信自己正身处一个新篇章的初始阶段,这个篇章的主题是我们如何才能对市场上的图书进行解读和排序。
尽管Trajctory并没有一个有关翻译的元件(好的翻译是无法依靠电脑完成的,它本身就是一门艺术),但它和亚马逊中国以及京东都有试验和合作项目,以寻找中国读者的兴趣所在。Trajcotry同样也和西班牙的分销商有所合作。
在这样的努力之下,经过Trajectory系统分析的英文图书就可以通过简体中文进行搜索。布莱恩特注意到,这种直译的做法可以双向进行——许多中国出版商也希望英语读者能够搜索到他们的图书。
这是一个好例子吗?当然是:现在来看一下目前正在运营的主要的订阅服务——例如Scribd和Oyster将会在纽约的DBW,而亚马逊的代表也会如此,亚马逊向用户提供无限的Kindle订阅服务。
对于所有订阅服务而言,其核心利益都在于把读者的注意力引向知名度不那么高的作品,对吧?——帮助读者在众多作品中发现他们可能感兴趣却从未听闻的图书。
现在,我们假设——这个例子只是我的随意编造,并非来自Trajctory的工作人员——奈维尔·休特的作品在订阅服务中的销售/借阅数据并不那么高。你知道休特吗?休特,英国人(1899-1960),非常高产的作家。Viking International曾经再版发行过休特的作品,取得了很好的反响。读者可能知道他的《在海滩上》(On the Beach),讲述了核爆炸以后应对放射云的故事。
如果用Trajectory的系统对由Viking再版的休特作品进行分析,那么喜欢赫尔曼·黑塞《悉达多》的读者,就会在推荐中看到休特的《拐弯》(Round the Bend),因为波士顿Trajctory的算法会基于东方传统,把两本书中独特的情节元素和神秘概念进行比较。
这类过程对于订阅服务及其读者而言极为重要,它为读者带来适合的作品,有助于开拓和展现一个更大的作品选择范围。现在的技术能够真正进入作品的脉络然后将其进行比较,而情况正如佩恩所言,在没有前者的帮助下,人们将如何能够发现“同类的作品”?
(本文编辑 晨瑾)
发表评论前,请先[点此登录]