文 章

小软件有大梦想:强技术驱动传统教辅行业向服务转型

作者:岳尚华   2015年09月17日   来源:百道网

(点击图片 进入论坛)

【百道编按】在数字化冲击下,内容生产仍然是出版产业的核心,也是竞争力所在,互联网潮流不可阻挡,出版业如果能利用好信息技术,前途将一片光明。阿凡题是一家致力于用技术驱动传统教辅行业从产品向服务转型的互联网企业,成立近两年,凭借其过硬的技术实力与多家教辅机构展开合作,逐渐拉开了用技术改变传统教辅行业的序幕,向着“协同教辅行业开拓更广阔市场”的承诺前进。


点击图片进入阿凡题专题页面

互联网让出版行业成为夕阳产业,这是很多人的共识,现在有一个更大的共识,在数字化冲击下,内容生产仍然是出版产业的核心,也是竞争力所在,互联网潮流不可阻挡,出版业如果能利用好信息技术,前途将一片光明。

阿凡题是一家致力于用技术驱动传统教辅行业从产品向服务转型的互联网企业,成立近两年,凭借其过硬的技术实力与多家教辅机构展开合作,逐渐拉开了用技术改变传统教辅行业的序幕,向着“协同教辅行业开拓更广阔市场”的承诺前进。不到两年的创业路,阿凡题是怎样做到技术领先的?一款答疑软件又是怎么驱动传统行业向服务转型的?我们采访了阿凡题在线答疑软件所属的北京云江科技有限公司创始人陈李江。

百道网:和同类答疑产品相比,阿凡题在哪些技术领域中实现了突破?技术突破带来了教育体验中哪些方面的变革?

陈李江:我们在答疑过程的三个环节——识别、运算、人工解答实现了突破。

首先是在识别范围上增加了对特殊字符和手写的识别。传统的识别技术仍是以汉王为代表的第一代识别技术,可以识别出汉字、英文、数字,但无法识别特殊字符,特殊字符识别被认为是世界难题。因为涉及公式和特殊符号的文字混排。

什么是混排?通常文字是一行一行的,传统的识别技术,可以很轻易地根据标准行间隔信息把文字按行切分出来,然后对每一行把字符切割出来,最后进行识别。但很多数学运算符号第一代识别技术无法识别,比如平方、分式、大括号等运算,传统识别模式只能把平方识别成数字“2”。阿凡题的技术突破了特殊字符的识别,尤其是公式识别。

识别手写字体。第一代技术是预先制定一套规则,然后按照规则进行字符匹配和识别,它具有一定经验性质,而且不同规则之间的适应性和匹配性较差。这种识别方式在印刷体中较为容易实现,因为印刷体比较规范,准确率较高。但是对手写体来说是不适用的,手写体中字符与字符之间的变化非常多,不易与设定的规则相匹配。阿凡题也突破了这项瓶颈。

第二项突破是人工智能运算。目前比较常见的拍照搜题只能识别出关键字,利用关键字在已有的题库中进行检索,严重依赖于题库的限制,而有些题目是无法穷尽的,所以搜题成功率并不理想。我们把人工智能的计算模块融入到产品里,当机器识别出字符之后判断题目的类型和考察方向,然后直接运算出答案。今年5月推出的“阿凡题-X”已经率先实现了纯公式数学运算。

第三项突破是优步式推荐算法,实现题目高效分配,提高整个问答环节的效率。对于人工解答来说,最重要的是分配效率。很多答疑工具除了机器解答也提供人工解答,但响应速度很慢,学生往往等半个小时甚至更久。

利用优步式推荐算法,我们的答疑工具能实现1秒反馈答案,5分钟人工解答率达到80%,零回复率极低,基本实现有问必答。

这些突破都体现在最新推出的“阿凡题-X”产品中。

百道网:据了解,阿凡题目前有六项软件著作权,四项技术方面的专利,还有一项技术已经申报国际专利。阿凡题创业还不到两年,是如何做到技术领先地位的?

陈李江:主要是因为我们的技术团队非常强大,同类的互联网技术公司,团队人数基本在200人左右,我们的团队只有不到50人,80%都是技术人员,其中博士占10%,硕士占40%,清华、北大、中科院的毕业生超过50%。

互联网领域拼的不是人力,而是技术,一个好的技术人员能抵得上一个三五人的团队。虽然我们技术团队的人不多,但每一个人都是高技术人才,在他各自的领域里都有比较深厚的技术积累,所以能在短时间做得又专又精。比如我自己主要研究方向是第二代云计算,所以在大数据分析以及推荐算法的设计上有技术积累。

百道网:据了解很多传统企业都有技术外包的需求,阿凡题拥有这么强的技术为什么不做外包?

陈李江:互联网产品的重点是后期运营,一款好的产品需要持续连贯的挖掘用户需求,然后进行功能上的打磨。

第一款阿凡题产品推出后,我们不断根据用户需求钻研新技术,增加产品功能。我们最早了解到的用户需求是很快得到答案,至于答案是机器给的还是老师给的,并不敏感。所以我们一开始的产品形态是机器加人工,既要保证在机器搜索上有较高的识别率,又要保证在人工匹配上有较快的响应速度。

在阿凡题APP中,我们发现学生和老师之间有一定的社交需求,学生希望和老师建立进一步的关系,定向找老师解答问题。所以我们迅速推出定向提问以及互相关注的轻社交功能。再后来,学生希望和老师有更深入的交流,于是在人工问答的基础上,我们又迅速增加了微信式语音功能,方便学生和老师之间实时交流。

同类的学习工具常被诟病是“抄作业”工具,我们不希望阿凡题仅仅是提供答案,而是提供一款有助于提高学习的学习神器。所以在答案的呈现上,我们先对题目的答案进行结构识别,再进行分布演示,帮助学生了解详细的解题过程。

技术对于产品的影响是维护用户之间的各种交互行为,提高用户体验度,用户体验度又反过来影响产品的使用情况。比如,定向提问和互粉功能推出后,30%的学生在机器搜索到答案之后进一步和老师交流,平均一个老师80-100个粉丝,其中粉丝最多的达到3500个,拥有粉丝数量多的老师逐渐演变成运营粉丝团,只回答粉丝的问题。

最新产品阿凡题-X实现了人工智能答题和手写识别,大大提高了答题率,自从推出后,我们的搜索量和提问量增长了近50%,学生在线上的平均停留时间达到每天15分钟。

外包实际上是做成一款产品就完成任务了,没有后续的跟踪打磨。这就是为什么买来的产品,始终无法留住用户,最后变成“僵尸应用”。

我们的团队不大,精力有限,所以我们希望打造一款自己的产品,在行业的某个领域做到最好。这不是简单的技术升级,更多的是想通过这个产品,以技术驱动传统行业从产品向服务转型。做外包与我们的理念相悖。

百道网:一款答疑软件怎么驱动传统行业向服务转型?

陈李江:其实阿凡题的初衷是做教育大数据。数据可以提高行业效率,大家都很期待大数据在教育领域的应用。但在做大数据的过程中我们发现,大数据挖掘和大数据分析完全不成问题,真正的问题是没有数据。

这是因为,首先数据源一直以来都存放在公立学校里,不对外开放。其次是受限于学校的信息化程度,采集到的数据非常有限,仅仅记录了考试成绩。

什么是教育数据?考试成绩仅仅是数据的表象之一。一个学生的所有学习信息都是数据,包括知识结构、学习习惯、各科目学习情况、能力特长等等,它们才是影响学生成绩的基础因素。

数据源问题一直没有得到解决。正所谓“巧妇难为无米之炊”,没有数据怎么做大数据?所以我们调整方向,先解决数据采集和收集问题,再做教育大数据。阿凡题答疑工具就是我们收集数据的载体。

我们通过图象识别、模式识别、图象的处理技术采集数据,然后通过数据算法、数据分析等技术获得数据源,在此基础上进行数据算法和分析。算法是基于数据的,但不一定需要大数据。我们现在考虑的是基于有限的样本,进行更精准的算法。

当我们在答疑的过程中积累了足够多的问答数据,就能对学生做更加精准的描述,把学生信息反馈给老师或需要的机构,有助于实现真正的因材施教。但这需要一定的时间才能实现,因为数据的积累需要时间,现在才刚刚开始。

互联网技术与传统出版行业的结合,不仅可以加速传统行业在技术方面的升级,也加速了服务模式的换代。

从教辅来看,教辅1.0以纸质书为载体,教辅2.0以电子化的书包为载体,教辅3.0是以移动互联网为载体的数字化。阿凡题所做的就是实现教辅3.0。

同类答疑产品的定位是工具型,只是单纯的拍照搜题,而我们的产品定位是提供解决方案,解决学生不会做的问题,不仅仅是提供答案。两者之间有本质的不同。

百道网:传统教辅行业在其中扮演什么角色?

陈李江:传统教辅行业在其中起着不可或缺的作用。如果把在线教育产品比作一辆汽车,我们提供了驱动装置,而汽车的其他配置甚至行驶方向都是由传统行业决定的。

比如针对学校的题库类组题、试卷的评测类产品,需要用到模式识别、图象处理、算法设计等技术,但这些产品的成功,更多取决于市场,取决于有没有渠道把它们卖到学校去。我们是一家B2C的企业,没有精力开拓2B的领域,但教辅行业在2B领域有比较好的基础,双方完全可以共同打造一款产品,我们提供核心技术,依托他们的市场资源进行推广。

一款好的教育产品,其核心是内容与技术的结合。传统教辅企业有技术需求,而阿凡题专注在技术领域,我们的模式识别、图象处理、推荐算法、语音交互等等,这些技术如果应用在其他领域都是上百亿的价值。我们希望和有教育认知,懂用户需求,有优质产品的企业合作,把我们的技术和他们的内容、渠道或者市场资源结合在一起,扩大应用领域,开发出更多的产品。

目前我们已经把拍照搜题的软件接口开放给了很多教辅行业的合作伙伴,有大的教育机构,有教辅机构,还有官方主导的教学平台。通过合作实现互利共赢。

(本文编辑 逐日)

作者:岳尚华

来源:百道网

(点击图片 进入论坛)

加编辑群提问

百道网

百道网

百道网

百道网

点击图片 查看详情

相关文章

发表评论前,请先