1467 万——这是周一移动教育应用猿题库公布的用户数。这意味着在教育部统计的 7200 万初高中生中,每 5 个学生就有一个在使用猿题库学习。
这个过程用了不到 2 年。
这让我想起 2013 年 11 月猿题库 CEO 李勇跟我分享的另一个数据——94%——这是用户通过移动端访问猿题库的比率。李勇说他当时看到这个数据时「很意外」。因为在此之前,无论是产品推出前的调研,还是来自行业里或行业外的各种建议,都显示当下并非进入中小学教育市场的好时机,其中一个原因是这群人离互联网太远。
正如我们今天看到的,结果恰恰相反,中小学生们不仅离互联网不远,他们以惊人地速度拥抱互联网。根据猿题库公布的数据,在省市级别的重点中学中,每一个学生都在使用猿题库;使用猿题库的学生超过 1000 人的学校有 2396 所。不仅如此,这些学生每天平均在猿题库上做 34 道题,超过 1/4 的学生每天在猿题库上做题时间超过 40 分钟。
猿题库联合创始人李鑫告诉我,在过去两年里,这个产品几乎没有花钱进行市场推广,更没有通过走行政手段的方式自上而下地让学生使用,而主要通过学生之间的口口相传。结果是,它自下而上地引起了家长、教师和学校的注意。有些学校专门建立 iPad 班,让学生使用猿题库做题。还有老师希望能通过猿题库更好地跟踪学生的学习情况。正因此,那天猿题库还发布了教师版,意味着这个产品极有可能从学生课余时间走入课堂中。
曾经很多人认为 K12 市场难啃的另一个原因是中小学生没有决策权,是成年人决定他们使用什么备考产品、如何学习,而他们对互联网产品的使用很谨慎。这个判断也是错误的。
现在回头去看当时的那些看法(其实今天还有很多人这么想),猿题库联合创始人帅科提到前段时间特别流行的那本书《从零到一》,「彼得蒂尔说,一个从零到一的企业,最核心的点是它在重大事情上的看法与主流意见不一样。回顾过去两年在 K12 市场上,我们做到了和主流不一样,并觉得我们走过的路是正确的」,帅科说。
(猿题库联合创始人帅科)
做题个性化、反馈更及时
将学习简单地定义为一个「输入-输出」的过程肯定是不完整而粗暴的,但不可否认很多学习确实是这样,比如语言类的学习和中国的应试教育。
而这正是技术最擅长的地方。
猿题库首先是一家技术驱动的公司,这家公司的 120 多个员工中 90 个都是技术人员。相对于传统教育方式,在线教育最明显的一个优势是个性化,在猿题库这里也是。
具体来说,首先是对学生能力的智能评估。猿题库曾在内部做过实验,实验中一名学生通过题库做了五道题,猿题库通过他答这五道题的表现预测他在考试中的表现,结果发现学生的测试结果与预测结果一致。
这其中涉及到对用户数据的采集,包括每道题的难度、学生在每道题上花费的时间、正确率、距离上次做题目的时间、收藏的题目、记了笔记的题目、笔记的内容,最终机器运算出结果。只要学生进入后做一次五道题,猿题库就能一对一出题。随着学生做的越多,在里面留下的数据越多,一对一出题的针对性也越强。
在教师版推出后,猿题库可以在个性化上走的更远。猿题库另一位联合创始人李鑫描述了一个可能场景:A 学生在 1、3、5 的知识点上不好,但 2、4 的知识点学得非常好,如果老师要给全班 50 名同学布置 20 道题,算法能让 A 学生在 1、3、5 的知识点上题量更大、难度也更大,而不让他觉得做题没有效果,这样其实老师每次布置作业都针对每个学生。
互联网的另一个优势是及时反馈。不论是猿题库这种题库类产品,还是 Duolingo 这种语言学习类应用,他们都将整个学习过程拆解成一个个的任务,学生完成任务后获得及时反馈和奖励。比如在猿题库中是拿香蕉,这已经成为学生们的口头禅——你今天拿了几根香蕉?
猿题库走的更远的是将这个反馈机制做得直接、可感知。对在应试教育体制下的中学生而言,所有做题和学习的目标很清晰——中高考,猿题库通过对学生的智能分析预测学生的考试分数,这个分数会随着学生每次做题的结果而改变。
帅科举了一个例子,去年猿题库预测了广东省高考学生能考多少分,他们将预测分与实际分数比较,发现相差最大的一门在 5 分左右,其他都相当准确。「现在一年多去了,我们的用户更多数据量更大,今年的预测肯定比去年更准」,帅科说。
(猿题库联合创始人李鑫)
了不起的题库
五十选一,猿题库现在的 60 万道题是这么选出来的,有了这个题库才让之前的个性化和反馈成为可能。
筛选过程从线下开始,它不仅将纸上的题库搬到网上,而要进行选择。首先题目不能有错,然后题目要准确。入库之后并未结束,一轮又一轮的筛选过程才刚刚开始。
每个学生做题的数据能帮助筛选,比如当机器发现有一道题的正确率非常低时,很可能这道题就是有问题的。据帅科介绍,他们每周都会做题目的错误率排行,分析这些题目被做错的原因,比如其中就有些题目四个选项设置的区分度不够容易造成误解,这种题目会被踢出去。
「我们希望学生在上面的每次练习有好的回报,而不会耽误他的时间」,帅科说。
被选中的题目都会被打上 11 个标签,包括考点、解题方法、题型、题目来源、难度、平均作答时间、易错项等,这是对数据结构化的过程,它让智能评估和之后的一对一出题包含多个维度,更加精准。
K12 市场还有一个特点——地域差异。现在初中加高中全部教材版本有 75 个,每年高考有 14 种试卷,中考有 226 种,全国有 240 个考区,猿题库是一个面向全国的产品,地域差异也必须被考虑到产品设计中。
这些被结构化后的 60 万道题的数据是猿题库最宝贵的资产,它训练了机器,让机器做出更好的推荐。「猿题库每个月处理的数据高达 60T」,猿题库联合创始人、技术负责人郭常圳说。
猿题库做的事情实际上是将线下的题库搬到线上,然后再通过出题做题的方式将它智能匹配到每个学生身上。它的逻辑与 Google 通过搜索的方式将成千上万的网页匹配到每个人身上是一样的。
「为什么机器学习的技术过去没有用在教育上,因为它需要大量的训练数据」,郭常圳说。
(猿题库联合创始人郭常圳)
想远一点
「当学生都通过互联网学习了,老师干嘛呢?」一位忧心忡忡地美国高中英语老师问。这位老师在《大西洋月刊》上发表了一篇名为《解构 K12 老师》的文章(点这里去读),他描述了这样一个未来:
每个教室的前面都有一个超大的电脑屏幕,上面播放全国最好的老师讲授的课程。除此之外,还有专业制作的时事新闻、最有力量的 Ted 演讲,互动游戏和电脑能立刻批改的课堂评测。
在这样的教室中,会有一个教师服务人员,他的工作是保证这些设备工作正常以及学生们好好表现。
美国人会喜欢这个先进的教学系统,因为:每堂课都是全世界最有趣最有效率的课程;通过减少教师薪水开支每年可以省好多钱;一般的老师们只要懂管理教室里的设备和学生就行;学生的表现可以标准化,同时会很及时(因此也可以「个性化」);最终美国可以实现公立学校的绝对公平性。
他预测这一切会发生在 20 年内。当他把这个预测说给另一位公立学校老师听时,对方说你说错了,不过主要是在时间上,这一切很有可能在未来 5 到 10 年内就会发生。
(当学生都通过互联网学习了,老师干嘛呢?——图片来自《大西洋月刊》)
说这位美国高中老师的故事其实是想说互联网技术在 K12 教育领域的应用,超越国别和不同国家教育体制的差异,不约而同地走向同样的方向。我们有理由相信,这样的未来很可能也出现中国的中学课堂上。
那么,这件事跟猿题库有什么关系?
事实上,在通过猿题库这个免费的产品撬开 K12 市场、让学生使用并让老师认可后,猿题库刚上线了另一款产品——猿辅导——一个线上教学平台。
过去几年里,互联网先是让老师将自己的教学视频和大纲上传到网上,然后是在课堂上使用互联网教学,现在是直接在网上教课。尽管现在这个平台上的老师多在体制外,但 5 年后还会是这样吗?至少在那位美国英语老师看来,迟早公里学校里优秀的老师会跳出去,以期成为未来教学体系中在网上授课的「超级教师」。
从这个方向看,猿题库与 Coursera、Duolingo 这些产品站在一起,后面两者都毫不隐讳地表示了自己的「颠覆性」属性。
当然,在猿题库自己的说法中,现在还只是帮助老师、优化现有应试教育的一个工具。至于未来会如何,「不确定」,郭常圳说,「但如果要影响,前提是有数据,我们现在就在做数据这件事」。(来源:极客公园 作者:纪云 图片皆由猿题库提供)