A5交易A5任务SEO服务站长团购A5同盟
2016 年,已酝酿很久的知识分享终究显现出了爆发式发展。除在这个领域深耕多年的知乎和果壳分别以不同情势实现了产品形态和商业模式上的突破以外,包括百度、微博、喜马拉雅等更多的气力开始突围。就在今年,这其中也出现了本日头条的身影。
今年 4 月,本日头条的头条问答栏目正式上线。这个聚集了 6 亿用户的内容分发平台仿佛在各个角度上,都与人们定义的「消费升级」条件下的知识付费浪潮调性不符合,但是在 11 月的世界互联网大会上,本日头条 CEO 张1鸣曾这样介绍过头条问答的机制:「传统意义上的问答基本上都是基于社交模式,存在很多问题,在我看来这恰正是人工智能和算法可以解决的。」
也就是说,在依托于本日头条的头条问答上,算法可以帮助用户在 6 亿用户和 30 多万个「作者」中找到最合适回答某个问题的「专家」,也能够把最「适合」的问答内容推送到最需要浏览他们的人。更关键的是,本日头条还希望未来算法可以根据热门事件自动生成问题:在头条问答上,你大概不会看到类似于「谢邀」的寒暄,由于回答这些问题的「约请」大多数是由机器发出的,乃至问题和答案都是由机器提供的。
看上去这又是本日头条基于「效力先于价值」推出的1款产品。能够支持起这套系统运行的则是用户保存在本日头条上的海量数据分析,和这家公司1直视为生命根基的人工智能算法。
用算法驱动的问答社区到底甚么样?
用本日头条算法构架师曹欢欢的说法,头条问答关注的是「更广泛的问题」,「我们希望这上面有很专业的问题,但是我们覆盖的是几亿用户,所以也会覆盖到1些其实不专业、但是用户有需求的问题,总的来讲我们在覆盖面上有1定的优势。」
打开本日头条的问答频道,你会发现这里人们关心的问题和知乎不太1样,调性也更加「接地气」。你可能看到的是类似于「俄罗斯大使在土耳其安卡拉被杀会造成哪些影响」这样的专业性问题,也有可能看到「李小璐为何会嫁给贾乃亮」之类的8卦分析,产生这1切可能性的条件,都要看你平常是如何「调教」本日头条 app。
(1个完全没有被「调教」的头条问答频道)
不过就现阶段来讲,这个用机器驱动的问答系统其实不成熟,它还不能很好的完成「个性化分发」的任务。相比于本日头条上的内容分发,头条问答的内容分发是比单纯的新闻内容个性化推荐更加复杂的领域,由于它触及到的不是「内容和读者」两方之间的关系,而是扩大到了「问题、答案、读者、专家」等更多维度的关系。
具体到问答领域的难点,曹欢欢认为可以总结为以下6个方面,分别是:
问题分发:如作甚用户的发问快速找到最合适回答的专家,并且提供高质的回答。
答案质量:是不是很好的回答问题,其中包括能否有效处理答非所问、答案配图无关等问题。
答案排序:在同1问题下,机器能否给出比较好的答案排序,该排序对阅读用户和创作者是不是都比较友好。
问题配图:用户发问的时候,系统能否给出适合并且优良的配图候选。
问题自动生成:碰到1些热门的新闻或用户津津乐道的话题时,系统能否快速的自动生成问题并且配以生动的描写。
问题去重:对重复的问题,机器能否聚合,怎样做到高准确的召回。
知识表示、推理和内容分发领域触及到深度学习、几率图模型、矩阵分解和稀疏方法、决策树等理论和技术。而关于现阶段如何更好的解决这些技术困难,本日头条的方法是把头条问答上的数据开放,以实际问题作为题目举行1场算法比赛。
事实上,用算法大赛驱动算法和实际问题解决方案的进步1直是科技界的传统。其中最著名的应当就是 2006 年 Netflix 在举行的百万美金 Netflix Prize,就曾为该公司带来过包括算法、人材和品牌价值上的丰富回报。其中在业界,这次大赛带来的最直接影响就是关于「推荐」算法上的突破性进步。
因而在这次人工智能学会联合IEEE中国和本日头条联合举行的这场「2016 Byte Cup 国际机器学习比赛」,上述的第1个问题「为用户的发问快速找到最适合的人,并且提供高质量的问答」就被直接列为了比赛题目。而具体任务则是建立模型,预测某个专家可以回答某个问题的几率。经过几个月的比赛后,11 月 17 日,本日头条终究公布了比赛结果,1支由中科院和乔治亚理工两校博士组成的队伍终究取得了第1名,他们一样也会取得5000美金的现金酬劳。
(本日头条主办的算法大赛及其优越者)
固然,由学界和本日头条共同主办的这次比赛明显还不能与 Netflix Prize 等量齐观,「其实过去所有机器学习的比赛都是围绕着 Netflix Prize 来做的,现在大家通用的推荐算法也是在 Netflix Prize 获奖方案的基础上去做,所以本日头条的这次算法大赛希望做的是1个『差不多』的比赛,但同时不要太难。」本日头条实验室总监李磊表示。
而目前就比赛的结果来讲,终究获胜的前3名的确也为头条问答的算法创新带来了1定启发。「比赛中提出了1些非常新颖的想法,比如冠军队伍的双向非对标 SVD + +,亚军队伍提出利用问题-作者数据构建无向图,再利用随机游走路径摹拟文档,从而借用 word2vec 模型取得问题-作者对偶向量,都非常有趣,而且实际中确切对算法效果有改进,非常难得。」曹欢欢表示。
为何人工智能对问答系统愈来愈重要?
虽然头条问答是 2016 年本日头条刚刚启动的项目,但是根据曹欢欢介绍,头条问答上的问题浏览率和回答数据已和知乎非常接近。
用算法驱动这个问答社区为何会变得重要?如果从本日头条的产品形态来讲,提高发问者和专家、问题和适合的答案,和这些内容和普通用户之间的「匹配」效力多是最主要的缘由。而且,本日头条已聚集了 39 万头条号作者,这些作者中不乏各个领域中的专家,当他们以「专家」形态参与到头条问答中时,这些作者的内容价值输出渠道也变得更加丰富。
这大概也是本日头条进1步完善平台内容生态的重要方式。在铸造内容平台这道围城时,本日头条在笼络了大量用户和头条号作者后,1直希望用短视频、图片等情势完善自己的内容矩阵。而头条问答则成了本日头条为提升头条作者价值的另外一个阵地和渠道,对那些提供优秀答案的作者,系统会突出展现其头条号的名称,从而增强其头条号作者的影响力和活跃度。
因此就现阶段来讲,匹配机制还不够完善的头条问答对头条作者的意义或许大于普通用户。由于覆盖的用户数量巨大,所以头条问答的社区氛围明显和我们现在熟知的问答社区不太1样。在以「社交」为驱动和纽带的问答社区中,feed 流中大多还是以时间轴和用户关注人和他们关注的问题组成。但是不能否认的是,单从产品形态来讲,机器学习或许可以提高问答社区的运转效力,让长尾问答内容需求得到满足。
比如 IT 技术问答网站 Stackoverflow 就已引入了智能推荐机制,不过这个平台上的问题通常比较具体,而且答案是唯1的。在本日头条今年刚刚成立的算法实验室里,针对实时性问题的「自动问答」解决方案已成为团队研究的1个重点。「我们相信关于1些事实性问题,类似《哈利·波特》的作者是谁,现任美国总统是谁这类事实性问题,机器能够像百科全书1样自动回答。单单放在头条问答领域,也能够节省专家人力,提高效力。」本日头条实验室总监李磊表示。
本日头条实验室里的另外1个研究重点是几率推理算法研究,「这方面研究的意义是,希望机器不只是能从数据里快速学到东西,还希望能够做到在不肯定的文本里做出推理,综合模糊的因素做出判断。」
可以肯定的是,现阶段,针对1些需要展现「观点」的问题,能够做的除提高分发匹配效力,机器能做的还很少。不过我们仍然可以期待的1点是,在未来问答社区的产品形态里,机器和人分别能够扮演甚么样的角色,和这类趋势对已爆发的付费问答领域会带来甚么样的影响。