本篇文章7557字,读完约19分钟
几天前,舒和我进行了一次极其严肃的技术性谈话,这次谈话被推广了360度。
谁是叹息?蔡明君是个技术怪胎。
他出生时是一名工程师,曾在航空航天921项目工作,开发了一个大型网站,参与了搜狗搜索发动机的设计和开发,并进行了在线教育。他拥有十多年的互联网技术研发经验,目前是搜狐内容推荐引擎的负责人,该引擎已经登陆搜狐新闻客户端,并取得了良好的效果。
作为一个涉足媒体半步的技术专家,他对媒体的判断不那么感性和虚伪,而是更符合逻辑和算法——也许,这样一个未来的技术人员值得二十个报业集团的影响,或者现在已经有这样的迹象。
与舒的对话是我最近最有收获的一次。
我还是写得很长,所以我建议你先把它保存起来,不要理解它,读三遍,它绝对有价值!一定有爆炸效应!媒体从业者可以看到技术的颠覆,技术人员可以看到信息产业的潜在作用。——以下是正文,第一人称口述——问叹:为什么智能推荐市场会突然爆发,这个被全球1亿多用户追捧、被中间巨头占据、投入巨资的市场?这件事真的这么大,这么接近大趋势吗?明智的建议,许多读到这句话的人的第一反应是,这东西可靠吗?
要回答这个问题,回顾一下智能推荐的诞生和发展就知道为什么了。1.需求驱动的智能推荐
互联网的早期信息门户是第一个成功的产品。事实上,它是一堆由编辑推动并堆积在网页上的链接。在信息匮乏的时代,这已经可以满足大多数用户的心理需求。
时间被推后了。在过去的十年里,互联网信息不断爆炸,人们获取信息的深度、广度和频率都有了很大的提高。简单堆积的门户信息已经不能满足需求。这时,rss订阅出现了,这被称为信息阅读的革命,其代表产品是谷歌阅读器。因为每个人订阅不同的信息源,最后看到不同的信息列表,所以用户在这里体验个性化的信息服务。
但是rss订阅最终消亡了。为什么?因为你需要能够使用订阅工具,并找到订阅源,这两个门槛把小白挤出来,这是只适合精英人士玩。如果用户站不起来,市场也不认识他们,他们自然会失败。
Rss已经死了,但它让用户体验到个性化信息服务是多么美妙。用户独立订阅是有门槛的,所以机器会主动推荐它。
购物推荐出现在Amazon.com,开启了机器智能推荐的时代。由此衍生出新闻、音乐、书籍、社交等各种智能推荐引擎。2.技术积累为智能推荐效果提供保障
需求是存在的,但是如果技术不能满足可用性需求,那就没有用了。
早期,计算机的计算能力是有限的,可用的用户数据也是有限的。大多数推荐的算法都是在实验室环境中进行学术研究的,在商业应用中仍然存在很大的风险。随着互联网的快速发展,特别是搜索引擎相关技术的发展,计算能力不再是问题,大规模的用户数据收集也不再困难。这样,基于大样本数据的实时分析和处理系统(大数据)可以快速分析群体行为的概率分布,然后将这些概率分析应用到个体用户,产生智能推荐的体验。例如,搜狗的云输入法,基本原理很简单,即通过概率计算出你想输入的下一个单词可能是什么。但它需要一个庞大而复杂的后台实时分析处理系统。
此外,还有一门专门的学科叫做自然语言处理,还有一些叫做计算语言学,用于人类语言和语义的计算机识别和处理。以前的主要研究领域是自然语言的机器翻译。其基本逻辑是通过机器学习和训练,根据语义进行匹配,统计分析大量已有文章、句子、词汇和词汇之间的概率分布。中国科学院、微软、谷歌等大型机构投入了大量资源进行研究,发表了大量论文,取得了很好的效果。
学术研究第一,商业应用第二,为智能推荐的效果提供了坚实的技术基础。3.移动互联网已经成为智能推荐爆发的导火索
自亚马逊推出产品推荐以来,各种类型的网站都在跟进不断改进的推荐引擎。典型的例子,如葫芦和淘宝,已经广泛应用智能推荐。但是无论如何使用,他们的智能推荐仍然在辅助路径上。
然而,在移动互联网时代,智能推荐已经开始从辅助路径向主路径转变。例如,手机淘宝在其主页上有个性化的产品推荐,这大大提高了主页的发布能力。也有今天的头条新闻,其主要特点是把智能信息推荐到产品的主要路径。为什么会有这样的变化?因为它在移动端。
因为电脑的屏幕足够大,一个屏幕可以显示密集的内容和链接供用户选择。这种格式阅读来源于报纸阅读习惯的延伸,白人用户已经很习惯了。信息越少,他们就越不习惯,认为你对他们不好。但是在手机屏幕上,如果你复制格式阅读的页面布局,用户会发疯的。此外,在twitter和facebook的教育下,不断滑动的订阅源流已经被大多数用户接受和认可,流式阅读已经成为一种标准的移动阅读习惯。在移动场景中,如果用户感兴趣的内容不能尽快给出,那么这个产品离死亡不远了。面对海量的信息和零散的流读,编辑和手工排版已经超出了他们的能力,而智能推荐自然起着主要的作用。
此外,移动设备被称为“人类的自然衍生”,默认情况下,手机是自然用户。与pc机相比,该系统可以获取越来越多的用户行为信息,使得智能推荐的效果更加安全。
在移动产品中,如果没有基于大数据分析的智能推荐逻辑,他们会不好意思说自己是移动产品。你认为明智的推荐是可靠的吗?如今,制造产品的人不再讨论不可靠的智能推荐,而是思考如何使它更可靠。
第二个问题:叹气:为什么用户会看到智力推荐的东西,这些东西通常很受欢迎,但是有很多三个粗俗的内容?有人甚至总结了一首打油诗:“低俗的段落流传甚广,中冷联盟闹得沸沸扬扬,黍子锤很酷,苹果水军很强,车评惨淡,奇闻称王。”头条新闻新热点是什么?这取决于中共中央。”这三个庸俗的东西是最流行的,所以你基本上不需要数据挖掘,你会知道结果肯定会是这样的。
原因很简单。根据马斯洛的观点,人的需要有五个层次,而这三种习惯都是低级的需要,但它们也是最普遍的。正如评级被称为万恶之源一样,点击率永远不可能是智能推荐引擎的唯一标准。例如,如果你直接比较娱乐新闻和科技新闻的点击量和点击率,这是不公平的。(潘:杨淼在接受腾讯副总编采访时提到。“整合微博后如何进入腾讯门户”,腾讯门户在当年也进行了个性化,最终基于个性化匹配的内容是新闻中的垃圾食品,如新奇新闻、赌博和赌博,然后是漂亮的图片、八卦、轶事、谣言等。“每个人都知道垃圾食品是不好的,但许多人喜欢吃它”。(
当你能发现用户的兴趣点不同于三个庸俗的内容时,它就不会是点击率理论。
回到用户觉得推荐效果不够好的事实,我认为主要有两个原因:
1、每个人对推荐的理解不同,这会导致片面概括和武断地认为推荐效果很差。
2.由于技术的限制,产品的过度推广导致用户的过度期待。以前,有人写了一篇关于智能衰老推荐的文章,很有代表性。在适当的时候,我还总结了一些关于智能推荐的常见问题或误解,并给出了简短的回答。
1.明智的推荐会变得越来越狭隘,让你成为井底之蛙吗?
答案当然是否定的。然而,一些朋友经常给我举一些例子(业内称为“坏案例”)。例如,在阅读了几篇马来西亚航空公司mh17的文章后,我被推荐了马来西亚航空公司mh17的信息,但实际上我更关心乌克兰局势对美国、俄罗斯和欧洲关系的影响。这个案例试图解释智能推荐引擎的“智力迟钝”。实际上,这个案例是否是一个坏案例取决于推荐的场景。如果出现在马航事故的“相关建议”中,这是正常的。如果它在推荐的主路径上过于频繁,就不应该这样。
但是这样的推荐引擎不应该是合格的推荐引擎。因为如果你仅仅依靠直接反馈来提出建议,它根本不能被称为智能引擎。推荐引擎的多样性是一个重要指标,在设计之初就应该避免。顺便说一下,本文介绍了我们推荐引擎的四种推荐策略:热点引擎,即寻找与你相关的最近热点信息,关注新闻;兴趣引擎,即在你的兴趣点内寻找信息内容,更注重内容和兴趣的长尾特征,并试图捕捉你的特殊个性;区域引擎,根据用户经常停留的位置推荐本地化的区域信息,关注日常生活信息;探索引擎基于对用户行为和人际关系的深度挖掘,根据一些内在的无形关联进行推荐,挖掘用户未知的兴趣点,适度扩散推荐信息,并根据用户的实时反馈不断修正,并正确迁移到其他推荐策略。对每个人来说,这四个政策引擎同时存在。只能根据算法模型来做个性化的权重比。如果你认为很多内容不适合你,那应该是比例搭配有问题。2.人是不可预测的。机器怎么能理解我?
这个问题属于偷窃的概念。推荐引擎既不是心电图,也不是测谎仪,也不是个人精神分析师或保姆。跟着你的脾气走,看看你今天开心什么,明天失恋什么。
推荐引擎的逻辑是通过挖掘群体用户的行为规则和个人历史行为数据来分析和预测行为。事实上,这与我们人类对事物的观察和理解是一致的,也就是说,我们经常说“听他们说什么,观察他们做什么”。如果你不参与推荐引擎的交互,只凭一个人的感受来判断智能推荐引擎的质量是不公平的。
通常,很多人会给我们的团队反馈,说这个建议不好,那个建议很奇怪。首先,我们将积极收集问题作为我们的坏案例,然后逐一分析它们,找出问题的原因,然后转到数据模型中进行调整测试。
此外,人们的内心本质上是不可预测的,这是一个长期存在的问题。机器怎么能做到这一点,它们绝对是被杀死的。3.智能推荐的内容质量无法保证,垃圾内容无法控制?
无论是编辑还是机器,识别高质量内容的能力一直是一个长期的命题。
智能推荐引擎的基础是搜索引擎,因此搜索引擎具有反垃圾邮件的能力。然而,推荐引擎与编辑手动列表相比,用户对垃圾邮件比搜索引擎更敏感。
但是这个世界是如此美好,因为推荐引擎的强大交互性,它可以根据用户的选择进行动态过滤,垃圾内容可以很快被洗掉。因此,智能推荐有自己的一套内容质量控制系统。
当然,没有遗漏的鱼,但更常见的是,不合理的推荐策略导致的不匹配。同样的内容对你来说是垃圾,对别人来说是珍宝,对别人来说是砒霜,对别人来说是蜂蜜。推荐引擎的策略优化是一个长期持续的过程。4.智能推荐是人和机器之间的互动。人与人之间没有互动。天气又冷又可怕?
事实上,恰恰相反。在实践中,推荐引擎反复使用人际关系属性。
但这是一种无形的功能,不容易表现出来。例如,当您阅读两篇文章时,推荐引擎会找出同时阅读两篇文章的用户阅读了哪些文章,并向您推荐阅读概率最高的文章。有可能前两篇文章,一篇是关于马航mh17空公司,另一篇是关于俄罗斯和欧盟之间的博弈,推荐了美国的亚太再平衡战略。
例如,当你去九寨沟旅游时,推荐引擎会向你推荐九寨沟人通常阅读的文章。
这种推荐充分利用了人们的兴趣属性或地理属性之间的关系,也称为协同推荐。
从效果的角度来看,基于人与人之间的关系来推荐内容比单纯通过语义分析来推荐要好。你只能在推荐引擎上看到结果,但不要武断地说推荐引擎依赖机器进行盲目猜测,因为一定有原因在起作用。人类是一种不断变化的动物,历史不能代表未来?
“狗不能改变吃屎”这句话很粗俗,但它打破了推荐引擎的一个重要逻辑:人是会改变的,但有些长期的规律很难改变。
在设计推荐引擎时,会根据长期和短期进行识别,以一定的梯度来适应人的变化。我们有二级算法模型更新,我们也有每日和每月的长期算法模型更新。
例如,你只要看一下马来西亚航空公司,引擎就会再次推荐马来西亚航空公司的相关新闻。然而,引擎并不认为马航代表了你的长期利益,而只是当前的热点,所以它会适当地给出一些,即捕捉短期行为。随着时间的推移,对短期行为的兴趣会逐渐消失。推荐引擎不怕变化,只怕不变。三个问题:叹息:智能推荐引擎会杀死媒体人吗?在那些加工厂,装配线上工人的位置被成排的机械手臂取代,导致大规模失业,会不会出现同样的情况?算法和工程师杀死了整个编辑部,这是一个场景,据说出现在集,书,人,元和梅,体和人。我坚定地说这永远不会发生,至少在我有生之年,哈哈。
由于现代科学技术的发展,人和机器之间一直存在着微妙的关系。在电影故事中,经常会有人机战争,但机器最终无法击败人,因为人会产生许多变量。不管机器有多智能,它只与人接近,人的价值是不可替代的。
我们必须学会发现一切事物的特征。
机器在常规行为挖掘和兴趣挖掘方面有优势,但它们超出了识别价值、判断社会发展状况和捕捉重大事件的范围;然而,长尾利益集团的人工识别和内容匹配是不可能的任务。在智能推荐的问题上,由于人力不可及,而且需求越来越强烈,有一台机器来弥补这个位置。
上面所说的是它背后的大逻辑。那么,在智能推荐时代,传统媒体人应该做些什么呢?我有五个一般性建议。:
1.媒体人必须正视这一变化。不要回避,不要盲目悲观,也不要憎恨(潘:在印刷术问世之初,一位传教士写了一部洋洋洒洒的书。只有当他谈到临摹时,他才能感受到文字的智慧和灵性。机器摧毁了神圣。为了让更多的人看到他的观点,这位传教士选择用印刷机出版这本书来对抗印刷机。当许多保守派面对创新设备时,这种黑色幽默是典型的纠结状态。).
2.媒体人必须加强他们创造和发现独特内容的原始能力。人们可以从头开始做这个过程,但是机器不能。到目前为止,一些新闻机构已经尝试了机器写作,那些内容都是深度的、原创的、独家的时事通讯,不可能在一百年内制作出来。
3.媒体应该学会使用新的内容操作工具。在使用智能推荐引擎进行发布的环境下,新的内容操作工具肯定不像现在的cms背景,但是我们也在尝试和尝试它是什么(我要写一个,传统意义上的编辑在未来没有价值,系统中的操作人员是核心,这是我一年多的实践经验。从产品的角度来看,这套新的内容操作工具的出现标志着一个变化,它的重要性不亚于客户端产品的变化。
4.媒体本身需要品牌,机器很难有独立的品牌内涵。就品牌认知度而言,用户对媒体的判断和定位会影响他在收到信息后的接受程度。
5.媒体和用户之间的互动以及粉丝群的建立是机器力所不及的。
总之,是媒体希望回归到人的属性上来,扩大人与机器之间的差异。另外,在实际操作过程中,我经常对R&D人事说:不要想当然。不要认为你认为精致的算法是天生完美的,它必须经过严格的原型验证、小样本集测试和大样本集测试,才能广泛推广。至于编辑手动安排的信息,你可能会认为它们是自yy,但实际上有一些特殊的考虑,你不明白。
对于用户来说,他根本不在乎是编辑推荐还是机器智能推荐,拥有良好的体验就足够了。目前,在搜狐新闻客户端的实践过程中,它越来越主动弱化“推荐”的标签,试图让用户感觉不到是谁做的推荐。
让编辑做最好的标题信息,即大热点和大事件;让机器做好长尾信息和大流量内容的分发工作。人工和机器取长补短,共同为用户维护一个完整的信息流,既有价值属性,又有长尾分布能力。不要过分迷信任何东西,也不要认为它是被迫妥协的。事实上,这种混合模式更符合社会现实和用户需求。未来,人们花在分销上的精力会更少,专注于更偏向于人的属性,如发现、创意、品牌和互动。如果你不得不为这个问题而战,那就是用你的肉体来抵抗钢铁的洪流,你会输的。
凯撒的末日凯撒,上帝的末日上帝。四个问题:叹息:在智能推荐引擎的影响下,媒体的未来会变成什么样?1.智能推荐引擎被困在门户和搜索之间
智能推荐引擎是搜索引擎的兄弟,它们的基本逻辑是相同的。不同的是,搜索引擎要求用户主动输入关键词,而推荐引擎不需要输入关键词,而是输入用户的行为。
在互联网出现之初,人们只需要新闻和信息,门户网站迅速崛起。百度当时为门户网站工作。它们都是用户获取信息的工具。搜索依靠用户输入关键词,门户依靠用户的眼睛进行扫描,一个用户拉动一个编辑器来推动。这两种逻辑做了一件事——信息获取。推荐引擎也在做同样的事情。
就我个人而言,我会把推荐引擎放在门户和搜索引擎之间。智能推荐引擎比搜索引擎更具媒体性,比门户网站更具技术性。2:智能推荐引擎优于用户、广告商和自媒体
媒体通常有两个主要环节,内容制作和内容分发。
推荐引擎是内容分发的一场革命,它极大地提高了分发效率。在最初的门户模式中,每天产生100,000条消息,但是几乎看不到消息。推荐引擎向用户发送流行的长尾内容。用户受益是因为推荐引擎主动地为他们自己进行个性化调整,并更有效地获取信息。
另一个利润目标是广告商。推荐引擎使用大量细分的内容来帮助广告商细分用户,使广告更加准确;而且,信息流中的原生态广告具有更好的传递效果。
在内容制作层面,由于智能推荐引擎比编辑更有能力分发细分内容,因此内容制作人更容易向合适的用户(尤其是独立创作者)展示他们的内容。这对媒体来说是件好事。每个人都来自媒体,而不仅仅是一句口号。
3.未来的信息内容将有两个入口
一个是源于社会关系的信息门户,另一个是以获取信息为目的的信息门户。
信息内容具有广泛的含义,所以做好信息录入会很有想象力。
另外,我对流行的微博并不乐观。这是基于肤浅的订阅逻辑的关注,这是不伦不类的,但它不同于其他。它既不是基于社会关系的内容聚合,也不是基于内容关系的聚合。垃圾内容越来越多,信息流越来越杂,这使得它越来越难看。4.智能推荐引擎的最终目标不是帮助用户消磨时间,而是节省时间。
推荐引擎越精确,用户的阅读时间就越有效。当用户认为推荐引擎真的可以节省时间时,门户的效果就会显现出来。5.推荐引擎已经逐渐进入移动互联网时代的主流,但它仍然是一个新生事物,需要不断发展壮大。
目前,其核心是占领主路径,适应大规模用户群体,创造大规模收入,形成独特的产品生态和商业生态。推荐引擎肯定会成为新一轮的互联网标准。这篇文章是作者独立的观点,并不代表老虎嗅探网络的立场
向作者提问并加入语料库
三链:吃昆虫、吃厕所和油炸??3.模纸锻造,模具模具模具模具模具模具模具模具模具模具模具??. 95镣铐和镣铐??0.07%锝58.....
当前流行度:0
[娇娇]http://itougu.jrj/view/189514.j.....
当前流行度:0
1.1 .涓涓细流??邦邦、邦邦、邦邦、交邦和廖廖??要坚强,要坚强。.....
当前流行度:0
你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道........
当前流行度:0
缇落入三条锁链??3镝??6铥??0(乌桕脂含有3条链吗??4镝??4铥??0)死,死,死,死又死,4.72??......
当前流行度:0
那墙,墙,墙和墙呢??钳子里有丰富的镰刀、叉子、叉子、nan和链条,这些都是銮棒的来源.....
当前流行度:1
你想挑起镝,破坏哮喘吗??缇,汤,汤,3汤和柊镶嵌??链条??4."敌鲁,缇,汤,汤,汤."??.....
当前流行度:0
咸丰、大树、细垴、十二寸、相互涓涓??环秀细链,涓涓细流,砸铙钹,甩铙钹,砸铙钹,砸铙钹,砸响,砸得咝咝作响??葛格·岳格·柊.....
当前流行度:0