本篇文章3755字,读完约9分钟

毫无疑问,易趣拥有惊人的数据量。它每天处理100pb的数据,包括50tb的机器数据。可以说,ebay每天都面临着天文数字的大数据挑战。

早在2006年,ebay就建立了一个大数据分析平台。为了准确分析用户的购物行为,易趣定义了数百种类型的数据来跟踪和分析顾客的行为。然而,它也给易趣带来了新的挑战。你知道,公司里的数据量是难以想象的。没有人能够分析和消化如此多的数据,也没有人能够基于所有的数据建立一个模型。

事实上,易趣真正适用的只是它收集的一小部分数据。对于剩下的数据,易趣要么丢弃,要么存储。因为也许有一天,当技术取得突破时,这些数据会变得有用。易趣大中华区首席执行官林宜章指出。

目前,易趣如何利用这些数据来促进业务创新和利润增长?

给用户画像

Ebay拥有近2亿用户,网站上有超过3万个商品。在该平台的日常交易中,ebay几乎每秒钟处理数千美元的交易。事实上,这些交易数据只是易趣全部数据信息的冰山一角。

基于大数据分析,易趣每天必须回答许多问题,例如,昨天最受欢迎的搜索产品是什么?即使这样一个简单的问题也需要处理50亿的页面浏览量。从这个角度来看,任何基本的业务问题对公司来说都是一个巨大的问题。

林宜章举了一个典型的例子,说明易趣如何利用大数据增加网上交易。举例来说,当一个年轻女性上午10点在星巴克浏览易趣时,易趣应该向她推销什么样的产品?

事实上,我们已经对这些信息点做了大量的研究。林说,其实她浏览的产品上午10点、中午12点、晚上7点都不一样;在餐馆或家里,它也会对浏览和搜索产生影响;此外,用户的年龄、当时的天气等。,会对购物产生影响。易趣需要做的是在不同的情况下学习不同的购物模式,推出用户最想要的产品。

据报道,易趣可以从用户过去的浏览记录中猜出她想要什么样的产品,还可以从数百个场景模型中计算出用户可能的需求;或者与另一个有相似特征的女性用户进行比较,看看她当时购买了什么样的商品,从而推断出该用户的潜在需求。在考虑了各种因素后,易趣的后台需要在几秒钟内将产品页面推给用户。这意味着易趣的系统需要非常快的计算速度。

大数据玩家eBay:猜出你的购买欲

这种运作模式中有相当多的人为因素。例如,机器可以从用户那里收集成千上万的数据,但易趣工程师可以将其中的100个定义为有效数据,而模型就是基于这些有效数据。此外,当计算机自动学习和分析各种数据形成的趋势时,易趣需要在与商品交易相关的行为上设置机器学习的逻辑。

除了通过大数据向用户展示目标产品,易趣还试图通过使用大数据优化搜索引擎。

具体来说,易趣可以掌握用户的行为模式,使搜索引擎更加直观。如果时间回到几年前,当用户使用易趣的搜索引擎,他们会发现它只能理解字面意思,并根据字面意思寻找它。大多数时候,搜索引擎无法理解用户的真实意图。但现在,易趣正试图改变或重写用户的搜索请求,添加同义词或替换句子,以便给出更多相关内容,从而增加网上交易量。在这背后,都离不开大数据的支持。

大数据玩家eBay:猜出你的购买欲

向商家提供情报

基于用户购物的数据,易趣还将为商家提供各种智能。例如,易趣会告诉制造商用户在网上搜索什么产品,或者各种出口行业的数据,制造商会立即对此做出回应。

大多数时候,易趣会根据自己或其他电子商务网站的交易情况,建议它应该出售的类别。这就是易趣在大中华区所做的。林毅章说,例如,如果一家中国企业想向澳大利亚销售其产品,我们可以告诉他一个月可以销售多少产品,价格应该在什么范围内,市场上有多少企业在销售同样的产品,以及他的市场份额是多少。

在此基础上,易趣还试图计算商家的补货频率。事实上,海外仓储令企业头疼。一旦计算错误,就可能导致库存积压或短缺。在易趣上,一旦用户下订单,发现商家缺货,这将是一个非常严重的问题。在这种情况下,易趣可以通过分析过去的数据得到第一批商品的大概销售量,以及根据过去的销售速度应该在什么时候补充商品,物流时间有多长。通过这些数据的计算,易趣可以计算出商家补货的逻辑。

大数据玩家eBay:猜出你的购买欲

这些数据分析对于企业开发新的销售类别非常有用。通常,一个商人需要四到五个月的时间来了解一种商品在淡季的销售量以及它在各个地区的受欢迎程度。

当然,易趣所做的是为商家提供各种潜在的商业机会。卖家是否愿意投入生产,或者他们是否能找到合适的供应商来购买商品,仍然需要他们自己去做。大多数时候,易趣推荐商家销售200个新品类,但最终,商家只能找到50个新产品的供应商。

此外,易趣还可以通过平台上生成的各种信息发挥质量控制(质量管理)的作用。例如,一个卖家想在易趣上销售1000种产品。当它销售50种产品时,有5种产品有问题;当销售200种产品时,有20种产品有问题;当售出400件产品时,有40件产品存在质量问题,等等。易趣需要做的是在早期出现问题时及时提醒卖家。

此外,当卖家卖出10或20件商品时,易趣应该根据退货率和买家的评论发现可能的问题。同时,易趣会提醒卖家监督供应商提高质量,或者选择将产品下架,或者修改产品说明。

在理想状态下,这个质量控制系统将形成一个大数据周期,并帮助卖家减少退货和销售更多的商品。如果卖家在收到通知后仍然走自己的路,易趣会认为这些卖家不重视质量控制。在某个阶段,易趣将对他们实施交易配额,以限制他们的交易量。

质量控制的难点是我需要通过数据模型找出卖方交易量小时的问题。这种早期预测涉及复杂的操作。林宜章表示,一旦交易量大了,卖家自己会计算退货率,而之前的损失将无法挽回。

试错与挑战

像其他在线交易平台一样,易趣对假货也非常敏感。目前,该公司正试图让该系统通过大数据技术智能识别假货。

事实上,打击互联网上的假冒产品并不容易。我们应该知道,假货经常以各种形式出现在互联网上,并且被反复禁止。以劳力士为例,一个假冒的商人可能会在一个单词中添加一个空字符,或者交换两个字母,甚至劳力士也不会出现在名称中,但是图片显示了劳力士手表的外观。易趣上有这么多品牌,自然也有各种各样的假货。在这种情况下,你不能简单地通过抓住商品名称或描述中的关键词来抓住假货。

大数据玩家eBay:猜出你的购买欲

易趣现在正在做的是通过数据分析建立一个模型或规则。如果商家的交易符合这一规则或特征,它可能是出售假冒商品。

例如,当一个卖家廉价而快速地销售商品,但有许多投诉和退货,系统将识别这种可疑的模式,然后工作人员将判断卖家是否在卖假货。换句话说,即使数据量很大,卖假货的人也有相对固定的模式。林宜章说道。通过这种方式,易趣有效地识别了许多假冒企业。

然而,林宜章并不否认这种大数据分析方法也有其弊端。就假冒商品而言,这种方法只能事后发现问题,而不能提前预测。他说,这不是一个容易解决的问题,因为无论使用什么样的模型,假交易总是可以骗你一段时间。

除了分析的滞后,易趣的大数据挑战也体现在巨大的数据处理上。尽管企业数据仓库为查询提供了很好的性能,但它仍然不能满足易趣对存储和灵活处理的需求。你知道,这些系统的成本相当昂贵。当ebay每天增加50tb的数据时,成本相当高。

在此基础上,易趣收集的相当一部分数据目前是无用的。毕竟,收集的数据越多,变量越多,数据噪音越大,模型就越失真。从这个角度来看,易趣需要做的是记录有意义的数据并销毁不必要的信息。问题是,易趣需要分析的问题有85%是新的或未知的,易趣不知道什么信息在未来可能有用。林毅章承认,现在看似无效的数据,明年可能会随着科技进步而被消化,我们只能先存储这些数据。

大数据玩家eBay:猜出你的购买欲

另一方面,如果所有的信息都被储存起来,ebay每个月都会增加数亿条数据。在如此浩瀚的数据海洋中,分析是不可能的。因此,对于易趣来说,这是一个必须平衡的难题。

应该指出的是,易趣目前的分析模型并不完美。无论是猜测用户还是分析易趣上商家的业务,易趣都猜测错了很多。为此,林宜章举了一个信用卡的例子。在他看来,银行实际上最好使用大数据,但不管风险控制模型有多完美,世界上仍有大约2%的信用卡赔率。此外,易趣没有使用成熟机构认证的模型,因此它不得不自己猜测也就不足为奇了。

大数据玩家eBay:猜出你的购买欲

三链:吃昆虫、吃厕所和油炸??3.模纸锻造,模具模具模具模具模具模具模具模具模具模具模具??. 95镣铐和镣铐??0.07%锝58.....

当前流行度:0

[娇娇]http://itougu.jrj/view/189514.j.....

当前流行度:0

1.1 .涓涓细流??邦邦、邦邦、邦邦、交邦和廖廖??变得强大。.....

当前流行度:0

你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道........

当前流行度:0

缇落入三条锁链??3镝??6铥??0(乌桕脂含有3条链吗??4镝??4铥??0)死,死,死,死又死,4.72??......

当前流行度:0

那墙,墙,墙和墙呢??钳子里有丰富的镰刀、叉子、叉子、nan和链条,这些都是銮棒的来源.....

当前流行度:1

你想挑起镝,破坏哮喘吗??缇,汤,汤,3汤和柊镶嵌??链条??4."敌鲁,缇,汤,汤,汤."??.....

当前流行度:0

咸丰、大树、细垴、十二寸、相互涓涓??环秀细链,涓涓细流,砸铙钹,甩铙钹,砸铙钹,砸铙钹,砸响,砸得咝咝作响??葛格·岳格·柊.....

当前流行度:0

来源:国土报中文版

标题:大数据玩家eBay:猜出你的购买欲

地址:http://www.g3gw.com/new/19959.html