本篇文章1931字,读完约5分钟
美国金融业大数据最直接的场景是所谓的信用评估系统。对美国信用体系的评价很简单,只有几样东西:债务历史、债务、信用历史时间和其他相关因素。所有这些加起来就形成了美国现有的评分系统。
一般来说,如果变量太多,模型会很难处理。要点是它的深度比它的宽度更重要。因此,过去20年的记录与最近一年的记录不同。
此外,比现在更关注用户的历史,也许这个人一开始是一个?爱丽丝最近突然发了财,他的还款能力可能会有很大的变化,但这是否反映了一个因素呢?许多人不知道。如何把一切都放在纵横两个宽度将是相对重要的。
大数据在金融中有什么用?同一个人在不同的应用和领域是不同的。例如,今天在这家公司呆20年并不一定意味着他是一名好员工。他很可能没有能力换工作。如果你从另一个角度来判断这个人,你的标准和应用程序变量应该完全改变。但不幸的是,没有人从这个角度来衡量一个人。
为什么你最终把风力控制放在如此重要的位置?像中国的p2p公司一样,在六个月或一年内剩下四分之一是一个奇迹,许多p2p公司将会死亡或被收购。当所有的热潮慢慢消退,风险控制将被放在最突出的位置。
直接询问用户答案也很重要。你可以在一个地方撒谎,也可以在两个地方撒谎,但是如果我的大数据从千千收集了10万个点,那么很难伪装10万个来自千千的点而不互相矛盾。如果可以伪装成这样,那就不是一个欺骗的过程,所以一个人很难完全编造一个无法通过大数据看到的谎言。
大数据模型概念,所有数据都是信用数据。所有这些关键变量,如果它们是单独知道的,将不会对判断这个人是怎样的人有多大用处,但是如果所有这些小的因素结合在一起,将会发现最后一点是非常强的,这可以准确地判断这个人在做什么。这是非常重要的一点,要看关系,而不是因果关系。
同样的名字听起来不错,机器学习,我们都会深深地意识到,它实际上是我们可悲的学习机器,而不是学习我们的机器。如何更好地与机器沟通,我们给他一个方法,或者给他一个事实,他可以更快地从中提取,这更多的是一种互动。
大数据的第二个模型是数据源。即使错误的信息是信息,它也反映了一个人的素质。
第三点是所谓的建模。总之,大数据中所谓的特征变化、特征提取、最终所谓的独立模型细节的建立和最终模型集成,与以往的传统统计理论有很大不同。
最后一个非常有趣。它在中国基本不存在,但在美国比较麻烦。大数据与相关立法的关系。我相信将来中国的立法越来越完善的时候会遇到这样的问题。信用评估中有一些不可触及的禁区。第一性不能用来确定这个人的信用价值,这是绝对不允许的。第二个年龄,年龄不像性别那么严重,但年龄是必须的,只能作为一个积极因素,而不能作为一个消极因素。现在很多人都不使用年龄。第三个种族是不可触及的红线。根据你是亚洲人、黑人、白人还是拉美人来判断你的信用是好是坏是绝对不可能的。例如,在中国,当你在街上或在美国开车时,墙上写着的字告诉你这个地方不能原地掉头。因为太多的人在原地转来转去,所以会竖起一个标志。如果这个地方很窄,你不用写,也没有人会原地转身。事实上,这些禁止使用的东西最能体现一个人的本质。事实上,我们可以从我们的模型中看到,这些不被允许使用的东西,如果被使用的话,比千千数千条信息的总和还要有用。
大数据的另一个奇怪的应用是,它可以帮助你绕过一些法律红线。这不是法律上的回避,而是因为事物的本质是由这些因素决定的。甲可以突出丙,乙可以突出丙,甲和乙必须是相关的。(李凌)
三链:吃昆虫、吃厕所和油炸??3.模纸锻造,模具模具模具模具模具模具模具模具模具模具模具??. 95镣铐和镣铐??0.07%锝58.....
当前流行度:0
[娇娇]http://itougu.jrj/view/189514.j.....
当前流行度:0
1.1 .涓涓细流??邦邦、邦邦、邦邦、交邦和廖廖??要坚强,要坚强。.....
当前流行度:0
你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道........
当前流行度:0
缇落入三条锁链??3镝??6铥??0(乌桕脂含有3条链吗??4镝??4铥??0)死,死,死,死又死,4.72??......
当前流行度:0
那墙,墙,墙和墙呢??钳子里有丰富的镰刀、叉子、叉子、nan和链条,这些都是銮棒的来源.....
当前流行度:1
你想挑起镝,破坏哮喘吗??缇,汤,汤,3汤和柊镶嵌??链条??4."敌鲁,缇,汤,汤,汤."??.....
当前流行度:0
咸丰、大树、细垴、十二寸、相互涓涓??环秀细链,涓涓细流,砸铙钹,甩铙钹,砸铙钹,砸铙钹,砸响,砸得咝咝作响??葛格·岳格·柊.....
当前流行度:0