首页 > 教育学习 > 为什么 > 怎么计算有时间关系的数值排名?

怎么计算有时间关系的数值排名?
2012-01-19 17:40:13   来源:   点击:

    怎么计算有时间关系的数值排名?好吧 用团购网站比方下我有很多团购网站的团购商品数据我知道这个商品的此时的购买人数【这个人数会实时变化】,商品的开团时间【感觉开团时间的长短会影响商品购买人数】,我想要找出那些商品是热卖商品怎样做比较科学?这个应该是统计学的把,有童鞋可以分析下吗?

    3 个答案

    • 答案 1:

      我的理解是:A商品开团3天了,参与人数为100人;B商品开团15天了,参与人数为800人。计算A和B哪个卖的好?这样的话就可以转为预测问题,预测A商品开团15天后参与人数会有多少。如果理解没错的话,可以试试多元线性回归,在解决时间线上的拟合问题还是不错的。尤其是你有历史数据的情况下。至于变量,比较显著的应该有网站、开团时间(即时间线)、商品分类、星期几等。星期函数估计要用自定义函数。结果不会太精确,试过之前很难说靠谱不靠谱。Excel也可以做多元线性回归,感兴趣的话可以看这本书《excel 2007 data analysis and business modeling》:ishare.iask.sina.com.cn/f/124447...的47,48两章。京东有中文版卖。
    • 答案 2:

      首先建议你修改下问题,这个问题在统计学中范畴有点广,可以直接以下面的案例为题。关键问题是,这里的原先的排名你似乎并不知道,没有因变量的数据,如何进行回归?

        首先,多元线性回归出来的排名值是期望,这个排名可以近似正态分布么?在非参数统计中的近似可是有严格假定的,我不认为它排名这个东西符合,为什么?因为小的排名数据是很难获得的,所以本身期望就不可信,在这里我倾向于非参数统计的方法。

        再者,你选取哪些变量不选取哪些变量这是很有来头的,不是什么变量都可以加进去。数据是时间序列数据,若是排名为因,人数为果,然后拿人数对排名做回归,这就有点本末倒置了。我们要确定哪些因素是对排名有影响的,影响为多长时间的,哪些因素是受排名影响的,哪些是两者有相互影响的,这属于计量的范畴。

        最后,像商品的排名是有定义的,热卖值这种是模糊不见的,本身因变量没有明确定义,又不是因子分析出来的影响因素,这是没有价值的。所有的人为定义需要数据说话。当你选定合适的变量时,不妨去做一下因子分析,看看你所认为的热卖值是哪些变量的线性组合。

      问题解决:

        建议在此处用非参数统计的方法,一个【Cochran Q】检验再加上几组卡方检验就可以搞定了。为什么不能直接当正态做?因为你先要找排名的因素,然后要把它显示出来,这不是一个可以不管残差是否正态就拿去做回归的事情

        建议先检验一下这些变量是否是同阶单整的。假设他们的影响时间不是都一样,(i.e.有的因素很快对排名见效,有的要很慢见效),那直接放在一起是有问题的。这里有个非常有名的ADF检验,如果数据是异方差的(自己对自己的上一期所做出来的回归存在异方差)请用PP检验修正。

        以上的详细检验方法都可以在网上搜到。做分析时,请务必先想假设条件是否满足。统计并不是一个简单的事情,它需要你思路清晰明畅。

    • 答案 3:

      这是一个曝光策略的问题,就是随机挑选商品曝光一段时间,然后转化高的往上浮动相关问题的研究方式是假定存在最优的商品(Oracle),然后提出某种商品曝光策略,数学推导其相对于(Oracle)选择最优商品的损失

        最简单的算法是UCB1,(网上抄来的)描述如下

        For each action j record the average reward ?xj and number of times we have tried it nj . We write n for total number of actions we have tried.

        Try the action that maximises ?xj + sqrt(2 ln(n) / nj)

        比如有100个商品,截至目前总共引了100w PV,卖了1w件

        一个商品引了1000 PV,卖了100件,那么就是100/1000 + sqrt(2 * ln(100w) / 1000)=0.266

        一个商品引了10000 PV,卖了1000件,那么就是1000/10000 + sqrt(2 * ln(100w) / 10000)=0.105

        一个商品引了100000 PV,卖了10000件,那么就是100/1000 + sqrt(2 * ln(100w) / 100000)=0.101

        而一个商品引了100 PV,卖了1件,那么就是1/100 + sqrt(2 * ln(100w) / 100)=0.53

        所以新品应该多曝光,即使起初转化率很低

      直观的理解,就是转化率与曝光度的一个折衷另外这个问题的不同策略在数学上相差不大

相关热词搜索:

上一篇:人与人之间的信任基础是什么?为什么?
下一篇:现在能源消耗大,地球是不是越来越轻了?