-
答案 1:
我的理解是:A商品开团3天了,参与人数为100人;B商品开团15天了,参与人数为800人。计算A和B哪个卖的好?这样的话就可以转为预测问题,预测A商品开团15天后参与人数会有多少。如果理解没错的话,可以试试多元线性回归,在解决时间线上的拟合问题还是不错的。尤其是你有历史数据的情况下。至于变量,比较显著的应该有网站、开团时间(即时间线)、商品分类、星期几等。星期函数估计要用自定义函数。结果不会太精确,试过之前很难说靠谱不靠谱。Excel也可以做多元线性回归,感兴趣的话可以看这本书《excel 2007 data analysis and business modeling》:ishare.iask.sina.com.cn/f/124447...的47,48两章。京东有中文版卖。 -
答案 2:
首先建议你修改下问题,这个问题在统计学中范畴有点广,可以直接以下面的案例为题。关键问题是,这里的原先的排名你似乎并不知道,没有因变量的数据,如何进行回归?首先,多元线性回归出来的排名值是期望,这个排名可以近似正态分布么?在非参数统计中的近似可是有严格假定的,我不认为它排名这个东西符合,为什么?因为小的排名数据是很难获得的,所以本身期望就不可信,在这里我倾向于非参数统计的方法。
再者,你选取哪些变量不选取哪些变量这是很有来头的,不是什么变量都可以加进去。数据是时间序列数据,若是排名为因,人数为果,然后拿人数对排名做回归,这就有点本末倒置了。我们要确定哪些因素是对排名有影响的,影响为多长时间的,哪些因素是受排名影响的,哪些是两者有相互影响的,这属于计量的范畴。
最后,像商品的排名是有定义的,热卖值这种是模糊不见的,本身因变量没有明确定义,又不是因子分析出来的影响因素,这是没有价值的。所有的人为定义需要数据说话。当你选定合适的变量时,不妨去做一下因子分析,看看你所认为的热卖值是哪些变量的线性组合。
建议在此处用非参数统计的方法,一个【Cochran Q】检验再加上几组卡方检验就可以搞定了。为什么不能直接当正态做?因为你先要找排名的因素,然后要把它显示出来,这不是一个可以不管残差是否正态就拿去做回归的事情
建议先检验一下这些变量是否是同阶单整的。假设他们的影响时间不是都一样,(i.e.有的因素很快对排名见效,有的要很慢见效),那直接放在一起是有问题的。这里有个非常有名的ADF检验,如果数据是异方差的(自己对自己的上一期所做出来的回归存在异方差)请用PP检验修正。
以上的详细检验方法都可以在网上搜到。做分析时,请务必先想假设条件是否满足。统计并不是一个简单的事情,它需要你思路清晰明畅。
-
答案 3:
这是一个曝光策略的问题,就是随机挑选商品曝光一段时间,然后转化高的往上浮动相关问题的研究方式是假定存在最优的商品(Oracle),然后提出某种商品曝光策略,数学推导其相对于(Oracle)选择最优商品的损失最简单的算法是UCB1,(网上抄来的)描述如下
For each action j record the average reward ?xj and number of times we have tried it nj . We write n for total number of actions we have tried.
Try the action that maximises ?xj + sqrt(2 ln(n) / nj)
比如有100个商品,截至目前总共引了100w PV,卖了1w件
一个商品引了1000 PV,卖了100件,那么就是100/1000 + sqrt(2 * ln(100w) / 1000)=0.266
一个商品引了10000 PV,卖了1000件,那么就是1000/10000 + sqrt(2 * ln(100w) / 10000)=0.105
一个商品引了100000 PV,卖了10000件,那么就是100/1000 + sqrt(2 * ln(100w) / 100000)=0.101
而一个商品引了100 PV,卖了1件,那么就是1/100 + sqrt(2 * ln(100w) / 100)=0.53
所以新品应该多曝光,即使起初转化率很低
怎么计算有时间关系的数值排名?
2012-01-19 17:40:13 来源: 点击:
相关热词搜索:
上一篇:人与人之间的信任基础是什么?为什么?
下一篇:现在能源消耗大,地球是不是越来越轻了?