您好、欢迎来到现金彩票网!
当前位置:2019全年免费资料大全 > 统计推理 >

数据分析篇|基于推断统计学把握问题核心洞悉数据模式与趋势

发布时间:2019-06-19 04:59 来源:未知 编辑:admin

  线上课程 产品新人如何快速提升Axure能力?这样学,标准低保真/高保线日

  产品小白专属,10周线上特训,测、练、实战,22位导师全程带班,11项求职服务,保障就业!了解一下

  Hi,各位看官老爷们好~,在前两篇《数据分析-初识数据埋点(一)》、《数据分析-初识数据埋点(二)》中已经对实战应用中的数据埋点的基础认知、基本分类、定义规范、流程以及详细的应用场景与大家做了全面的讨论,第三篇也就是本篇将在数据埋点的基础之上深入讨论后续数据分析中的一些问题,达到真正的把握客观数据核心的目的!

  收集了数据紧接着面临的问题就是怎么分析才是最精准的、严谨的?理想情况下从埋点上线那一刻起一直到产品退市,取全量所有时间点的数据进行分析时,数据才最准确。那在实际工作中也要用此方法吗?显然不行~

  场景一:某产品的需求上线后,隔了一天,从后台取出埋点数据一看,效果很好,有大量的用户在使用这个功能。并且推动了转化率的提升,最终提升了核心指标。安奈不住心中的喜悦,拿着一天的数据去跟领导汇报,结果却被领导大骂一场~~

  场景二:产品需求A(详情页X功能优化)刚上线天,还没有分析需求A所涉及的所有主要评估埋点,以及辅助评估埋点,以及后续的流程,紧接着在同一个页面:详情页上线需求Y。领导得知此事后,然后、然后产品经理被领导叫去喝茶了…

  场景三:某产品经理说,自己负责的产品已经处于产品生命周期的中后期了,不求快速迭代增长,只求稳定,减缓数据下跌速度。需求少,几个月都没有一个需求上线。等上线需求以及埋点方案后,我等上3个月,3个月时间够长!数据一定具备代表性,一定能反应客观真相。领导得知此事后,大家懂得,产品经理被领导叫去喝茶了…

  在不同的场景中各产品经理是因为什么原因导致被请喝茶呢,下面做下初步的问题拆解:

  场景一中显然取数的周期太短,样本数据不具备代表性,不能代表整体趋势。例如:新上线的功能,用户趋于好奇去点了下,看看好用不好用,怎么用,而不是需求驱动的功能使用。

  场景二不仅3天的数据周期并不具备代表性不能代表整体趋势。而且在X功能没有输出分析结论的前提下在同一个页面上线需求Y。带来的结果就是无论数据涨跌,都无法产出分析结论,X功能与Y功能相互影响,无法判定数据涨跌的原因。最坏的结果就是:虽然X功能导致数据下降,但是由于判断两个功能之间的影响关系,只能一刀切,两个功能一起下线。

  场景三虽然取数的周期足够长,但是由于外部因素影响,也可能使数据有偏移客观事实的趋向。例如在二手车行业,大的节日,不同的月份,以及新车发布会等等外部事件都会对产品数据的波动产生较大的影响。

  并且根据局部观察结果来推断总体时,其中把握局部问题的核心才是当务之急。从一大堆数字中看出模式和趋势可能颇为不易,而求出平均数往往是把握全局的第一步。有了平均数就能迅速找出数据中最具代表性的数值,得出重要结论,在本篇中将与大家讨论几种方法,帮助计算最重要的统计量均值、中位数,基于以上有效的汇总数据,达到得出简练、有用的结果的目的。

  同分布:同样例如本汪抛骰子,每次投中任意点数的概率均为1/6,这就是同分布的。

  独立同分布:在概率统计理论中,指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布。独立同分布最早应用于统计学,随着科学的发展,独立同分布已经应用数据挖掘,信号处理等不同的领域。

  均值:为了求出一批数字的均值,我们会将这些数字加起来,然后除以这些数字的个数。均值是应用最广泛的统计量之一。由于使用如此频繁,统计师专门给了他一个符号:μ。这是一个希腊字母(读作“谬”)。记住这只是表示均值的一种简介方法。

  数学期望E(X):通俗一点,各位看官老爷可以理解为我们生活中说的平均值(在统计学上叫均值μ,不过当前为了便于通俗,可暂理解为E(X)=平均值,后面涉及数学期望E(X)时会单独展开讨论)。

  其中样本数据在取数时在尽可能保证其他因素变量不变的前置条件下,取1周~2周之间的数据作为样本进行数据评估为宜。最好是1周后取一次查看数据表现并形成初步结论,2周后再取一次数据查看数据表现与第一周的数据在趋势上是否吻合,是否存在较大的波动进行双重验证,并输出分析结论,如2份数据差异较大,则有必要详解的向下拆解,并持续重点关注数据变化~

  均值:可能以前有人让你算过平均数,计算数据的平均数的一个方法是:将所有数字加起来然后除以数字的个数,在统计学中,这样算出来的值叫做均值。

  均值:为了求出一批数字的均值,我们会将这些数字加起来,然后除以这些数字的个数。均值是应用最广泛的统计量之一。由于使用如此频繁,统计师专门给了他一个符号:μ。这是一个希腊字母(读作“谬”)。记住这只是表示均值的一种简介方法。

  频数:在计算一批数据的均值时,我们常常会发现有些数字是重复的。例如上图中有三天的数据都是100。

  大多数场景下,我们会使用均值,因为均值的优势远胜于中位数,均值对于抽样数据来说更稳定,但是如上文所述,均值也有缺点,当样本数据中存在异常值时,均值会被异常值带偏,在这样的场景下则可以使用中位数来表示典型值,因为中位数总是稳稳的站在样本数据的中间。此外除了我们讨论的均值、中位数外,还有一个平均数:众数,适用于一个样本数据中存在两种类型的数据时使用,因为在统计埋点时均为一类一类的统计,不存在众数的应用场景,所以此处不再展开。

  基于统计学上辛钦大数定律:可以用样本的平均值去估计总体平均值,作为理论基础,解决了为什么能利用局部数据代表整体趋势的问题,其次解释了局部样本数据取数周期的逻辑,为各位看官在自己实际工作中灵活取样本数据的数据周期提供一些思路。并进一步通过利用统计学上均值与中位数找到样本数据的典型值方法,解决在一份样本数据中如何把握问题的核心抓住数据的趋势的问题,防止因异常值的影响对数据做出错误解读,使数据真正客观真实的反应趋势,进而解决业务问题,创造价值。

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立8年举办在线+期,线+场,产品经理大会、运营大会20+场,覆盖北上广深杭成都等15个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。

http://linkzoo.net/tongjituili/268.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有