分享一篇来自创新工场用户体验总监吴卓浩关于如何基于数据来做用户体验设计的文章,希望对各位同学有所启发。

要找多少用户做测试才够? (研究得出)一条曲线,横轴是代表测试用户的数量,就是你测试了多少用户,纵轴就是你发现用户遇到的问题或者说用户遇到的困难,发现新问题的数量,你会发 现这个曲线随着用户数量的增长,这个曲线逐渐趋于平缓,而它真正变成平缓的是在哪里?大概十个人左右。当然,这里的前提是你所找到的测试的这十几个人都正 好是你的目标用户。 – 创新工场用户体验总监 吴卓浩
设计和数据的一个故事

首先我想从一个故事讲起,大家记不记得曾经当时是在08年,当时在硅谷闹得沸沸扬扬的有件事,就是有个Google的设计师,实际是Google当 时的视觉设计负责人他离职了,离职之后,他在自己博客上面公开发表了一篇文章攻击Google,说Google这个公司只信数据,完全没有设计师的空间, 完全没有设计师的自由。这件事情甚至被像纽约时报很多大媒体来转载,当时在整个美国设计界,尤其在硅谷都掀起轩然大波。这件事大家有没有听说过?首先我是 很尊重我的这位同事,他最开始是Blogger设计总监,Blogger被Google收购之后,他加入Google,他离开Google之后,现在他是 Twitter的设计总监,是一个非常有天赋,并且对设计非常有热情跟执著的设计师,我非常非常赞赏他。但是在这件事情上,我倒是觉得我应该是和 Google站在一起的。

当时他在写攻击Google一篇文章当中,举了几个例子,尤其一个最典型的就是Google的搜索页面中间链接是蓝色,我不知道大家面对这样一个问 题,怎么样选择一个链接的蓝色,我不知道大家会怎么样处理。但是按照Google当时的做法,他一共试了约43种不同的蓝色,让在线的真实用户可以使用, 然后根据用户的使用情况来做的决定。他觉得这件事情太荒谬了,觉得应该直接由设计师挑选一个最能够代表设计品位的蓝色。但其实大家想一下,对于使用这个产 品的用户,虽然说设计师可以挑选一个很有设计品位的蓝色,但是他怎么知道用户是使用什么样的电脑显示器,使用什么样的操作系统,在什么样的比如说光线暗还 是光线亮,是在室内还是室外,他的显示器年头是新的还是用了很多年的,所以其实设计师或者说产品的开发者这一关,你是没有办法知道用户所处的真实环境。所 以那种精英制的设计或者说开发者来替用户做决定的这种方式,并不是在所有的情况下都适用的。在这个例子当中,Google通过他自己很工程化的一种实验方 法来做的决定。我把它看作是什么?我把它看作是一种用户的群体性选择。一定不会说绝大部分用户使用下来发现这一种蓝色表现就是最好的,一定不会是没有原因 的,这种其实就是所有的使用用户在他们所使用的环境下所做的一种群体性选择。所以其实从这个角度来说,设计和数据这两件事情其实真的可以不是,也不应该是 一场战争。全看咱们怎么去用它。

定性数据

定性数据通常是指什么?通常是指你取一定的样本量,不会太多,不会说是成千上万的,但是又不是像一两个所谓的专家数据,通常会是几十个量级,得到一 些你对这个产品的想法的验证,从而帮助你尽可能及早弄清楚你产品的方向。我举个例子,比如说当大家看到这张图的时候,我想问一下大家是看在哪里,这是一个 很严肃的问题,可能会有的朋友说,我看到他这个头发颜色很漂亮,身上有很漂亮的纹身,嘴笑得很开心,可能会有朋友这么说。但事实上如果咱们用专门的仪器来 跟踪一下大家的视线,你会发现这是真实的情况。实际上是有一些工具能够帮助大家把用户他自己不愿意表达,或者没有办法表达清楚的事情,清晰地展现出来,这 个就是一个很典型的定性研究的或者说定性数据分析起到的作用。当然这个定性研究里面还有很多其他的方法,比如说像观察法,咱们去找到这个目标用户,跟踪他 一天的行为或者说他一段时间内的行为,来看一看他是怎么样工作,怎么样生活的。而不是说你听这个用户说,我一天会用你的产品十多次,但你实际跑去看的话, 发现他其实一次都没用,或者说十多次只是打开看一下并没有真正使用。然后也包括像用户访谈、焦点小组等等,这些都算是比较经典的定性研究,或者说获取定性 数据的方法。像这个例子叫视觉追踪这样的方法,在做定性研究的时候其实我所经常看到的是另外一个误区,就是大家会觉得,有的人会觉得定性研究因为它的样本 量很小,一共才那么十几个人,它究竟靠谱吗?是不是其实做了跟没做其实没什么两样,因为你样本量这么小,其实它不能够代表最大量用户的真实情况,会有人有 这样的看法。或者说另外一个极端是,有人会觉得要做研究,我们一定要很严谨,你十几个人的量可能不行,我必须要做到几百人,所以这样投入很大,时间、金钱 投入都很大,我也没法做,干脆不做了。其实这里有一个经验数字。有一条曲线,横轴是代表测试用户的数量,就是你测试了多少用户,纵轴就是你发现用户遇到的 问题或者说用户遇到的困难,发现新问题的数量,你会发现这个曲线随着用户数量的增长,这个曲线逐渐趋于平缓,而它真正变成平缓的是在哪里?大概十个人左 右。这有个前提,你所找到的测试的这十个人或者这十几个人都正好是你的目标用户,你并没有找错人,不至于说明明是一个给白领用的产品,然后你去找了一个比 如说刚刚从工地回来的农民工,或者明明是给一个孩子用的产品,然后你找了一个大人,这样肯定不行。如果你能够比较准确地找到目标用户来做你产品测试的话, 通常来说当做到十个人左右的时候,其实你产品当中的主要问题都可以被发现。这个根据不同的产品在过去的经历当中,根本不同产品的情况,有的时候它的趋于平 和的曲线是停在70%左右,有的是停在80%或者90%左右,但基本上它会趋于平缓。在这个之后,你再做更多的用户,其实给你带来的价值就并不是特别明 显。

当然,实际上大家在工作当中还会经常遇到的是,其实你并不是特别清楚自己的目标用户是什么样的,或者说你是在找用户的过程当中逐渐摸索目标用户是什 么样的,在这方面我也有另外一个经验数据,因为我有很多朋友在世界知名的设计公司,他们所得到的经验数据是,在一边寻找目标用户,一边明确目标用户来做研 究的这个过程当中,总量大概四五十个用户就可以达到类似这样的效果。所以其实大家看这件事情并不是像大家想象的那么夸张,那么可望而不可及,就好象只有大 公司才能花大价钱请到心理学的博士,请来几百个用户来做,其实真的不是那样。尤其是对于咱们可能规模稍微小一些的团队来说,如果说你能够把定性的数据和定 量的数据结合起来使用,往往会得到非常非常好的效果。

定量数据

定量数据其实是真正只有在进入了互联网时代之后才有的一种奢侈。大家想象一下,在过去比如说像九几年甚至包括像两千年前后,那时候微软这个世界IT 界软件行业的巨头,他在做产品的时候比如说office这样的产品,他们在做用户数据获取、用户研究,并且以此做分析来改进产品。他是什么状况?花大概半 年的时间,就是请一个专业的咨询公司花大概半年的时间做数千个用户的访谈和调研,收集数据。然后再花将近半年的时间整理数据,反馈给产品研发团队,改进产 品。所以传统的研发过程它的周期真的就是用年计的,但是当进入了互联网产品时代,其实有一个巨大的好处给大家,因为互联网产品它的数据都是实时连通的,这 意味着开发者可以得到快速、大量、真实的用户数据。这三个非常非常关键,快速的、大量的、真实的用户数据,这个意味着只要咱们这个产品当中做好了准备,每 一分每一秒用户使用的情况,都可以成为你下一个版本改进的依据。而且甚至这些做互联网的人到今天,他们也正在去影响着很多传统行业,比如像手机行业里面以 前是做市场的人员来主导的,因为对于手机公司来说,做市场的人员看起来是离商品销售距离最近的。他们跟店员接触是最紧密的,所以他们应该来决定做一个什么 样的手机,有什么样的功能,甚至长什么样。但是反过头来大家再看传统的手机行业到今天已经溃不成军,正是因为有互联网产品的思路正在进入到传统的手机领域 当中,彻彻底底地在改变这个领域。

在定量数据获取当中或者定量的研究当中有这样几个主要的方法,

  1. AB测试 – AB测试就是上线几个不同的版本,然后让用户去使用,通过比较用户所使用不同版本之间的差异来弄清楚究竟哪个好。做AB测试这里面其实也是有几个关键点, 第一个就是AB测试的这两个版本一定是利于比较。比如说它可能是所有的指标当中只有那么一个或者是很少几个有区别的,其他大部分都作为控制项是相同的。因 为只有这样才能知道究竟是哪个因素在起作用,像有的经验不是太丰富的团队他们会憋大招,就是一个版本里面有很多很多的改进,很多很多的革新。如果是这种情 况,经常就遇到你看到这个数据不管是好的还是坏的,不知道是因为什么,因为中间发生的改动太多了。所以真正有经验的团队会是用短平快的方法,很快的一次改 一个,一次改很少的几个,然后来做比较,发现哪个更好确定下来,然后再有新的测试和记录。当然如果说在更高深一点,其实这个实验还可以被设计得更加巧妙, 你可以把你的数学模型设计成,的确是你同时测试了好多个不同的属性的变化,但是从数学模型的角度来说是可以把这些不同因素之间的相互影响分离出来的,这样 其实也可以。但是对于大家来说,可能最开始作为起步还是短平快的方法,一次只比一个或者很少几个,这是AB测试快速试错的方法。
  2. 百分之一测试 – 百分之一测试它的本质是什么?本质是说我控制一小部分用户,但是又足够量的,控制一小部分客户来使用我们的新版本或者新产品,然后得出反馈帮助我改进。这 个做法其实最主要的就是说避免一下子影响到太多的用户而产生不可控制的后果。比如像在早些年其实用百分之一测试用得最好的首屈一指的就是Google,对 于Google来说,一年当中可能会有几千个这样的实验上线,然后会有几百个或者说几百次对产品的改进,仅仅对搜索而言。Google有那么多产品线,还 有更多更多。像今天大家可能会更熟悉的是像Facebook甚至把这个作为一种标准的上线机制,就是它的系统设计成为就是可以同时支持很多个不同的控制实 验,所以它可以帮助我公司产品当中有很多的实验性功能,或者是新的产品特性,可以同时以少量用户测试的方法来进行。然后实验数据好我就作为正式产品上,实 验数据不好我就把它收回来,重新改进。当他做成是一种大规模自动行为的时候,就出现了一个巨大的益处,就是你的产品新功能的改进、提交、发布变成了一项非 常非常顺畅,不用说再像以往那样好象特意准备一个月,实验两个月,再调整一个月。反过头来看起来好象你是用了快速的方法,但实际上还是要经过两三个月才能 上线。对于facebook他把整个产品基础架构设计成可以同时进行大量少量用户控制实验的这种结构,对于它的产品迭代改进非常有好处。
  3. 对于这些数据的解读 – 其实数据是中性的,一个数据出来很少有那种,当你看到这个数据就可以很清晰地判断说,这个数据究竟代表着好还是代表着不好。大部分情况下,其实你需要首先 确定的是你这个数据分析的目标,比如说举个最简单的例子,大家说一个网页用户来到这个产品上面,一个网页产品用户来到这个页面上,究竟是快快的离开好还是 停留的时间久好,其实这两个没有绝对的标准,完全要根据你产品的目标来定。比如说如果像新浪这样的门户或者说像新闻类的产品,可能大家希望用户来到这个页 面多停留一会儿。因为这意味着用户在上面有很多的浏览,但是如果说对于Google搜索页面,停留得久意味着灾难,意味着产品质量不好,设计不好,不能让 用户很快地找到他想要找的结果,马上离开。所以你的产品的数据,千万不要把数据当做所谓的万能的,看到一个数据就可以很快下结论,真的不是这样。首先你需 要明确的是你数据分析或者你实验的目标是什么,然后根据这个再来选择说我看哪些属性,用什么样的数学模型来做分析。这个真的是一件技术活。

数据是中性的,定性和定理需要结合

定性和定量之间为什么要结合,也是因为数据是中性的。其实你经常会发现你看到了一个数据,发现这个产品某个使用量、流量上升了,但你真的不知道是为 什么,这时候就特别需要什么?你可以找到你的目标用户去了解一下究竟发生了什么,你比如说可能在哪一年的时候,就是在Google曾经有一次发现在中国某 一个省份搜索的流量突然一下到底,变为零了。如果你光看这个数据,其实你是没有办法得到任何结论性的东西,你可以有很多猜测,但你不知道真正发生了什么。 但如果说你这时候去想办法找到目标用户,在当时那个情况下找到那个区域的用户,你会发现原来是被断网或者原来地震,数据这个东西就是中性的,你需要用其他 的不同的方法来真正地去分析数据,得到有意义的结果。所以其实这就是咱们刚才所说的从专家到定性到定量这样一个过程,同样的你看像定性这样的工作,其实对 于常规来说一个小团队其实很难做。为什么?因为一方面是没有这样的技术能力,因为涉及到要在产品当中合适的地方埋数据采集点,另外可能没有分析的经验。但 其实对大家的好消息,其实是有一些专业的工具来帮助大家来做这些事情。比如如下大家做的是网页产品,就可以考虑用Google的analysis,如果大 家用的是移动互联网的产品,其实就可以考虑像友盟这样的工具,其实是有这样合适的工具可以帮助大家在没有经验或者说还没有技术能力的情况下,同样做到这样 的效果。

不做用户研究?!!真的吗?

包括像乔布斯,还有包括像有一些很牛的大公司,像宝马、保时捷他们曾经都不约而同的说过一句话,说我们不做用户研究。大家觉得这句话应该怎么样去解 读才好?一方面是在传统的产品研发或者说设计领域,他们没有像互联网这样有利的工具,可以帮助大家迅速获得大量真实的用户数据,没有这个好处。另外一方 面,这些设计很牛的公司他们的确是有牛的道理,就是他们的确是不需要专门再去做用户研究,因为他们的设计师本人就是超级用户。他们已经比普通用户还要更了 解用户,这一点是在他们长期的积淀下达到的这种境界,就是他们拥有了对用户的洞察,或者说他们拥有了能够做出正确判断力这样的能力,这是很了不得的事情。 但是大家也不需要迷信,比如说你像苹果公司他们有些设计师,他设计应用界面很牛,可是如果你让他设计一个电蚊拍,你看他要不要做用户研究!

做人要厚道,转载请注明文章来源: https://www.boxui.com/ued/user-research/1950.html