研究驱动型创业公司
作者认为硅谷正在重归以研发为重的传统,并认为创业公司应放弃追求完美的开局,从尽早发布可用的产品做起,待获得用户和风险投资后,再深入研发不迟。
英文原文:http://measuringmeasures.com/blog/2010/7/2/research-driven-startups.html
硅谷的根基是研究,而 Web 热潮已将它改变为消费媒体软件。像 Facebook 和 Twitter 这样的公司从简单的程序造起,获得投资后再招募研究人员。
不过,我想我们可能正处在数据与研究复兴的启蒙时期。
我们正看到越来越多的研究驱动的数据类创业公司。我们正看到越来越多的类似 Facebook 和 Twitter 这样的创业公司,它们初期不以研究和数据为重,但之后便需要通过研究或数据支撑其业务的个性化、精准广告投送、产品推荐、高级产品或其他形式的情报以转化成收入。
如果该假设是正确的,那么就需要了解如何做好这样的创业公司。
通过产品解决问题,以研究为基础,借数据处理推动
该类创业公司的存在价值一目了然。
收集并处理数据,接着从中提取信息,并通过研究获得有用的情报,再以此开发能够解决某个问题的产品。
问题 <- 产品 <- 情报 <- 研究 <- 信息 <- 加工 <- 数据
某些时候,我们只想到「信息」阶段,没有关系,「情报」的获得仍需深入的工作。
技巧
我们需要仰赖三大技能。
- 研究人员:机器学习,统计学,数学,计算机科学。
- 系统黑客:专注于数据储存、传送、队列、处理的计算机科学家和工程师,在许多情况下还需要分布式系统的技能。
- 前端工程师:设计师、交互设计师、JavaScript 高手、用户体验。
研究人员和前端工程师需专注于产品,而三者都需要专注于数据。
通过产品化消解复杂度
有一条数据护城河是远远不够的。
如果你是 B2B,你可以通过 API 将数据丢给用户,乐得清闲。如果你是 B2C,消费者才不想要什么数据,他们只希望问题能获得解决。
即使大多数 B2B,用户需要的也不是原始数据,而是经过加工后的数据。他们要的是何时采取行动的信号,而不是晦涩的概率分布。
人们通常玩不转概率论。见卡尼曼和特沃斯基的研究,以及他们的预期理论。
对于 B2C 来说,你得有一款可爱的产品。然后你需要从数据中获得信息,并自信满满的期待自己能够将信息加工成有用的情报。
那么这个领域内的大赢家,就是能把海量的数据和复杂度装入极简的界面之中。见下图 :p
先找到「足够好」的模型
研究驱动的数据型创业公司的资源往往重度受限。于是,先开发出一个「足够好」的而又简单的模型,借助这个模型发现问题,然后获得顾客的关注和投资者的融资,以及诸如此类的玩意。
对于这类创业公司,应该做到,在最优的解决方案出炉之前就要拿出产品来。有了足够好的方案,才能继续深入研究,并逐步成为最好的方案。
这是重要的观念,宜尽早考虑为妙。如果在同样的风险下,仅凭较小的边际收益便能击败标普 500 指数,你将会成为一个英雄。对于其他问题,只要你足够努力,自然能够解决。
如果结果必须精准无误,那么也许你想要解决的问题并不适合研究驱动型创业公司。如果你的项目只需稍作改进就能产生效益,那么正适合用来启动创业公司。
日复一日,你总会做的更好 — 完美的开局不足以让你押上全部的赌注。
从单个数据源开始
如果你把许多不同的数据源集成到单视图中用于创建你的特征向量,那么接着你也许会想以某个单一的数据源作为模型的基础,然后将其他数据源分次装入。
许多问题的模式相通:一个主要的密集数据源和几个增入主源的系数稀疏数据源。
如果一次整合过多数据,你也许会发现自己已被数据处理和转换的复杂度压倒,而这亦会伤及你的研究能力。也可能会限制你从数据源中提取信息的能力,因为不断的修改数据,你便很难专注于从每个数据源中提取信息。
软件开发的经验教训
早发布、常发布、多评估。没错 — 在做这些的时候你都可以继续研究。
那种认为可以肆意制定未来研究目标的看法纯属胡说八道。一步一个脚印 — 这种方法更好。
步伐可能会有所不同,时间也可能会有不同,而且也许有很多困难,但你仍可以步步为营。
是研究带我走入敏捷和 TDD(编者:测试驱动型开发,Test-Driven Development)。自从 2003 年以来,我一直这么做研究。TDD 是一门科学 — 提出你的假设,找到测试的办法,然后便去测试。
选定你的度量以及测试的方法。什么才是足够好呢?什么时候才能达到收益递减点?
不要想那些你死了后都完不成的东西。你要不断的告诫自己。
假设检验
请记住,在创业公司, 一切都是假设,而你的工作就是测试假设。
- 你可以从数据源中提取多少数据?也许你有大量的数据,但杂讯过多,价值过少。
- 数据的稀疏程度如何?那种极为详实但却罕有的数据源亦无助于事。
- 你能找到一个足够简单模型,能够迅速启动,并也能招徕用户吗?
- 你能利用那些从早期的「足够好」的模式所获得的收入来扩展业务或精进研究吗?
- 你的模型可以产品化或装入某个人们非常在意的服务之中吗?
创造解决问题的办法
回想一下,研究驱动的数据型创业公司获取数据,通过处理数据得到信息,接着在此之上研究出有用的情报,然后将它做成产品,解决一个问题。
此外,还请记得,在某些情况下,我们仅能得到信息,但这已足够。我们还有许多问题。有时候,情报部分不是十分必要,宁可早一些做出产品,不妨将解决的办法挪到今后。
为人们解决问题,请做一些研究吧。