数据变新闻的商业富矿 (转载)
发布时间:2011-11-16

作者:Helen Coster 2011-11-04 《福布斯》中文版2011年10月刊下

MarketBrief公司的软件,能够实时将美国证券交易委员会的文件汇编成新闻资讯

从12岁那年购入第一支股票开始,朱驰拓(Jason Zucchetto)就一直痴迷于美国证券交易委员会(SEC)的文件。2009年,朱驰拓同朋友奥尔(Christopher Auer)筹集了25万美元,开始每月支付证监会3.2万美元,以实时获取公司文件。他们当时的目标是采用更易消化的格式将大量的数据重新进行组织,分析师和投资者每月支付200美元就可对那些经过重新组织的数据进行访问。尽管他们的网站使用简单,但分析师和交易员都太过忙碌,没有空去他们的网站中翻箱倒柜寻找数据。一年后,两人的资金耗尽。

后来YC公司(Y Combinator,支持初创科技企业的孵化器)的创始人格雷厄姆(Paul Graham)加入了他们的行列。在格雷厄姆的力劝之下,朱驰拓和团队设计了新的软件,该软件在收到文件后3秒钟之内就能自动汇编出结构完善的新闻资讯。截至目前,他们的公司MarketBrief已经有1.2万名个人订阅者。在这篇故事付印时,今年31岁的朱驰拓正在与一家大型媒体接洽。似乎记者们不曾为保住饭碗而经历过异常艰苦的时期。
 
MarketBrief网站提供服务的过程是这样的:
第一步:运行于亚马逊云计算(Amazon Cloud)平台中的 10 台服务器会在上市公司向SEC提交文件时实时抓取这些文件,其中包括首次公开募股(IPO)文件、内部股票销售以及年报等。
第二步:软件会判断抓取进来的文件属于500类SEC文件中的哪一类,然后将其传递到该程序的另一部分进行扫描。
第三步:软件通过运算法则提取出多达 1,000 条信息(姓名、数字、日期和股价等),并将这些数据插入到类似于疯狂填词(Mad Libs)的模板中。
第四步:根据顾客在注册时指明想要接收的文件类型,软件在3秒钟之内将分析所得的文章推送给媒体或对冲基金——比任何手上还粘着墨迹的记者的速度都要快。
标签:YC公司 朱驰拓 美国证券交易委员会 格雷厄姆 亚马逊云计算

–转载于 《福布斯》

分类: 公司博客 标签: