热点滚动 :
当前位置 主页 > 行业数据 >

关于数据分析软件市场这八大苗头才是真正的

  秒速赛车由于大多数公司客户终身价值对客户流失的敏感度,2016年看起来会是数据分析软件公司需要系好安全带准备迎接大风浪的时间。

  紧张精彩的2015年已经结束了,现在是时候回过头来看一看数据分析软件市场的潮流。已经有几个趋势继续变得壮大(比如开源,云托管,基于Hadoop的SQL解决方案),同时AWS上的Redshift开始成为数据仓库中的一支重要力量。

  除了Spark,大部分Hadoop的生态系统里的新闻都来自Presto,ImpalaandDrill。关于MapReduce继任者的斗争还在持续,而在列表中的所有候选者的一个主要的共同点就是他们都提供SQL界面。这个趋势从2010年Hive开始逐渐取代Pig就一直如此。

  因为太多的Hadoop生态系统提供的价值围绕在分析和商业智能上,而过去数十年整个分析世界已经运行在SQL的基础之上,并且围绕它建立了很多无法替代的公司竞争力,所以在经过了很多关于NoSQL和Hadoop的憧憬以后,大家发现还是要回过头来面对这个事实。

  在主流的大规模基于内存的OLAP数据库中,LinkedIn的Pinot和Metamarkets的Druid是两个主流选择。Druid似乎从Yahoo得到了不少关注,而且不少最前沿的高科技公司也开始越来越多地使用它来驱动实时商业智能(BI)。

  十月份,Druid一些主要贡献者宣布了Imply.io,一家为Druid提供商业支持及打造出围绕Druid的生态系统的公司。总体而言,很多聪明人开始用Druid来做内存数据库,以便对海量数据集进行交互式分析。

  十一月,谷歌开源TensorFlow,一个利用数据流图谱进行计算的广义库。它被大量用于机器学习,特别是深度神经网络。它还在加盟了十一月微软发布的Theano,Torch,DMLT。

  虽然上面提到的这些库不是可以把人工智能添加到任何产品的简单插件,但是以他们为基石任何有足够多的数据的人都可以来训练他们的系统来制造最先进的算法。当大家都开始在基石上建造,产品的整体复杂性,无论是分析相关还是其他方面,都会不断提高。

  6月,IBM宣布把3500研发人员放在Spark相关项目上。Spark是在许多方面是Hadoop的生态系统里的MapReduce的继承人。它为开发人员提供了四宝(低级别数据处理语言,机器学习库,图形算法和SQL-on-Hadoop数据库)来进行数据的混合及匹配。

  虽然仍然在用户实践的最初阶段,Spark已经得到了背后庞大的开发者的支持。十月份,IBM宣布了基于Bluemix的Spark-as-a-service,并且把其数据工程产品移植到Spark上。这件事情对以开发ApacheSpark为主业的Databricks公司的影响十分值得关注。

  从历史上看,开源软件的创新基本上在软件堆栈的较底层。随着时间的推移,以及对开源软件企业可行的商业模式的的发展,越来越多的面向最终用户的软件正在以开源的方式进行开放。

  去年,两个古董的开源BI公司之一的JasperSoft被Tibco以$1.85亿美元收购。另一个公司,Pentaho,则在前年2月就被日立数据系统公司以超过$5亿美元收购。

  同时,在2015年还涌现出了多家轻量级的开源项目。AirPal和Re:Dash把重点放在使用户能够快速,轻松地在Redshift上进行SQL查询(详见下文),而Metabase还提供了一个非常易于安装的工具,允许非技术用户对多种数据库进行数据查询和分享数据报表。

  虽然GoogleAnalytics仍然是大家默认的首选,仍然有很多人致力于开发以收集并分析在网站和移动应用上的用户行为为中心的,集所有功能于一身的分析系统。

  与此同时,作为GoogleAnalytics的主要竞争对手,Mixpanel(截止去年已募集$6.5亿美金),于去年7月跟随Heap公司的脚步,关于数据分析软件市场这八大苗头才是真正的大势所趋!发布了CodelessAnalytics。它主要是通过添加SDK到您的移动应用里,自动对移动应用进行数据埋点,并同时获得对用户行为事件的分析,而无需手动对特定事件进行埋点。十一月,该公司发布了Predict,它可以让你使用轻量级的机器学习来预测用户是否会执行一个动作(如转换付费)。

  与此同时-Heap已经因为它在移动和网络事件的数据分析上的简单易用性而获得了一定的知名度;Amplitude在八月融资$9百万美元;而以增快数据分析速度为核心业务的Interana也在一月份A系列融资$2000万美元。

  同。

相关文章