EN
【原创研究】九万里风鹏正举 ——我们眼中的大数据产业图谱和投资机遇
来源: 苏泊尔产业资本-陈天伦日期:2020-08-01浏览量:457

导 读

 

数字经济数字中国新基建之母”……在数据爆炸的时代,耳熟能详的大数据Big Data)产业正在快速地飞入百姓寻常家


我们站在当下,大数据正与人工智能、物联网等新一代信息技术加速融合和创新,改造旧产业、赋能新场景;我们眺望未来,万物互联的世界已成为秩序井然的数据地球。每一瞬,无穷尽的大数据都在疯狂地孕育、生长、储存、奔跑、转化和跃生价值。目光所及之处,大数据无所不在,俨然成为铺设未来世界的


大数据产业到底发展到什么阶段了?如何看待和把握大数据产业的投资机会?让我们通过产业图谱研究的形式一探究竟……


 

 

一、理解大数据产业


1)“大数据”溯源


根据Gartner对于大数据(Big Data)的定义,大数据是指基于新的计算和处理模式才能具有更强决策力、洞察发现力和流程优化能力,以适应海量规模、高增长率和多样化的信息资产。

我们眼中的大数据,其本义是通过对来源分散、数量巨大、格式多样的数据进行采集、存储、处理、分析和应用。从投资的眼光来看,“大数据”本身不具备价值,而产业化后为决策主体实现降本增效、发现知识、创造价值的目的,才是真正的“大数据”。


2)大数据产业图谱研究


大数据产业是数据的生命跃动,绘成一条完整的河流。自上而下俯瞰,数据诞生伊始往往经过采集、存储、处理和应用的不同阶段。



我们在研究大数据产业的时候,不可避免地需要回答三个问题:


1)数据从哪儿来?


2)从此岸到彼岸,数据需要流经何处,经过哪些程序?


3)数据到哪儿去?换言之,数据怎么用?


我们眼中的“大数据”无论流向何处,最终目的是为决策主体达到发现知识、降本增效、转化和创造价值的目的。在概念盛行的当下,我们拒绝标榜“伪大数据概念”的“唯大数据论”,更拒绝为了“大数据”而“大数据”——“大数据”需要场景,需要底层客户为之买单,更需要从需求出发构建完整的产业生态体系。进而,观察大数据产业离不开“降本增效”的终极逻辑。这也成为我们观察大数据产业的基础框架:



二、数据从哪儿来?



前端自然数据的采集与人工智能、物联网行业多有重叠和交集:


1)根据Gartner技术曲线,传统感知技术基本成熟,而以智能语音交互为代表的新一代智能技术已率先进入规模化产出阶段,建议关注龙头上市公司的二级市场投资机会;


2)随着5G、物联网的全面铺设,海量数据采集正面临全新的技术标准和场景需求,底层技术能力的螺旋式上升将推动新一轮感知和交互技术迭代。建议关注符合相应技术制式和规范的新一代传感器和计算机视觉行业。


社会性数据采集往往与数据处理、数据应用相辅相成,或来自于底层的数据应用场景,或来自于数据流动过程中的某一参与方(如数据运营服务企业、数据处理企业)。


经过前期的信息化发展,数据存储和应用在技术层面逐渐建立了基础能力,我国的信息化水平甚至已走在全球前列。未来,从“信息化”迈向“数据化”的第一步,是在合规前提下实现充分的数据交换、共享、交易、流通,以消除“数据孤岛”。未来可预期的时间范围内,数据开放和共享的大趋势不可逆,但目前尚未建立以合规为前提的数据交易和流通机制。因此,下一个十年是大数据产业建立流通规则、保护有条件隐私、完善合规秩序的升华期。大数据产业链的各个细分卡位,都会受到数据合规性调整和管控对市场运作逻辑的影响。


除了极少数政府直接干预或涉密产业,也许未来将不再有任何数据“孤岛”。长期视角下,仅掌握单一数据源壁垒的企业往往无法形成清晰的盈利模式,且护城河在趋势性降低。我们建议关注:1)数据合规对于数据产业的系统性改造,以及该逻辑下数据安全市场的平台性增长机会;2)数据开放和共享所带来的细分行业机会,如数据处理、数据流通和交易、数据中台等细分行业机会。

 

三、数据流经何处?




四、数据存储:技术边际创新下的巨头升维竞争,龙头格局已现


数据存储是多个科技领域的底层基础产业。哪里有数据,哪里就有存储——我们常提到的大数据、云计算和数据中心、人工智能、物联网,都需要数据存储系统和服务以支撑其行业底层架构的运转。定性来看,只要下游挂钩的行业不萎缩,理论上数据存储的空间会不断扩大。换言之,数据存储的行业潜在空间大、市场需求刚性、技术和政策驱动力相对充沛。据IDC,全球2020-2025年数据存储行业每年市场空间的增量均在2500亿元以上。


在数据产业过去的发展过程中,作为底层支柱之一的存储行业已经基本形成了行业竞争的基础秩序,主要技术路线逐渐走向成熟。无论在前端的存储半导体和介质(MarvelPMC、三星、海力士),中游的存储整机(Intel、三星、西部数据)和解决方案,亦或是下游的存储系统(EMCIBM、华为、曙光/浪潮)和云服务(阿里、腾讯、AWSGoogle、微软),全球范围内已经形成了相对稳定的巨头竞争格局。


由于存储行业的前端属于典型的技术和资金密集型产业,行业呈现轮动化的持续投入、高资金消耗和高技术壁垒特征。尽管在“云--端”架构革命中,涌现了计算存储(CS)、软件定义存储(SDS)、边缘存储(Edge Storage)等新兴技术创业浪潮,但各大巨头在存储介质、半导体和整机产品的技术革新从未停止过脚步。



数据存储的产品和技术迭代趋势一览



5G 时代的“边缘云”成为市场趋势,传统“云-端”的链接结构可能更为扁平化、分布化,从传统的集中式架构向分布式架构进行演进,衍生“云--端”的全新通信网络结构。在数据存储的设备和解决方案层面,存储芯片、算法和设备供应商也正在积极迎合“边缘泛在化”的趋势——其本质是在边缘端充分体现“计算泛在化”能力,在摩尔定律不断放缓的现在和未来,提倡从单一存储到计算存储(Computational Storage)的解决方案。


通信网络的“边缘泛在化”:从“云-端”到“云--端”


 

边缘计算的前提是边缘存储:从“单一存储”到“计算存储”、“软件定义存储”


“所有人都关心你飞得高不高,却没有人关心你飞得累不累”——这句话尴尬地映衬了当下存储行业的现状。性能与价格是中国乃至全球90%+的底层客户在采购存储系统时最为关心的两项指标,采购部门对“物美价廉”的需求程度超过任何一项指标。很多企业对价格、参数、指标的关注,已经超过了数据存储的技术收益,比如——我们真正需要的容量是多少?这些设备能否满负荷运转?耗电成本如何计算?技术路线的迭代和更新是否是冗余或没有必要的?我们额外创造的收入能否覆盖高昂的技术成本?



技术不是评价存储的唯一指标,甚至已经不是优先指标。在苛刻的产品化道路上,全存储行业的马太效应仍在加剧,行业资源进一步向中国(长江、华为等后起之秀)和国际的头部企业靠拢和集中,新进者的技术优势往往无法通过实现产品化和市场化以有效维继。我们不断看到存储巨头的技术升维竞争正呈现“军备竞赛”之势,而中小型企业的市场话语权和胜出概率相对不高。

 

数据存储终仍演变为巨头之间的博弈游戏,建议关注二级市场龙头公司的技术边际创新和市场应变能力,以及相应的并购重组机会。

 

五、数据处理:下一个十年是实现数据价值的十年,须突破核心中间件的掣肘地位


一如我们眼中的大数据产业,数据本身没有价值,只有经过清洗、挖掘和处理分析,数据才能实现相应的经济和社会价值,达到帮助决策主体发现知识、降本增效、创造价值的目的。数据清洗和预处理、挖掘、处理和分析,是数据流动的核心中间件,亦是数据价值的实现工具和路径。下一个数据产业的十年,数据核心中间件的地位会进一步上升。


核心中间件包括ETL工具、数据仓库/数据集市、元数据管理、OLAP Tools/Server以及前端的查询、分析与挖掘、报表和可视化等组件构成。BI组件可以分为商业产品和开源产品两类,商业组件多集中在分析/挖掘报表、报表、可视化、ETL等领域,这些领域通常是性能要求高或者对业务变化比较敏感的部分。


从工具角度,开源产品是主要的同样也是行业公认的技术方向。ApacheHadoop ImpalaHiveDrillAtlasKylinSuperset几乎涵盖从存储到分析的大部分模块,此外OracleClouderaAirbnbPivotalHitachi等企业也贡献大量开源力量,由中国团队主导的Druid(阿里云)和Kylin(前E-bay)目前已经成为主流的OLAP开源工具。但开源产品主要应用于互联网公司(如快手、美团等),如果没有专业维护团队,开源产品并不能满足业务部门的需要。

 


数据清洗和挖掘产业,包括语言和技术工具、数据库、基础管理软件,仍大部分掌握在国际玩家手中——为打磨安全、可控的数据产业命脉,国家近年来加速推动了去“IOE”的速度和实施力度,也为国产数据中间件企业提供了前所未有的发展机会。

 

 

六、数据到哪儿去、怎么用?



数据处理和应用服务在我国仍处于初步阶段,但也是数据产业中成长空间最大、预期增速最快的领域,原因系互联网自“流量时代”进入“数据时代”,数据应用和服务领域的市场渗透率提升有爆发式预期。


在过去十年内,我国通过高速的信息化建设建立了不同行业的“数字雏形”,储备和积累了大量数据,但实际数据的应用渗透率还不足1%。这意味着,信息产业的后继发展将围绕数据作为生产要素的市场化配置、场景应用和解决方案所进行,传统“信息化”将加快转型为“数据化”,大数据的实际应用价值“厚积薄发”。


1)行业大数据:短期视角下,买单逻辑强迫政府、金融大数据快速变现


我们眼中的“大数据”无论流向何处,最终目的是为决策主体达到发现知识、降本增效、转化和创造价值的目的。“大数据”需要场景,需要底层客户为之买单,更需要从需求出发构建完整的产业生态体系。进而,观察大数据产业离不开“降本增效”的终极逻辑。


现阶段,以政府和金融机构为代表的底层客户初步具备了买单意愿和买单能力充足的条件,政务大数据和金融大数据合计占据了数据应用和服务约60%的市场份额——且在相当长的时间内,政府和金融大数据预计仍将保持领先优势,进一步打磨相关数据应用和服务的产品化、标准化、规模化能力。

2020年行业大数据应用和服务市场占比

 

 

2)企业级SaaS市场机会凸显:基于中美比较的企业数据化投资机遇


市场的所有需求,源头都来自消费者。在移动互联网风卷残云式的冲击下,消费者的需求基本得到最大程度的释放,2C行业得到较为充分的成长——过去的20年是中国消费级SaaS增长的黄金20年。基于商业模式的创新,中国已经在消费级互联网处在了全球的顶尖水平,培育了包括阿里巴巴、腾讯、美团、拼多多、滴滴出行等在内的一众消费互联网巨头。事实上,我们在众多消费级SaaS领域,都已经超越了美国。





显而易见的是,中美在企业级SaaS层面仍然存在着不可跨越的巨大差距。在可触摸的当下,以及未来10年甚至更长时间内,我们认为消费级大数据的发展趋势正在向产业链上游传导,企业管理也正在从“信息化”向“数据化”、“云化”、“互联网化”演进,数据服务企业、数据改造企业、数据赋能企业,一个万亿规模的企业大数据市场正在渐行渐近。令人期待的是,中国企业服务市场也会涌现出可与Salesforce等所抗衡的“To B 巨无霸”。




相比2C业务,企业级服务增长更可靠。与消费者相比较,企业客户粘性更高,且一旦实现产品化,企业级SaaS的业务会相对稳定。从“本地化”到“全面云化”,与传统模式相比,基于云计算的企业级SaaS交付模式具有三个显著特点:1)适合移动终端;2)初始部署成本低;3)服务收入可持续。传统交付模式中,企业较易发展为定制化的产品或服务提供商,容易陷入劳动密集型陷阱。而标准化程度高的产品更适合云交付模式,这倒逼了企业提高产品标准化程度,从而逐步摆脱劳动密集型陷阱。

 

企业级大数据领域,美股上市SaaS公司市值合计近万亿美元;而中国企业服务市场刚刚起步,未来将享有比美国同行更高的增速(据IDC,美国企业级SaaS未来十年仍保持20%以上的高速增长)。国内外企业的需求与决策链条相似,企业服务市场将出现Copy to China现象。

 


在大数据的下游应用层面,中国正在迎来企业级数据市场的爆发,带来企业级SaaS的充分增长。“云化”、“互联网化”成为不可逆趋势,人力成本持续上升,移动互联网的普及,都为中国企业级SaaS市场的增长提供了先天的滋养。

 

七、数据产业的平台性增长机会


1)大数据产业引领中国的生产资料革命,数据是未来十年的最重要生产要素


当我们畅想未来的ICT世界,物联网是万物连接的信息公路,人工智能是宫殿、城堡和围墙,而大数据是铺设未来世界一切可能的“砖石”。从某种意义上,人工智能、物联网、大数据,分别代表着生产力、生产关系和生产资料的变革——展望未来十年,数据将成为最重要的生产要素。

 

 

 

 

2020330日,国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次明确“数据”成为重要生产要素,标志着在接过“信息化”的大旗之后,中国将进入由真正的“数据化”引领的新基建革命之中。

 

2)海量数据爆炸的时代里,中国已成为全球最重要的数据增长极


根据IDC,近5年全球大数据储量的年复合增速保持在40%以上;预测未来五年内,全球大数据储量规模仍将保持40%的高速增长,持续呈现爆炸式增长之态势。2018年,中国的大数据年产生量首次超过美国,成为全球最大的数据产生国;预计到2025 年,中国年大数据储量的增量将从不足10ZB快速增长至48.6ZB成为全球“大数据”的绝对增长极。



   


在国际形势风云变幻的当下,数据是核心资产,数据产业是未来之锚。面对“圈层化”的国际竞争,我们必须掌握核心生产资料和自主经济命脉。为打磨安全、可控的产业经济体系,“大数据”产业将成为国际博弈的一颗重要棋子。

 

八、写在最后:观察大数据产业的底层逻辑

 

结合我们的大数据产业研究图谱,以未来的视角眺望大数据产业的发展逻辑,我们总结了若干核心底层观点:

 

大数据产业“九万里风鹏正举”,而这对我们而言是无比兴奋和激动的投资窗口期。站在彼岸回顾当下,大数据产业固然“路漫漫其修远兮”,但已经出现了趋势性的变化。与苏泊尔产业资本“吾将上下而求索”,共同探索大数据产业的投资机会。