EN
【原创研究】时光不语,静待花开——计算机视觉行业浅析
来源: 苏泊尔产业资本-张家祺日期:2020-08-22浏览量:579
计算机视觉是一门研究如何使机器“看”的科学,更进一步,即指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。



人工智能四大核心应用技术系计算机视觉、语音识别、自然语义处理、知识图谱,从人的角度出发,80%-90%的感知来自于视觉,因此在人工智能领域,计算机视觉是获得感知的最有效方式之一,具备极大的商业化潜力。随着5G时代连接、传输变得更快更稳定,更多信息将以视频的形式传输,进一步推进计算机视觉领域的发展,截止2019年,计算机视觉及语音识别在国内的市场规模量级分别在300亿元和200亿元。



早期受制于算力和算法的限制,计算机视觉并未得到很好的发展,但随着GPU及AI专用芯片突破了算力瓶颈,深度学习算法持续推进,伴随信息化时代数据的充沛,计算机视觉逐步起飞,到2015年ImageNet比赛中机器识别错误率以3.57%的成绩首次优于人类的5.10%。从Gartner技术成熟曲线看,计算机视觉逐渐走向泡沫化低谷期,在2-5年的时间内会逐渐成熟进入大规模应用阶段,其中的人脸识别等细分领域即将进入实质落地高峰,或许当下是一个介入的良机。








技术发展趋势



随着计算机视觉技术的发展,其识别的种类、精度都在不断推进,并逐渐衍生出了一些新的要求。



1)识别种类多元化。计算机视觉识别由早期的文字识别,逐渐向人脸识别、人体识别、不同物体的识别过渡,识别对象从单一走向多元,从静态走向动态,识别过程中对非自然光、暗部、远景等抗干扰性逐渐增强,进一步放大了计算机视觉下游应用领域的广泛度。



2)识别精度准确化。识别精度由早期的1:1,过渡至1:N,至目前的N:M,识别精度不断提升,从供给端拉动下游需求(以人脸识别为例,1:1即当前人脸与人像数据库的快速比对,应用在终端设备解锁等应用场景;1:N即系统采集图像与海量数据库中图像对比,查找相符合的图像,应用在小区门禁、新零售等应用场景;N:M即对场景内所有人进行面部识别并与人像数据库进行比对的过程,系一种动态比对,应用在公安布控、机器人等应用场景)。






3)运算架构“云边结合”。为降低网络延迟,提升响应速度,缓解网络宽带及数据中心压力,未来将由边缘端聚焦于实时、短周期数据处理;由云端(中心节点)聚焦于非实时、长周期数据处理。同时,嵌入式视觉将被更多的使用。



4)未来随着数据标注的自动化程度提高,将进一步提高计算机视觉识别效率,降低识别成本。



应用场景



计算机视觉在未来几年都将会是AI主要技术应用,从应用场景看,现阶段包括安防(城市及社区管理等)、消费电子、智慧物流、智慧零售、智能驾驶、医疗影像识别、泛金融等,就现阶段而言,由于安防具有场景明确、基础技术积累充分、下游市场巨大、政府政策鼓励等优点,系计算机视觉领域的核心应用场景,市场规模占比约70%:1)在技术成熟度上,处理安防影像的技术已经研发的较为完备,可形成显著的产业价值;2)行业指导性政策加快了人工智能技术的应用,如平安城市、雪亮工程等。但其余应用场景也在快速成长。



传统安防存在的问题:耗费人力物力,动态管理不足,缺乏关联分析。第一,单个案件侦破平均要调看3000小时录像,对警力耗费巨大。第二,传统安防侧重事后侦查,面临源头管理、动态管理不足,无法起到预防和实时发现的作用。第三,传统安防在后端缺乏关于数据之间有价值的关联的分析,缺乏数据共享应用。人、车、案、组织、地址等主题库建设与时空、全文、轨迹等专题库建设之间缺少关联性。而AI在弱人工智能时代即能有效解决市场痛点。



至2018年AI摄像头的市场渗透率约为9.5%,预计至2023年可达56.3%。






在下游需求旺盛的背景下,随着技术成熟带来的成本持续降低,计算机视觉在安防领域的市场空间将逐步放大,截止2018年市场规模约144亿元,预计至2023年可达1334亿元。






从市场玩家的角度看,目前行业主要有三类公司,第一类是以海康威视、大华股份为代表的,从后端设备和前端设备生产起家的传统安防企业;第二类是以AI算法为基础逐渐向软硬件和解决方案拓展的AI科创企业,代表公司有商汤科技、旷视科技、云从科技等;第三类是华为等大型互联网厂商。目前海康市占率约36.9%、大华市占率约14.7%、旷视市占率约7.4%。



三路力量虽各有不同优势,但逐渐走向同一层面竞争。对于AI科创企业,仅通过授权算法的方式难以实现规模的快速扩张,同时传统安防企业也开始自行研究算法,积极布局AI新领域。对于华为等互联网企业,单凭借技术优势与云计算等资源基础也难以实现规模化扩张。因此,AI科创企业和华为等大型互联网公司开始逐渐的由单纯的算法提供商向设备和解决方案的提供商转变。









大型互联网企业、知名科创企业的优势在于技术、ICT领域的经验以及云计算等资源。但中短期内传统龙头企业相对来说更具优势:



1)从技术上看,科创企业占据优势,华为也具备充足研发基础,但传统龙头在算法端逐渐赶超,软硬件布局逐渐形成完整生态,而在实际运营中,算法精度99.9%和99.91%的识别率差别并不大(宇视科技的计算机视觉与深度学习算法在MOT Challenge全球竞赛刷新最好成绩;大华股份人脸识别算法在NIST人脸识别竞赛自然场景中排名国内厂商第一)。



2)从渠道上看,海康、大华等龙头已经在全国大部分省份建立了业务中心,并不断实现三四线城市的渠道下沉,在国外覆盖的国家也均超过150个。相比之下,互联网企业多将安防作为众多业务之一,科创企业受限于规模,短期内难以实现规模化的渠道下沉。且传统龙头凭借多年积累,其解决方案与客户需求深度契合,并能够提供覆盖近百个细分领域的解决方案,而其他参与者在行业理解上需要长期的积累,往往也只能选择少数细分行业去覆盖。



3)从规模化能力上看,其他参与者缺乏硬件方面的大规模生产能力。在硬件智能化趋势的今天,拥有产能就意味着成本的优势,以及海外拓展的能力。



因此,短期看传统产业龙头在AI赋能下的转型或许是更好的投资机会,但这也并不意味着行业格局在长期视角下一尘不变,如:云从科技的跨镜追踪(ReID)技术能够识别人的服装穿着、体态与发型等,主要解决跨摄像头跨场景的情况下行人的识别、追踪与检索,同时其新推出的“炬眼”AI智能相机,影像处理速度首次降至毫秒级,并一举达到了0.05秒。AI龙头凭借解决实际需求的技术创新仍有可能实现弯道超车。



同时,除了现阶段核心的安防市场,仍有包括消费电子、智能驾驶、智慧物流等在内的计算机视觉应用场景等待爆发,以消费电子为例。







拍照功能、效果成为换机主要因素,有望促进AI应用的深化。目前视觉处理在手机中的应用从最初的智能相册转化到更高频次的人脸解锁,技术也从初步应用走向支持3D Sensing等复杂运用。根据艾瑞咨询调研数据,95.9%的国内手机用户倾向于下次换机时选择AI手机,对于AI拍照功能的优化、智能识别、解锁方式、AR特效等功能的期望值较高,对于拍摄效果的关注度较高,这些都为计算机视觉的应用深化奠定基础。而手机作为核心智能终端,对计算机视觉在消费电子领域的增长起到了核心拉动作用。







虹软作为行业龙头,其核心业务智能手机板块已在细分领域被三星、华为、小米、OPPO、VIVO、LG、索尼、传音等主流厂商认可,借由自身优质算法,帮助客户在“性能-功耗-硬件成本”三方面实现最优平衡。并针对不同厂商的硬件特点进行差异化算法优化,以最大程度降低功耗,提升成像质量。由于长时间积累,其背后模块化的产品和底层算法库,在定制模式下快速响应,通过对外授权的模式实现了规模化利润,值得持续关注。







综上,计算机视觉是人工智能主要的、能够快速落地的技术。作为改变未来世界格局和人们生活方式内在逻辑的产业,计算机视觉技术的成熟和应用场景的拓宽仍在前行的路上,值得我们去持续跟踪与深挖。