安防新十年以不易开始,但他们给行业开了个好头。 2020年的安防圈,仿佛被按下了暂停键,项目停滞、融资缓慢、研发缩减,没有人能预料到,中国安防的新十年,是以这样的状态开始,不少企业也以这样的方式结束。 过去十年里,近千家安防产业链厂商,经过无数次物竞与天择,仅留下数十家企业,拥有充沛的资金和技术储备,迎接新十年。 站在安防新十年的这个节点之上,9月5日,由雷锋网 & AI 掘金志主办的第三届中国人工智能安防峰会,在杭州正式召开。 本届峰会以「洗牌结束,格局重塑」为主题,会上代表未来新十年的15家企业,为现场1000余位听众和线上几十万观众,分享迎接安防新十年的经营理念与技术应用方法论。 以下是本次大会演讲内容的精彩回顾: 国际人工智能联合会 首位华人理事会主席杨强: 「联邦学习下的数据价值与模型安全」 杨强在大会中指出,目前很多行业并没有真正意义上的大数据,产学两界都缺乏高质量、有标注、不断更新的数据。 如何保证各方数据私密不外传,又能保证数据更新?这就是分布性数据隐私保护、联合建模的挑战和需求——把小数据聚合起来成为大数据。 加上现在人们愈发重视隐私,政府纷纷立法,对技术的监管趋严,联邦学习正为保护隐私带来了技术上的新思路。 如何理解联邦学习?“邦”是指每个实体参与者地位相同,无论大小,提供的价值才是他们存在的意义;“联”是用一种方式把它们联合起来,保护隐私,一起做有意义的事情。 联邦学习的宗旨是“数据不动模型动”,目标是“数据可用不可见”。数据可以用,但是这些原始数据是合作方彼此之间见不到的,所以一些散乱的小数据就可以成为虚拟的大数据。 杨强教授介绍称,目前联邦学习主要有横向联邦(样本不同、特征重叠)和纵向联邦(样本重叠、特征不同)两种做法,前者更适用于to C场景,后者适合to B场景。 他强调,联邦学习和分布式AI、联邦数据库的区别在于:过去这二者的数据形态、分布、表征皆为同类,但在联邦学习里它们可以是异构的;且过去联邦数据库目的是并行计算、增加效率,但现在数据本身属于不同的属主,所以需要做加密情况下保护隐私的计算。 随后,杨强也谈到了联邦学习在安防等领域的应用。此外,杨强团队还推动制定世界上第一个联邦学习国际标准,同时也发布了开源平台FATE,并且积极筹措联邦学习联盟,共建联邦学习生态。 海康威视EBG解决方案部总裁李亚亚: 「赋能数字转型,服务千行百业」 李亚亚介绍,海康目前的业务主要分为三块:综合安防、大数据服务和智慧业务。 数字经济和数字化转型成为必然趋势下,人工智能交付问题依然面临挑战,难点有三:一是泛在需求,这是场景碎片化、需求差异化必然带来落地难问题;二是复杂交付,涉及产品、施工、算法优化、信息系统打通、业务流程转型等诸多问题。三是成本可控,关注投入产出比非常必要。 李亚亚认为,解决落地难,仍然是要回归商业本质。要从产品的品质抓起,目的是让各行业都享受到技术革新的红利,通过场景化、差异化的问题解决,提升用户的业务价值回报。 数字化转型是一个逐步进阶的过程,场景化是路径,因此要通过系统的产品体系去支撑场景化应用。面向企业领域的数字化业务的开展和落地,海康威视从拉近管理距离,提升业务效率,规范作业行为,防范安全隐患四个维度出发为行业赋能。 海康威视秉持开放融合的合作理念,携手合作伙伴,共同实践数字化转型之路;秉善笃行,不断创新技术和产品赋能千行百业,为社会的安全和发展开拓新视界。 大华股份先进技术研究院院长殷俊: 「AI 行业应用,产业升级」 殷俊认为,AI经历了理论研究的1.0、智能落地的2.0,目前处于行业智能的3.0阶段。 AI 1.0时期是“两耳不闻窗外事,一心只读圣贤书”,计算力不够,数据有限,算法不成熟;2.0阶段是“纸上得来终觉浅,绝知此事要躬行”,算法、算力有了突破,成熟的算法寻找落地场景;3.0阶段是“忽如一夜春风来,千树万树梨花开”,行业最需要的不仅是一套算法、一套系统,而是企业解决客户痛点和需求的能力。 在行业智能背景下,人工智能需要具备的基础能力包括:一是AI技术泛化、快速迁移新应用的能力;二是应用牵引,快速适配新需求的能力。 殷俊认为在3.0阶段是应用主导个性化和AI解决方案的敏捷交付。在这个过程中,首先要构建人工智能解决方案的端到端体系化能力,大华已经在四个方向做了重点布局:系统架构、数据智能、智能工程化、智能技术。 除了构建以上核心能力,大华还开放全栈能力,赋能行业生态,并在实战中持续积累人工智能核心技术,针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的五大技术挑战,开展实践探索,并已取得实战应用成果。 最后,殷俊强调,AI目前还是依赖人工为主,大华希望未来在行业共同努力下,能够真正转向AI的自我智能,推动行业智慧化落地。 西部数据智慧视频产品首席技术官孙煜: 「AI安防与存储的变革」 孙煜提到人工智能在监控行业的应用四个主要要素:芯片、软件、存储和厂商。 芯片不断提升算力,并降低成本,软件提供高效实用的算法,海量数据需要被存储才能被利用,厂商集成以上要素并落地。这个生态中,各方要素一起合作才能使得AI真正落地。 AI应用,使得视频监控的存储架构从以前的端和边,变为现在的端、边、云,连接方式云化,其中,存储器需要更高顺序读写性能、更大的存储容量、更高地随机读写性能、更快地响应时间。 西部数据通过提供视频监控行业从终端到核心的存储产品组合,协助视频监控行业的AI落地。 孙煜演示了西部数据专门为整个视频监控行业打造的从端、边、云的各个产品组合,以及专门随时检测硬盘监控状态的软件WDDA,Western Digital 设备分析 (WDDA) 是 Western Digital 的监控优化存储产品系列支持的全新设备分析功能。WDDA使管理员能前瞻式地管理存储设备并保持性能优化,防止意外故障。 孙煜强调AI进入后传统监控盘力不从心,系统厂商通过合并通道单码流,顺序地写入,大大减少了硬盘的飞行时间和次数,把飞行机会转移到数据库访问,提升存储系统的性能。 西部数据认为提高数据利用率的关键,是告别简单粗放模式,进行精细化的分层存储策略,他们还建立起一套四层存储架构体系:热存储、温存储、冷存储、极冷存储,分而治之,极大地提高数据利用效率。 商汤科技智慧城市事业群 产品副总裁朱鑫: 「AI 驱动城市智能化变革」 数字化转型的核心技术是云计算、移动互联网、物联网以及大数据,更多是在于更高效的信息组织,更顺畅的一些信息流动,以及更便捷的信息访问,从而去改善企业以及行业的效率,生产力是百分比提升。 智能化变革,机器将取代人工,如此会形成一个自主的组织生产,最关键的是,随着数字技术、芯片、摩尔定律以及云计算能力相关规律影响,机器成本会持续下降,规模化后机器成本会趋向极低的成本。彼时对生产力的提升不是百分比,可能是倍数,甚至是指数级。 大量的城市物联设备、规划的城市群,以及城市里形成的大量人流、物流、车流、金融流、数据流,组成了城市互联网。 朱鑫总结了城市互联网市场下,真正推动一个城市智能化变革的三大支柱系统。 一是新一代的联网汇聚平台。视觉数据是城市最丰富的数据资源,前端设备收集的数据通过联网汇聚,形成城市动态的数据资源池,动态数据经过AI系统处理后,成为城市数据资产。二是超级计算底座。每个城市需要一个新型的超算中心。三是城市级算法系统。系统有三大板块:城市的主算法系统、城市级场景算法系统和通过融合、关联、决策,形成一个完整的城市的算法系统。 商汤在这几个支柱下面形成了一整套体系与方案,从最底层的基础建设开始,从数据中心基础设施到城市智能的计算中心,再到城市智能云赋能中心,把整体算法系统能力都放在云赋能中心。 宇视副总裁、首席架构师姚华: 「AI 如何得到人民的好口碑」 姚华回顾了2018年提出的AI与安防的七座大山,并指出如今视图数据全链路计算逻辑已经形成,AI在安防已经从0跨越过1。宇视的AI部署已经在从城市到郊区、乡村,解决群众的小事和琐事。 业务状态出现新挑战,比如动态人口服务和管理难、案件有效线索率低。姚华列举“宇视追影系统”应用的三个案例:疫情期间24小时找回出走口罩少女,男子沿街威胁案件,合伙扒窃案,以上成功案例中,最关键的技术是ReID(跨镜追踪)。 姚华指出,ReID应用有七大技术难点:第一,不同姿态、角度、分辨率下的人体之间的匹配;第二,复杂场景、有遮挡,密集人群等场景下的匹配;第三,不同交通工具上的人体的匹配;第四,不同时间段以及着装变化后的行人匹配;第五,跨摄像头模态行人匹配;第六,目标行人着装发生变化后的匹配问题;第七,在较小训练集上匹配算法训练较为受限问题。 宇视联合博观(拥有国际三大主流ReID数据集、Vehicle ReID等世界纪录的算法公司),设计了基于现有样本的GAN对抗网络,较好地模拟了人体的多角度、多姿态特征。同时,辅以多种预处理算法,极大地扩充了原始样本基数,使得在较小训练集上匹配算法训练受限的问题迎刃而解。 其次,宇视在算法中采取结合全局特征和多尺度局部特征的混合向量提取解决方案,并在训练中采用迁移学习,再者,对每个人体的局部特征进行重定位的匹配训练,通过实现对人体局部位置的精准定位,可将人脸识别与ReID联动结合,解决跨镜追踪应用的诸多难点。 宇视追影系统发布一周年,实战应用落地中国百余个城市和地区,实战案例超1000个,找回走失人口100余人,小微案件侦破率提升50%。最后,姚华用“好AI,为人民服务”结束:小案件是群众的“天”,无论乡村还是城市,AI帮助解决小案件难题,能让我们尊重每一个微小的个体。 360城市安全集团副总裁、 360视觉科技总经理邱召强: 「360 以安全为基础的 AI 技术与应用」 邱召强表示,当行业在享受技术带来当先进性时,360通常用逆向思维思考:一个新的技术产生的同时会带来哪些安全隐患。 邱召强指出了数字时代的四个特征:第一,一切皆可编程,也造成漏洞无处不在;第二万物均需互联,虚拟世界的操作带来了物理真实世界巨大的灾难;第三大数据驱动业务,数据一旦汇总,安全性难以保证;第四软件定义世界,世界架构在软件之上,脆弱性前所未有。 360在过去15年,总结和打造出了一套云端的安全平台。360安全架构是以安全大脑为核心,六大板块,一个安全大脑,十个安全基础设施,和一个运营的所发,一个专家的团队,一个实战演练机制和一个安全互通的标准。 背靠360城市安全集团,360视觉科技专注于人脸识别产品的开发和应用,打造出以大数据为基础的视觉安全产品,包括了人脸识别门禁、人脸识别通道闸机、人证核验设备等智能终端及针对办公楼宇、酒店、商超、社区、学校,交通枢纽等场景解决方案,构建以安全为核心的智能生态。 360安全赋予了360视觉科技独特的竞争力。针对人脸识别终端设备的安全,对核心库和可执行性文件进行核心加固、对代码加固、对应用程序加固,三重安全加固防护;此外,360视觉科技还独创密钥白盒技术,为人脸识别终端、云平台环境中的数据加密及公私钥身份认证,全程密钥无明文。 最后,邱召强展示了360视觉科技人脸识别硬件家族,以及智慧园区、智慧楼宇、社区安全、智慧校园、机场安防、智慧办事大厅等几大行业解决方案。 华为机器视觉领域总裁段爱国: 「华为 HoloSens ,点亮智能世界」 段爱国提出,一个真正的智能世界有三个非常典型的特征或者基础框架技术:一是万物感知,二是万物互联,三是万物智能。 在华为来看,万物互联、5G、光网络是华为的强项,华为机器视觉将成为华为在万物感知的核心。 段爱国还认为,智能世界向前迈进有三大核心技术:以全息感知为核心的机器视觉,以万物互联为基础的移动无线通信,以及万物智能的AI技术,2020年这三个技术开始合拢。 所以华为在2020年率先提出,所有的视频技术应该从人看向给机器看转移,并正式把产品线更名为“机器视觉”,聚焦打造两个核心的能力:一是前端的全息感知能力,二是在后端用数据驱动,反作用于物理世界,驱动于智能世界。 4G的时代,以智能手机为核心,出现了各种行业移动互联网的应用。在华为来看,机器视觉就是5G时代的行业数字化的智能手机。段爱国还提到,过去5年,AI的成本在下降,AI已经进入到普惠的时代,他预测未来两年智能摄像机一定会超过网络摄像机。 另外,华为将聚焦打造4个核心战略产品和平台:前端的软件定义摄像机,后端的智能视频存储,类似于智能手机应用市场的智能算法应用商城,以及华为机器视觉云服务。 在此基础上提出四大战略策略:战略一,积极投入全栈全场景的AI研究;战略二,重构产业架构,加速智能化升级;战略三,平台+生态,赋能千行百业;战略四:端边云协同,深度数据挖掘。 最后他强调, 会将开放进行到底,未来的智能世界很复杂,华为不可能一个人包揽全部的工作,希望大家一同成长。 旷视副总裁那正平: 「城市大脑的条与块」 那正平表示,城市治理数字化、智能化浪潮中,无论是智慧城市、城市大脑还是数字孪生概念,核心思想都是通过物联网、人工智能等技术,准确发现城市运行的内在规律,从而进行动态优化调节,解决城市面临的安全、出行、环境、产业升级等诸多问题,最终提升城市治理水平。 那正平归纳出做好城市大脑和城市大脑的操作系统的几大要点:深入研究城市发展规律;探寻业务本质;先具象再抽象;脚踏实地,长期主义。 旷视通过分析城市空间和管理对象,指出城市的日常运作管理需要秉持以人为本核心,城市大脑应围绕条块结合的方式实现综合管理,实现条、块、脑、OS的协同。 城市大脑中的条应用总量少,单体规模大、高并发、数据壁垒强;而块总量大、IoT种类多,低并发、数据壁垒低,集成联动潜力大。 基于此,旷视提出:构筑城市大脑需要先围绕“条”和“块”打造城市级的超级应用,验证产品、实现单一场景闭环,从而形成具有旷视特色的软件和硬件产品矩阵,最终逐渐沉淀出城市级和建筑级AIoT操作系统,实现城市物联网的闭环。 旷视认为,人工智能产业现在处于并将长期处于初级阶段,我们必须正视并不能超越这个初级阶段。第二,人工智能产业的主要矛盾是市场日益增长的多样化需求同落后的算法生产力之间的矛盾。 云从科技安防行业部总经理李夏风: 「人机协同平台,助推社会治理现代化升级」 云从认为人机协同有三部分:人机交互、人机融合、人机共创。 人机协同中,各个行业的专家、以机器代表的AI知识服务和用户,三者形成一个闭环,首先专家把知识赋能给机器,机器转换成智能化产品并提升客户的体验,用户从中反馈出个性化的需求,后续提升专家的效率并反哺到产品或服务中。 云从人机协的落地通过三部分实现:智能化终端设备收集数据,同时也是人机交互的入口,云端大脑是整个数据的汇集、分析、提炼的中枢,当数据大脑经过分析,形成相关的服务后,通过嵌入式的模块,即AI平台,实现人机协同在各个场景落地。 而AI训练平台融合数据智能标注、OCR训练、图像训练、NLP训练、视频结构化训练于一体,根据场景数据,生成符合行业需求的AI模型算法。云从的智能解析引擎具备软硬解耦特性,可以适配国有自主芯片,还能实现效率和使用维度的极大地性能提升。 基于云从的数据分析引擎,提供面向数据全生命周期的分析、挖掘及应用服务,完成数据到知识的价值转换,赋能各业务场景应用。 具体来说,汇聚感知数据,打造数据挖掘基础,融合业务数据,灵活定制生成各类标签,拓展业务对象,并依托认知信息,形成各类专家的决策,为决策提供有力的支撑,最后,依托可视化专家建模,固化专家经验模型,积累与传承业务知识。 从数据到知识是数据价值挖掘的必经之路,目前大部分数据资源没有得到充分利用,云从的知识生产与服务平台KaaS,通过将标签、机器学习等知识模型化、在线化,加上AI 引擎, 变数据/经验为在线知识。 通过数据智能模型为核心的知识体系构建实现从多维数据中挖掘隐形事件背后的关联关系及规律现象,服务于风险防控、态势预测、行为画像、虚拟轨迹等各类实际业务决策。 比特大陆AI业务线CEO王俊: 「安防新基建,AI 芯智能」 王俊认为,当市场容量足够大时,总是会催生出更专注的产品,因为越是专注的产品,越容易获得更高的效率,随着AI市场的爆发,AI的计算硬件亦是如此。过去大家用GPU来取代CPU提供AI算力,现在正是从GPU切换至TPU或其他AI专用芯片以获得更高效率的时代。 比特大陆算丰自研的TPU,覆盖了云、边、端,专注于深度学习计算,相对于CPU和GPU,在获得更高性能的同时,还具备更高的性价比和更低的功耗。安防行业已经完成了从看得见到看得清,看得清到看得懂的阶段,而未来在更多专用AI芯片加持下,可继续实现看得快、看得起。 王俊还提到,比特大陆算丰业务坚持专注、开放、合作共赢的理念,专注AI芯片及其相关硬件的研发,同时开放各个层次的软件接口方便各种算法的接入和优化,力求和各个算法、应用等合作伙伴紧密合作,共同打造完整的AI解决方案。 同时,他们会打造基于比特大陆算丰芯片的算力平台,提供数据、算法、应用的统一管理,这样不同的应用需求,基于不同深度学习框架的不同算法方案,都可简单、高效的运行在该算力平台上。用户可自由选择最合适的方案,接入数据,并获得智能分析的结果。如此,在真实的场景中,无论是人脸识别、视频结构化这样单一的应用,还是城市大脑这样的综合方案,比特大陆都可基于该平台,联合合作伙伴,提供统一、高效、易用的AI算力服务。 澎思科技副总裁曲瀚: 「AIoT 新基建, 加速人工智能进入普惠时代」 澎思科技认为人工智能新基建的一个核心就是AI的基础设施化,分为技术基础设施和融合基础设施。 在此趋势下,智慧城市和AI安防将成为新基建的最佳试验场。另外,AI安防也逐渐发展到了第二阶段,AI在To B领域的发展开始从单一的场景向全社会各个领域延伸,每个细分的场景都展现出不同的AI服务需求,未来就是服务为王的时代,谁能够快速精准地把握住客户的需求,谁就能够在未来的竞争中快速胜出。 曲瀚指出,AI普惠的产品有两个核心要点:一是极致产品体验,二是场景化的解决方案能力。实现AI普惠的终局在于四个方面:第一,万物智联,所有的AI终端实现在线化。第二,推动AI算法向通用智能算法演进,降低机器学习的成本,提高泛化能力。第三,构建一个丰富的产品生态。第四,场景的联动和重塑。AI不是一个孤立的系统,需要和客户的其他系统做连接和联动,才能使得场景服务变成一个主动智能的服务。 澎思基于对普惠AI的理解,构建了澎思AIoT生态平台,包括四个关键的能力:第一,智能视图大脑。算法会从云、边、端三个维度全链条嵌入。第二,全系列自研的智能边缘设备。第三,打造云端智能服务的开放平台。第四,后端建立数据管理平台,使得数据在AI、硬件以及云服务能够充分地流动,实现业务和训练数据的并轨。 曲瀚还表示,普惠AI最核心的是算法能力,这是整个AIoT业务的底座,澎思的算法在云端和边缘端都走在世界的前列。 最后,曲瀚还重点介绍了在智能城市「新基建」中,澎思在城市公共安全与治理、人居场景智能化两大场景中的落地情况,以及深度参与新加坡等海外市场智慧城市的建设经验。 的卢深视CEO户磊: 「大库时代,落地千万级刷脸系统的 技术剖析与建库经验」 户磊提到,大库时代,金融支付、交通等众多场景亟需千万级精准人脸识别技术方案。目前行业内现有方案为多引擎,多层级,分库管理模式,系统复杂、软硬件开销大、成本高、效率低。 因此理想的大库识别方案应该具备以下几点:精准,万亿分之一误识别率,千万级别底库,鲁棒性好,高度兼容性,以及价格适宜。而的卢深视是全国首个建立省级规模三维人像数据库的AI公司。 的卢深视的千万级精准识别的刷脸系统具有几大关键技术点。 系统架构,分为三个层次,由前端多维智能感知系统、千万大库云端中台和多模态关联分析与预测组成。 其中高性能三维人脸识别算法与前端相机深度集成,降低后端计算开销,中台支撑千万级大库人脸的建库、清洗、检索,适配度高、效率高,多模态架构的兼容性好,分析预测环节基于大数据的逻辑推理,时空轨迹关联分析,将2D/3D人脸、人体、物品、时间、地点等多维大数据融合,深度挖掘数据之间的关联性,实现预测与预警。 其次是技术架构。核心算法层,其中最重要的是3D算法层;平台技术层,包括后端的技术,包括通信计算、协同优化等等技术;业务中台,对数据接入、数据管理、数据清洗、优选,而后融到库里面进行数据同步,最终支撑各种各样应用。 再者,的卢深视建立三维数据标准及评价打分体系,这是后续进行三维应用的基础,的卢深视对于各种数据类别,均提供数据质量要求及评价标准。 户磊还总结了的卢深视3D识别的优势: 准确率高,保证精度不损失的情况下,突破了三维人脸识别的量化技术,最终可以实现在千万级库上面秒级的反馈结果,可以保证万亿大库下的高准确率 。 鲁棒性好,实现了深度图和红外图的识别,不受光线影响,包括大角度、浓妆识别的准确率,能够融入15到20度大的角度的差异。 安全性高,尤其对于活体检测,能够实现2D平面伪装攻击方式100%防御。 |