汽车经济网

您的位置:汽车资讯 > 车经论道 > 人物 > 正文

新能源汽车国家大数据联盟王震坡:新能源汽车事故可发现、可预判、可控制

2019年8月30日,第二届新能源汽车测试评价技术国际论坛在北京职工之家召开,本届论坛以“新标准新技术新发展”为年度主题,针对当前国内外新能源汽车领域最新的测试评价方法、标准、技术等作深度研讨交流,助推我国新能 ...

2019年8月30日,第二届新能源汽车测试评价技术国际论坛在北京职工之家召开,本届论坛以“新标准 新技术 新发展”为年度主题,针对当前国内外新能源汽车领域最新的测试评价方法、标准、技术等作深度研讨交流,助推我国新能源汽车测试评价技术和标准体系进步、研发能力提升、专业人才培养、学术交流合作以及产业高质量发展。

新能源汽车国家大数据联盟秘书长王震坡做了《基于大数据的新能源汽车动力电池故障预测预警方法研究》的主旨报告演讲,内容如下:

新能源汽车国家大数据联盟秘书长王震坡

尊敬的各位领导、各位专家,大家上午好。

下面我把基于大数据的新能源汽车故障预测、预警方法我们做的一些工作给各位专家做简要的汇报。

我的内容一共分为四个部分,第一个部分是关于新能源汽车大数据发展背景。

我想在座的各位都是新能源汽车领域的专家和学者,对于新能源汽车并不陌生,这里面的一些具体数字我就不详细讲。

我们需要关注的一个问题、关注的一个点,就是在我们全社会的车辆的总销售量、总产销量在下滑的大的背景下,新能源汽车的产销仍然是在持续增长的,这是新能源汽车的一个非常好的发展势头,在国内有非常好的发展势头。

下面说一下大数据。

我自己理解的大数据是什么呢?大数据第一说到大就是big这个词,首先数据得多,我觉得这是理解第一层的意思;第二对于大数据的理解,我的理解是大数据不是单一的某一个方面的数据,而是多维的、多来源数据的融合问题,这是我对大数据的第二层的理解;第三层理解就是大数据要产生它的价值,也就是数字经济,一定是跟我们的工业、跟我们的产业相融合的,这样才能发挥数据的价值。

因此新能源汽车和大数据的融合是大势所趋,它是我们工业化和信息化深度融合的一个典范,这就是我对新能源汽车大数据的粗浅理解。

说到大数据我们还要去看一看我们的新能源汽车的数据是如何产生、如何发展的。

应该说新能源汽车产业数据已经从单点的数据迅速爆发的阶段扩展到了跨界数字融合的阶段。

我在这张PPT里面给了大家三个层次、三个阶段的图例,在这里面我们可以看到最下面的这个阶段也就是在整车企业这个阶段,在车辆设计、生产、制造、销售的各个环节都产生了大量的数据,这些数据不是我们有了大数据的概念以后才有的,而是在我们传统车辆的设计开发和销售过程中就已经有的数据。

我们现在讲到的新能源汽车大数据,其实就是换成增加运营、运行的数据,恰恰就是这个运营和运行数据的增加,使得我们的数据量呈几个级数的增长,因为其他的车辆车身的数据、生产的数据、销售的数据都是静态数据或者准静态数据。只有运行数据是动态的、持续增加的,只要车在用,数据量就在增加,就是随着使用的过程,我们车辆的大数据成倍或者成几个级数在增长。

整车企业的数据回溯到产业链里面来,发现我们整车企业的数据在产业里面只是一个小环节。

往前追溯,有原材料、经销商、用户、售后等等构成产业链的数据。我们的产业链的数据跟上层的跨界融合的数据,包括我们的金融数据、停车充电数据、道路运输数据、公共交通数据进行深度融合,才产生了跨界融合的优势和大数据的应用的价值。

我们再将数据流换成三个阶段,从我们的生产环节、销售环节、使用环节来看,从生产环节我们刚才讲生产环节是数据产生的环节,它同时应用到我们销售环节的数据和车辆使用环节产生的数据,后面这两个环节的数据为我们的车辆的设计优化提供了最基础的依据。

你应用得怎么样、销售的对象是谁,也就为我们的车辆设计优化提出最基础的数据,使我们的车辆的品质、车辆的设计理念在一步一步提升。

在销售这个环节,同样可以应用我们生产环节所产生的车辆的技术性能、特征参数,实施精准的营销,这是在销售这个环节所应用数据的特质和特征。

对于车辆使用环节,在车辆使用环节我刚才讲到在使用环节我们的消费者首先是一个数据的生产者,在车辆使用过程中产生了大量的数据,为我们的精准的营销、车辆设计提供基础的数据依据。但是我们的消费者同样是这些数据的受益者,因为你在使用过程中产生了相关的数据,可以对你的充电的引导,对你精准进行车辆维护,对你定制化的保险服务提供基础的数据的依据。所以这是在产业链的三个环节能够产生的对于我们不同环节产生的相应价值。

下面这张PPT讲的是我们的数字化的过程。

无论我们现在讲的电动化、智能化、网联化还是共享化,我认为最基础的一个环节是数字化。

数字化是我们实现四化的基础,因为有了前端的数字化、前端的大数据化,推动了我们电动化的发展。有了电动化为基础,才延伸拓展出了我们的智能化、网联化、共享化。这是我对数字、对我们这个产业带来的变化的理解。

我们以新能源汽车为核心,以我们大数据为基础,融合我们的人工智能技术,对B端,即企业端,带来相应的优势,包括我们的设计开发能力的提升,包括我们精准营销的业务,包括我们未来的智能出行方面带来相应的收益和益处。

对于C端,即我们的客户端,无论在选车、购车、养车、换车相应的环节,你都可以基于大数据、基于数据的分析带来相应的优势。

同样在数字化的过程中、数字化进程中和大数据发展的进程中,我们也面临很多的挑战。

第一个挑战就是大家对于大数据的理解。

在传统的车辆产业里面,我们无论是在我们的设计环节、生产环节、销售环节都有相应的设计软件、开发软件、管理软件,但是这些软件本身的代码跟不上我们现在大数据理念的提升过程,也就是这种代码升级的过程和代码编制的过程跟不上我们理念的提升的历程,这是我理解的第一点。

第二个挑战,因为我们现在的数据除了在车辆使用环节的数字化本身是结构化的数据,还有来自于车辆使用环节的无论是车、路、人相应的非结构化的数据,两头叠加导致数据量又成几何级数的增长,我们现在的村塾能力和存储手段不足以支撑我们的大数据爆发式增长的态势。

第三个挑战,我们的理念。

想要做到大数据的分析和挖掘,体现它的价值,我们要做到跨界融合。但是恰恰是在这个环节,我们的数据散落在了不同的企业,甚至散落在企业不同的部门,而要想把数据融合起来,第一是我们的理念问题,我们能不能抱着开放的心态实现数据的共享;第二是技术问题,不同数据库之间的数据接口之间连通,相对于企业的标准统一是一个技术难题。

曾经我在一个大型的运输企业进行交流的时候,他们就告诉我,第一他们信心满满告诉我们他们很早实现信息化,从运营的不同管理部门包括财务、运营调度等等各个部门,有信息化手段的软件70多个。但是下一个问题就是70多个软件怎么把它连起来,怎么实现大数据的应用,这是非常现实的问题。因此在大数据应用方面来说,既有部门之间的理念问题,也有像技术割裂的问题,导致了我们最后的结果就是数据的孤岛。

下面我介绍一下新能源汽车大数据所涉及的一些关键的技术。

我本身是学车辆专业的,从机械角度是搞车辆技术和开发工作的,并不是说我们不重视硬件的开发工作,但是在大数据这个时代,我认为软件驱动正在重写我们的汽车的竞争法则。

在这里面我们有发展的核心技术,也就是说以我们的传统制造加上互联网这些基因来重构我们的汽车行业的竞争法则。在技术方面有一系列的需要发展的技术、想要获取的数据,我们需要有各种各样的传感器,传感器的融合是发展的趋势。我们要进行数据采集,涉及到多ECU,车上的ECU特别多,我们如何将ECU进行整合。在这种基础之上,通过汽车云将车载信息和车外数据进行良好融合,这是现在我们急需要解决的问题。

第二个切入我们今天的主题就是新能源汽车基于新能源汽车大数据车辆安全问题,车辆安全问题集中体现在电池安全上。

首先在电池的使用过程中有相应的性能衰退,包括容量的突然衰变,包括寿命的衰退,包括电阻过大,包括过流过压等等一系列问题。性能的衰退和失效直接导致汽车的安全性的失效,集中体现在电池的热失控方面。后面我要介绍我们基于动力电池的热失控做了一系列的模型以及相应的处理的流程。

大数据的关键技术首先就是大数据平台的构建,尤其新能源汽车大数据平台的构建。新能源汽车大数据平台在我们的生产企业、出行服务企业、运输企业等等,以及我们的政府的管理部门都有新能源汽车大数据平台构建的需求。如果我们大数据平台是一个根据各个部门之间的不同的需求进行构建的话,其实会造成我们社会资源的极大浪费。因为大量的需求和技术需求来源是一样的。因此,在这方面我们提出了多层次、模块化、柔性的大数据的构建过程,根据不同部门、不同企业的需求,可以把功能模块进行柔性化的组合,来构建满足使用需求的大数据平台,这是评价构架的技术。

第二关于数据传输方面,我们现在的数据可能是十万辆、二十万辆,按照汽车的产销,现在我们在新能源汽车技术路线图里面提到2030年要有40%左右的车辆的销售是新能源汽车,到那时候一年产生的新能源汽车按照我们现在的产销也是几百万辆、上千万辆的规模。在这种情况下基于异步非阻塞设计理念,所设计的高并发技术是新能源汽车大数据平台核心的技术。

关于信息传输方面来说是大家普遍所关注的信息安全方面的技术。

第一就是我们要构建数据传输之间的加密算法,在加密算法基础之上,我们现在正在开发的就是汽车数据传输的加密的芯片。通过加密芯片能够防止数据的篡改,来保证信息传输安全,无论是从车向平台的数据的上传还是指令从云端向下发,我们都需要在这方面来做相应的工作。

第四就是关于大数据的压缩和快速检索方面的工作。

结构化数据和非结构化数据的融合带来了数据急速增长,这样大量的数据如何进行存储,并且在我们云端存储方面,是不是把全生命周期的车辆的数据从车辆第一天使用到车辆报废所有数据都进行存储,都进行云端的存储呢?这种存储是不经济的,我们如何界定,是三个月、六个月进行热备、六个月到一年进行温备还是六个月到一年进行冷备,这方面需要车辆控制策略跟存储策略进行结合。我们需要在快速抽取这些数据、检索数据的时候,如何把温备的数据和冷备的数据进行处理需要有一系列的技术。

在数据的计算方面,我们如何把我们云端的数据和边缘计算的数据相结合,也就是哪些数据是在车端进行计算的,哪些是在云端计算的,把云计算和边缘计算能够融合起来,这也是我们需要解决的问题。我们现在的基本做法和基本构想是把基于阈值判断的、基于逻辑关系的相应数据放在车端,而基于历史数据的、基于历史比较数据的和车型横向比较数据的运算放在云端,这样把云端的计算和边缘计算结合起来。

在数据里面我们最害怕出现的就是假数据,假数据并不一定是有意造的假数据,而是在数据传输过程中可能出现数据失真等情况。多维数据之间的逻辑关系进行相应的判断,基于它的合理性和合法性、规律性进行数据的有效性和真实性的判断,这样一个是检验丢失的数据,第二可以判断在数据安全方面出现的问题,哪些数据从哪里传来的,它的来源是什么,它的数据跟其他数据之间的维度是不是逻辑关系合理,进行数据的真实性和有效性的判断。这方面的技术既有大数据的技术,也有车辆本身的技术,因为要基于车辆数据之间的基础的逻辑关系进行相应的判断。

第七个技术是数据可视化技术。

这些数据如何和我们的用户、和我们的管理者进行良好的技术交互,让他能够看得懂、看得明白,就涉及到数据的可视化,这方面不多讲。

下面介绍一下新能源汽车大数据平台。

这个平台就是建设在北京理工大学电动车辆国家工程实验室的全国的新能源汽车大数据的分析平台和存储平台,我们这个平台是受工信部的委托而建设。通过这个平台,我们构建了从企业到地方到国家的平台的技术体系,我们所代表的就是国家的平台,实现了国内生产和销售的所有新能源汽车的数据的汇集。同时我们实现了车辆数据、车辆故障数据到国家平台的汇集。

到目前为止,我们的平台上已经接入的车辆有大约260万辆,累积运营里程超过600亿公里,日上线率超过60%,实时在线率在20%-30%之间,这是车辆的接入情况。

以这个平台为基础,去年,我们建立了动力电池溯源管理平台,这个平台在今年的8月1号正式上线,到目前为止,我们已经接入了213家车企,共273万辆车的动力电池的数据,包括400多个电池包,因为有的商务车不止一个电池包。

通过这个平台,基于工信部节能司的要求或者基本想法,要确保旧电池来源可查、去向可追。

我们这个平台里面存储的数据按照“32960”的标准,包含70项数据。它的报警数据很少,只有十项数据,比较笼统。如果我们只是把故障数据标准化的数据进行相应的展示、相应的提示的话,那么应该说从企业级这个平台就应该已经实现了,国家平台在这个角度来说是没有任何的额外的功能,只是做了双重的提示,在这方面因为我们的数据来源于企业。

因此我们做了一套基于车辆基础数据的安全预警的模型体系,在这方面我们建立了从阈值的变化,到速率的变化,到模型的多级处理的过程。最基础的就是基于电池是不是超线了的基础阈值判断,在这方面进行安全的提示,如事故的提示、故障的提示。

第二我们做的是基于回传数据的速率的比较,比如温升的速率等等的比较。以此为核心,我们构建了一系列的故障预报警的模型,尤其是事故预测的一些模型,基于大数据的预测模型来解决事故预报警的问题。

到目前为止我们已经建立了模型,包括基于一致性的电池故障的诊断,基于异常单体故障的诊断模型,一共将近10个模型,来进行车辆故障的预测和预警工作。

下面我把我们做的一些具体工作跟大家做汇报。

首先第一个就是我们大家都会关注到的,当车辆发生故障的时候,电压、温度、绝缘值肯定会发生变化的,甚至发展成为超出了它的基础的合理的阈值的变化,这是一种值的变化,这是最基础的故障判断的依据。

在这种基础之上我们要判断电池的故障,最直观的判断不出来的我们就要看从时间维度、单体一致性维度和短时瞬变性维度进行系统故障的诊断。

关于时间维度我们利用波动性的检测模型以及熵值诊断模型。对于单体一致性维度,我们进行车辆的阈值表以及单体阈值统计分析的结果来进行判断。关于衡量短时瞬变,按照进行压力的一致性进行判断。

我们现在应用比较多的就是基于熵值变化的诊断模型,首先我们最容易测量的参数就是电池电压,但是在车辆行驶过程中或充电过程中它的电压变化我们可以看到即使在一个时间窗口内有高有低,它的变化可以说是没有规律的,即使看到某块电池电压高了,这一时刻高,下一时刻不一定高,不能准确把故障点找出来。

熵值变化有什么优势?会把微小的变化以及变化的规律放大,让你通过微笑的变化的累积能够看到变化的趋势,因此我们通过熵值的变化可以看到,将错综复杂变化的规律可以找到,可以看到某一个电池、某一块电池它的熵值进行转换以后,它的故障的演化或者异常的演化看得非常明显。

在这种情况下我们还不足以诊断它可能要发生的故障,因此我们进行进一步的变化,将它的熵值变化转换为异常系数,这个异常系数在这里可以看到,这个红线里面体现的是异常明显,将异常数据按照不同等级,是安全级、预警级、警报级进行相应的分级,按照这个数值可以提供准确的预警信息。

因为这些数据不是靠实时数据,我们可以靠历史数据来进行判断,因此就可以提供一个车辆预警的信息。

在一致性判断方面来说,我们单一去看某一块电池跟其他电池的比较,它的压差大与小,这方面可能是很难判断的,因为我们单体里面,电池里面,电池系统里面,不只是一块、两块、三块、五块电池,少则上百块电池,多则上千块电池,我们很难判断一个电池是否有良好的状态,或者它的一致性的离散程度,我们单纯看一块电池很谈判断。

因此我们提出来基于角度方差的故障预警,也就是说把某一块电池拎出来跟其他所有电池比较,并且把所有的电池进行比较。在整个角度方差的合计里面,我们找最大的交集,找到谁的角度方差的变化是最大的,来进行重点的单体电池的关注,来看它的一致性的变化规律,来找到它的故障点。

下一个模型是基于统计学的异常单体电池故障的模型,我们选取不同的电池的应用的时间片段,在这个时间片段里面进行相应的异常比较,将单体异常率进行比较,哪块电池异常最多,将它的时间维度进行整合以后,我们就得到了一个曲线。看某块电池它的异常的可能性是最高的,是我们重点关注的一个点。从这里面我们超了限值以后,进行相应的故障预警工作。

这是简单介绍三个典型的模型。

下面我介绍一下基于这些模型、基于我们已经做了相应的工作,在做新能源汽车安全监管的一些相关的应用。

现在基于我们的平台,刚才讲了已经有260万辆车的数据,我们已经建立7×24小时实时监控和全流程监管的管理体系。

通过这种管理,我们已经发现了不少的问题,并且我们在发现这些问题的时候,我们分一二三级的故障以及预警的信息实时在运算的结果出现以后,通过企业信的形式推送给相关的企业,来提供预警信息。

我们现在已经形成了事前预警、事中提示、事后调查的管理的体系。

关于这些预警模型也不是我们一个单位自己关起门来进行开发的,我们在基础研发基础之上,我们与国内的25家企业召开多次会议进行模型的研讨,现在将这些模型给了这些企业,在企业平台进行搭载使用,进一步提升我们模型的使用的效果,并且通过应用我们进行系统的优化。

从事前预警方面我们近期做的工作,比如我们通过国家平台,我们对长期异常聚集的车辆的风险进行相应的提示。有些区域的车辆数量比较大,但是长期停在这里,这些异常停放点一共是一百多个。我们收集了高电量存放的这些点,全国一共14个,两千多台车进行风险提示。长时间的离线车辆,离开平台的最后一帧数据或者近期数据是三级故障报警或者风险预警,但是长期离线,长期离线是有可能在修车的过程,有可能出现了相应的事故,长期离线的车辆有自动的提示,可以将提示信息转发到企业去。

下面是统计性的数据,我们统计了国内今年以来发生的相应的新能源汽车的安全事故。我们做了相应的比较,我国新能源汽车燃烧的事故率是3.16/万台,但是我们的新能源汽车现在只有0.918/万台。这个数据是截止到今年的6月份,公安部交管局的一个公布的数据,我们得到相关的数据,新能源汽车并不像大家所想象的那么危险,着火燃烧的事故率是低于传统车辆的。

回到我们的平台,已经接入我们平台的车辆里面,我们的平台接入的数据是2017年1月1号的数据,因此全国现在有大约250万辆的新能源汽车,我们平台里面只有260余万辆,2017年1月1号以前生产的车辆没有接入我们的平台,恰恰是那部分车辆出的事故相对来说比例比较高。

因此接入到我们这个平台的车辆我们实现了在车辆真的出行之前提示过预警信息的将近有60%,是这样一个数据。所以新能源汽车事故是可发现、可预判、可处理的。

从事故的跟踪处理的流程来说,我们建立了这么一套事前发现事故、事后分析事故和事故上报的事故跟踪处理的流程,这是工作层面的不做详细介绍。

在我们工作过程中还会发现有一些从我们的微博、微信发现的事故,但是我们不能确信这个事故是哪个车企的,或者车企也没有准确获知这些信息。但是我们通过这些信息,我们建立了一套基于车辆GPS位置,如果在微信、微博发这些数据,我们都会知道他是在哪个城市、哪个区域发生事故。我们就建立了一套基于GPS的这种数据,因为我们有这个数据,进行地图检索,锁定区域,把这些车辆数据进行快速检索,在10分钟之内可以发现可疑车辆,哪些车辆在这个区域曾经使用过和应用过,是否出现危险信息,把可疑车辆数据快速检索出来。

 

作为一个典型的案例,我们可以在这里面看到当时做的车辆事故的分析。通过我们的极差分析,我们发现了它的2、3号单体的极差很高,这是在事前的预警阶段。在事故之后的分析阶段,我们通过它的异常单体占比,就是第三个基于统计规律的分析,我们仍然找到了出事故的单体是哪个。

这个物流车也一样,我们前面讲的第一个模型基于熵值变化,在事故之前的十个小时给它提供过风险预警的信息,事故之后我们也调取数据进行相应的分析。

因此回到前面的一句话,新能源汽车的事故看起来非常之可怕,但是它是可发现、可预判、可控制的。

我们现在在做的一些模型,应该说还只是刚刚的开始,后续我们将会持续加大我们的开发和研发的力度,以及在跟企业、跟行业交流的力度。

我们也将我们的开发的结果和开发的模型去对全社会进行开放,对我们企业进行开放,力求提高我们全社会、全行业的新能源汽车的安全水平,来让我们的新能源汽车事业健康发展。

我的汇报结束,谢谢各位专家。

责任编辑:综合报道