2024年12月21日网站首页返回旧版
>新闻>正文

东南大学刘志远:交通大模型可以打破数据壁垒 助力行业降本增效

分享到:

9月8日,2023腾讯全球数字生态大会智慧交通专场在深圳举行。东南大学交通学院教授、博导、副院长刘志远发表了题为《多模式交通大模型的技术体系与应用方案》的主题演讲。

东南大学交通学院教授、博导、副院长刘志远

随着人工智能行业掀起大模型的研发和应用热潮,交通行业的从业者也非常关注大模型在本行业中的应用场景。

刘志远认为,交通行业应该在通用大模型的基础上发展专为交通领域规划、优化的交通大模型体系。这一体系继承了通用大模型的回答问题和创造能力两大职能,同时在算力、算法和数据三大关键要素基础上,实现对传统交通模型的显著精度提升。

刘志远表示,交通大模型与专注于文本、视觉领域的通用大模型不同,应该以交通领域的各类参与要素为重心,关注单点、干线、路网的各类问题和挑战。

刘志远指出,交通行业各个管理部门之间的职能壁垒往往是交通应用的瓶颈所在,而大模型可以突破这样的壁垒,为各部门提供一体化的解决方案,为交通应用搭建统一的底层基础,从而实现降本增效、提升交通运输效率的目标。

但刘志远也强调,目前交通大模型还在发展初期,未来随着算力、算法和数据的持续改进,以及交通应用数量的不断增加,交通大模型也将助力交通行业更好实现智慧化的目标。

以下为刘志远的演讲全文:

非常感谢腾讯的邀请,很荣幸在这次盛会上交流我们在大模型方面的心得和体会。

数字化浪潮的背景下,大模型是今年产业的核心关键词。我们认为交通行业应该在通用大模型的基础上开发自己的交通大模型体系,那就要首先了解大模型的背景。

大模型之所以能带来全新的范式和技术革命,来源于算力、算法和数据三大关键要素。大模型的重点在于生成式的概念,指的是产生人类的知识体系,在生产生活中没有产生的各种结论和知识。能做到这一点,是因为大模型背后有着非常庞大的知识库支撑。所以我们在构建自己的技术体系时,需要深入思考算力、算法、数据这三驾马车,掌握里面的核心技术。

回到交通工程本身,我们现在通用的交通模型体现在建管、养运、规划、设计等不同环节中,是以四阶段和三参数模型为代表的传统体系。它有着非常深度的理论支持,但它最大的问题在于精度不足。以三参数模型为例,在得到了丰富数据的前提下,它的客观拟合误差都可以达到26%;再以四阶段模型为例,实践中误差可以高达150%。所以这样的模型体系更多还是思辨的产物,不是一个过程可重复、结论可证伪的客观环境下打造的体系。

今天我们要把算力、算法、数据真正地用到交通工程体系的深度架构里,就需要像ChatGPT一样构造自己的交通工程大模型,我们叫它多模式交通大模型。它可以解决现有模型的假设不合理、模型参数较少的问题,最重要的目标是提升精度,带来极大的智能提升。

ChatGPT有两个核心功能,第一是回答问题,另一个是它有创造能力。交通大模型也一样,比如可以回答我高速公路的管控方案,也可以针对现有的各种挑战设计出全新的解决方案。

我们基于这样的背景设计出了大模型的整体技术架构。大模型的训练过程要花费非常多的计算资源和时间,模型训练完后,方案评估也就是回答问题的这个环节,相当于是往前算的概念;方案生成,也就是优化问题的这个环节,相当于是往后算的概念。在这样的技术体系下,我们旗帜鲜明地提出了我们的技术体系,就是融合各个数据、各个要素,打造的大模式交通的大模型体系。这个大模型体系还要从点、干线、网络三个不同的角度去刻画。

首先来看单点。简而言之,我们可以认为只有一个检测器时,怎样基于大量的数据进行模型和方法的革新。在单点的大模型体系下,很重要的突破就是单点所面临的人、车、路、环境,这交通的四要素应该全都是模型的参数,都是模型可以驾驭、可以优化的对象。现在的单点交通模型只把人和车,也就是需求本体作为变量,但大模型的体系就应该把所有这些要素作为变量和参数,最后模型自身就能够计算出最优的交通管控和信号配时的方案。这和以往的交通体系有着本质的不同,也是大模型的算力、算法、数据所能够带给我们的精度提升,最后实现了实际的交通工程的职能。

这方面的模型和算法的构建,我们是以高斯过程为体系来打造交通的单点大模型。为什么要用高斯过程,非常重要的一点就是在于它的变量、参数是可拓展的。当我们面对实际的复杂问题时,它应该从原来的三参数拓展到1000个参数、10000个参数,可以有着非常弹性的可扩展性。

另外一个点在于干线。如果说高速公路上有两个检测器,两个检测器之间存在着不可监测的范围。那么通过大模型,在检测器覆盖范围有限的情况下,就可以利用模型本身把整个交通流运行的轨迹、过程进行深度刻画。

这里面非常重要的模型体系体现在深度强化学习。深度强化学习现在往往只能分析有限个数的智能体,不超过1000个。但是交通问题中,深圳这样一个城市可能就是上千万个智能体。因此在今年年初,我们发表了一个新的体系叫做”集成强化学习”,解决了应用中大规模的深度强化学习如何同极具复杂性、随机性的交通系统进行有机融合的问题。

第三点是在路网下如何分析。路网非常重要的特点是它的检测器更加有限,大部分的路段是空白。针对这样的问题,我们所提出来的解决方案是构建迁移学习,基于已有检测器路段上获取到的信息构建出来的模型,再迁移到路网上的每一寸土地。所以我们不需要大规模铺设检测器,现在的算力、算法、数据加上模型本身的能力完全可以实现整个网络全覆盖的感知水平。

在这样的体系下,基于干线、单点、网络的大模型构建,我们打造了全新的交通大模型的范式。我们所提出的技术体系,关键在于交通工程所涉及的不同物理问题、物理对象应该区别对待。所以当我们把这样的模型体系放在腾讯云时,对外的界面是像ChatGPT一样是一个统一的界面,但水面以下是单点、干线和路网的多任务学习的集成。

在这样的技术体系下再来看具体的交通应用。交通应用中非常重要的一个特征是九龙治水,不同部门之间的数据壁垒和职能壁垒往往是实际问题的瓶颈所在。能不能让大模型基于不同体系的数据,最后提供一体化的解决方案,让大模型给各个部门带来具体职能的支撑?

我们最终给出一个体系解决方案,第一个答卷还是放在智慧公路上,包含了智慧高速。智慧公路的体系是最为完备的,因此基于智慧公路的建、管、养、运、规划、设计的六大职能,我们提出大模型可以发挥作用的十个不同体系。十大体系中,基于我们构建出来的大模型对于人流、车流、物流的运动规律的精准刻画,从原来只有3类参数拓展到100类、上亿个参数,这样庞大的模型体系和技术工具的支撑,给整个应用体系带来范式的革命。

这样的范式落地在具体的规划设计任务中有很多可以发挥作用的例子。第一点,单点大模型非常重要的应用在于公路的养护。智慧公路和机器视觉最经典的案例是利用巡检车的机器视觉来做路面养护的自动化替代。但目前这些巡检车往往是单体作战,运行速度很慢,对各种复杂场景的识别精度也很差。但如果我们融合了各类交通大模型的工具,和巡检车融为一体,就可以让巡检的车辆以现在4倍、5倍的速度来检测,降本增效的同时带来精度的巨大提升。干线大模型也是一样。它可以把所有的人、车、路、环境的要素全部作为模型的一部分,经过计算就可以输出高精度的最优管控方案。路网层面,现有的交通方案在做精细化调整时,往往是基于规范和标准发挥着人的能动性,带来很多随机性和不确定性。而大模型在城市路段、高速公路上发现交通流的异常状况后,可以在交通流状况的指引下,再基于无人机的地空巡航,对交通设计进行精细化的调整。

交通大模型就像新生婴儿一样,还在算力、算法、数据三个强力驱动要素下不断成长。基础理论是它的根基,应用是它的生命力。在大模型的体系下,我们通过一体化的模型构建,最后实现智慧化的提升,谢谢大家。

编辑:敬之

行业数据 更多