图片来源:互联网
G90自动驾驶谍照车
图片来源:互联网
搭载激光雷达的G90谍照
图片来源:互联网
图片来源:互联网
现代汽车的全球销量稳居600万辆之上,2020年销量下滑12%,但仍达635万辆,算单独厂家不算联盟的话,现代汽车销量第三,比第四名的通用汽车略高,因此现代汽车的自动驾驶还是值得一看的。
图片来源:互联网
L3级自动驾驶传感器布局如上。激光雷达方面,现代汽车旗下子公司现代摩比斯曾经5千万美元投资老牌激光雷达公司Velodyne,并且与Velodyne研发量产低价激光雷达,现代摩比斯代工Velodyne的激光雷达,但比较遥远,现代汽车没有选择Velodyne的激光雷达,而是选择更老的法雷奥激光雷达,即二代Scala。
图片来源:互联网
更详细的参数如下。
图片来源:互联网
有效距离的参数尤其精密,不像大多数厂家简单说一个几百米,没有限定条件的参数毫无意义。在正前方,扫描密度有所增加,特别为双激光雷达设计。
图片来源:互联网
L3系统计算架构如上图。与大多数厂家不同,现代的方案力求低成本,连前视摄像头FR CMR居然用CAN-FD总线连接,而不是常见的以太网或SerDes,因此像素必然很低,估计不超过150万像素。FR RDR是前主毫米波雷达,FR C RDR和RR C RDR是4个角毫米波雷达。FR C LDR LH为左激光雷达,FR C LDR RH为右激光雷达。CCIC是中控与仪表一体的座舱显示屏,CCU实际是TCU,做OTA升级的。用韩文标注的那个是debug用的,量产时不存在。PHY是物理层芯片,大概率会是Marvell的88Q211,使用了7个PHY,大概要105-140美元。两个以太网交换机,大概率会是Marvell的88Q5050。MCU是英飞凌的TC397XP,目前缺货严重。
尽管是L3,仍然是双系统设计,且有两套供电系统。如果换了其他厂家肯定会说是L4。右侧的方框是主系统,左侧的是紧急备份系统。实际上是三套,还有一套自动泊车。这套系统应该是现代和Aptiv合资的Motional设计并生产的。
图片来源:互联网
先看备份系统,CPU是英特尔的Denverton,也就是Atom C3000系列,C3000系列只有三款是16核,即C3950、C3955和C3958。其中C3950的TDP功率最低,只有24瓦,C3958是31瓦,C3955是32瓦,现代大概率会选择C3958。C3000系列主要面向IoT领域,不是针对汽车领域,而针对汽车领域的是A3900系列。不过两者应该高度相似,均属于Atom3000系列。与A3900系列不同,C3000系列不带GPU,只有CPU。C3950目前零售价大约160美元,大量采购估计在100美元左右。
4核@2.0GHz的A3950的CPU算力为42160 DMIPS,C3958是16核@2.0GHz,算力应该为168.6K,大致略高于高通5纳米的SA8295,不过C3958是14纳米。此外X86的乱序执行能力比ARM要高不少,虽然DMIPS相当,但实际表现上X86很多时候都会比较好。宝马的L3系统也是选择了Denverton,估计也是16核,在传统激光雷达ICP算法中,主要靠CPU出力,这或许是为什么选择Denverton的原因。
主系统的核心元件是德州仪器的TDA4VMID,这是德州仪器针对ADAS和自动泊车推出的芯片,目前量产的仅一款即TDA4VMID,还有两款在2022年上半年有样片,一款是TDA4VMID Plus,一款是TDA4VLow。一片算力不够的话,可以4片并联。
图片来源:互联网
2022年德州仪器还有一款TDA4AH提供样片,这是德州仪器的旗舰芯片,采用8个A72@2.4GHz,算力达100KDMIPS,4个MMA,算力为36TOPS@INT8,4个C7x DSP,算力为320GFLOPS。
图片来源:互联网
TDA4VMID采用两个A72,算力大约25KDMIPS,1个MMA,算力为8TOPS,1个C7x DSP,算力80GFLOPS,1个GE8430,算力100GFLOPS。从板子看现代L3应该是采用了4片TDA4VMID,总CPU算力有100K,NPU有32TOPS,也算不错了。
图片来源:互联网
3个ARM Cortex-R5F实时锁步系统,让整体芯片达到ASIL-D级。
图片来源:互联网
预装与底层抽象层MCAL关联的Autosar驱动,由Vector开发。
图片来源:互联网
图片来源:互联网
深度学习方面,德州仪器开发了TI Deep Learning (TIDL),对三大推理深度学习模型都做了优化,尤其是微软的开放式神经网络交换ONNX。硬件方面,DSP增加了MMA即矩阵乘法加速器。
在这种布局下,DSP得以实现单周期的MAC指令。除DSP外的包括NPU一般都采用冯诺依曼架构,数据和程序共用总线和存储空间,在深度学习推理的卷积运算中,一条指令同时取两个操作数,在流水线处理时,同时还有一个取指操作,如果程序和数据通过一条总线访问,取指和取数必会产生冲突,而这对大运算量的循环的执行效率是很不利的。
图片来源:互联网
原文始发于微信公众号(佐思汽车研究):搭载激光雷达,德仪芯片的现代L3自动驾驶架构剖析
Welcome to join us.Aibang lidar industry communicationThere are currently 2,700 people, including relevant persons in charge from major lidar manufacturers and OEMs. Click on the tags below to filter
Lidar OEM Autonomous Driving application terminal laser VCSEL light detector sensor Optical element Optical module filter Galvanometer Optical components radome cover adhesive Electronic component semiconductor chip tier1 Parts Non-standard automation Hardware circuit board motor Coating Coating equipment Plastic Products vehicle electronics Surface treatment auto parts equipment Testing Equipment Connector plastic Material software trading acting College graduate School other
Download: