[Question]: 为什么要用多个视角和高度的数据？

### Question

vln_datasets=r2r_125cm_0_30,r2r_125cm_0_45,r2r_60cm_15_15,r2r_60cm_30_30,rxr_125cm_0_30,rxr_125cm_0_45,rxr_60cm_15_15,rxr_60cm_30_30, scalevln_125cm_0_30,scalevln_60cm_30_30
测试时似乎只用了125cm_0_30的设定，为什么要用多个高度和视角的数据进行训练呢？是为了泛化吗？有没有测试过不同角度数据相比单一角度数据是否带来性能提升？
只用125cm_0_30数据的情况下大约有106K轨迹，用全部数据包含260K轨迹，用这么多数据的情况下，训练所需的计算资源加倍。