Question
vln_datasets=r2r_125cm_0_30,r2r_125cm_0_45,r2r_60cm_15_15,r2r_60cm_30_30,rxr_125cm_0_30,rxr_125cm_0_45,rxr_60cm_15_15,rxr_60cm_30_30, scalevln_125cm_0_30,scalevln_60cm_30_30
测试时似乎只用了125cm_0_30的设定,为什么要用多个高度和视角的数据进行训练呢?是为了泛化吗?有没有测试过不同角度数据相比单一角度数据是否带来性能提升?
只用125cm_0_30数据的情况下大约有106K轨迹,用全部数据包含260K轨迹,用这么多数据的情况下,训练所需的计算资源加倍。
Question
vln_datasets=r2r_125cm_0_30,r2r_125cm_0_45,r2r_60cm_15_15,r2r_60cm_30_30,rxr_125cm_0_30,rxr_125cm_0_45,rxr_60cm_15_15,rxr_60cm_30_30, scalevln_125cm_0_30,scalevln_60cm_30_30
测试时似乎只用了125cm_0_30的设定,为什么要用多个高度和视角的数据进行训练呢?是为了泛化吗?有没有测试过不同角度数据相比单一角度数据是否带来性能提升?
只用125cm_0_30数据的情况下大约有106K轨迹,用全部数据包含260K轨迹,用这么多数据的情况下,训练所需的计算资源加倍。