Политика, обученная на 1000 синтезированных IGen данных, достигла 75.0% успеха в задаче размещения бутылки, в то время как базовая модель показала 0.0%
Политика, обученная на 1000 синтезированных IGen данных, достигла 75.0% успеха в задаче размещения бутылки, в то время как базовая модель показала 0.0%