第一次请求之后,python主进程在模型运算后被挂上了16g的显存占用,一直下不去,各种清缓存、垃圾回收、del模型的方法都试了,无效,最后改了个输出的参数,没问题了

输出的参数 use_cache 设置为 False 之后,一切恢复正常,虽然显存居高挂着,但是不报错了