Is it correct to keep using adapter_kv_cache during training in litgpt/adapter.py?

Is it correct to keep using `adapter_kv_cache` during training in `litgpt/adapter.py`? I think `self.adapter_wte` and `self.attn` are updated during training, so ak and av should not use `kv_cache`. Thank you very much!
But it seems that during training, `self.adapter_kv_cache` was also used.
![image](https://github.com/Lightning-AI/litgpt/assets/44500103/9c81c968-3712-4d89-acc2-40154297f2e5)