alignment-handbook

mirror of https://github.com/wassname/alignment-handbook.git synced 2026-06-27 17:29:09 +08:00

Files

T

lewtun f0ffa0d7a6 Update Zephyr configs to account for UltraFeedback & TRL fixes (#88 )

* Add files

* Add checkpointing

* Add checkpointing to SFT

* Add loss type

* Fix setup|

* Clean SFT

* Add lora config

* Rename config

* Remove max eval samples

* Add kwargs tp push to hub

* Add DPO configs

* Fix dpo configs

* Extend chat template test to multi-turn

* Add warmup

* Refactor

* Fix LoRA -> QLoRA

* Fix configs

* Specify chat template

* Add sample logging

* Fix push to hub hanging

* Add reentrant

* Fix quality

* Add transformer logging

* Tweak grad acc

* Add null type

* Add doc

2024-01-10 17:42:24 +11:00

accelerate_configs

Add doc

2023-11-09 07:32:24 +00:00

zephyr-7b-beta

Update Zephyr configs to account for UltraFeedback & TRL fixes (#88 )

2024-01-10 17:42:24 +11:00

launch.slurm

Update Zephyr configs to account for UltraFeedback & TRL fixes (#88 )

2024-01-10 17:42:24 +11:00