interp_variable_list

Training and interpreting a transformer to sort lists of variable length. From Neel Nanda's 200 concrete open problems in mechanistic interpretability. in progress.

Trained a 1 layer 4 head attn only transformer

Accuracies

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md
attentionpatterns.png		attentionpatterns.png
seqacc.png		seqacc.png
transformer_variable_list_interp.ipynb		transformer_variable_list_interp.ipynb
variable list.ipynb		variable list.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

interp_variable_list

About

Uh oh!

Releases

Packages

Languages

Jordine/interp_variable_list

Folders and files

Latest commit

History

Repository files navigation

interp_variable_list

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages