INDEX
Explanations
references to historical figures or events
New Auto-Interp
Negative Logits
supple
-0.41
AutoScaleMode
-0.40
Tikang
-0.39
buttonBar
-0.39
#+#
-0.39
хівовано
-0.38
arias
-0.37
blan
-0.37
prossimo
-0.36
ParallelGroup
-0.36
POSITIVE LOGITS
當時
0.75
damals
0.70
当时
0.69
damal
0.67
当時は
0.65
当时的
0.63
那时
0.62
مشين
0.60
那时候
0.60
当時
0.58
Activations Density 0.412%