INDEX
Explanations
comparative phrases in various languages
New Auto-Interp
Negative Logits
ſta
-0.80
itſelf
-0.79
ſou
-0.75
juſ
-0.74
ſon
-0.74
houſe
-0.74
ſever
-0.73
حياته
-0.72
pleaſure
-0.72
ſtate
-0.71
POSITIVE LOGITS
como
1.35
як
1.24
COMO
1.18
Como
1.16
Como
1.12
comme
1.12
как
1.10
como
1.07
jako
1.05
as
1.01
Activations Density 0.141%