INDEX
Negative Logits
elector
-0.08
ster
-0.08
jong
-0.08
fren
-0.08
thor
-0.07
sər
-0.07
’яз
-0.07
nii
-0.07
eval
-0.07
woven
-0.07
POSITIVE LOGITS
settling
0.10
slower
0.10
slows
0.09
paciencia
0.09
slow
0.09
slowed
0.08
धी
0.08
filed
0.08
Slow
0.08
Slow
0.08
Activations Density 0.003%