INDEX
Negative Logits
intuit
-0.08
regulators
-0.08
sada
-0.07
Regul
-0.07
cau
-0.07
sila
-0.07
abras
-0.07
absor
-0.07
-0.07
SAF
-0.07
POSITIVE LOGITS
Westminster
0.09
thigh
0.08
снять
0.08
air
0.08
Difficulty
0.08
ayan
0.07
Cape
0.07
urlaub
0.07
bodas
0.07
rem
0.07
Activations Density 0.001%