INDEX
Negative Logits
torture
-0.08
explic
-0.08
ада
-0.08
河南
-0.08
�
-0.08
Vall
-0.07
广东
-0.07
Rebecca
-0.07
Penn
-0.07
OV
-0.07
POSITIVE LOGITS
ønsk
0.08
wünschen
0.08
egne
0.08
ngoing
0.08
Welche
0.08
Inject
0.07
iscos
0.07
concession
0.07
egen
0.07
qilib
0.07
Activations Density 0.000%