INDEX
Negative Logits
harming
-0.07
Drug
-0.06
_APPLICATION
-0.06
legalization
-0.06
активно
-0.06
:\
-0.06
поверх
-0.06
retorno
-0.06
autofocus
-0.06
ToUpdate
-0.06
POSITIVE LOGITS
ed
0.07
wed
0.07
402
0.06
LED
0.06
мещ
0.06
iosa
0.06
ht
0.06
lerdir
0.06
*T
0.06
iland
0.06
Activations Density 0.029%