INDEX
Negative Logits
murderous
-0.07
゚
-0.07
threatens
-0.06
"*",
-0.06
利
-0.06
tấn
-0.06
戸
-0.06
','=','
-0.06
Nr
-0.06
нить
-0.06
POSITIVE LOGITS
WOW
0.07
feather
0.07
iferay
0.06
ंगल
0.06
Ended
0.06
�
0.06
ovies
0.06
teplot
0.06
Windows
0.06
ƒ
0.06
Activations Density 0.000%