INDEX
Negative Logits
nejen
-0.09
ream
-0.08
}`;↵↵
-0.07
}`
-0.07
nicht
-0.07
Talvez
-0.07
"}
-0.07
atentos
-0.07
aal
-0.07
imum
-0.07
POSITIVE LOGITS
illicit
0.11
prohibited
0.10
שום
0.09
toxic
0.09
verboden
0.09
quelcon
0.09
कोई
0.09
色情
0.09
poisonous
0.09
ਕੋਈ
0.08
Activations Density 0.021%