INDEX
Negative Logits
CPP
-0.09
.exe
-0.08
mes
-0.08
enca
-0.08
rushed
-0.07
treiben
-0.07
Auch
-0.07
essen
-0.07
erwartet
-0.07
নির্ব
-0.07
POSITIVE LOGITS
Forbidden
0.11
Forbidden
0.10
forbidden
0.09
掉
0.09
forbid
0.09
கிர
0.08
Adjacent
0.08
prohibit
0.07
,谢谢
0.07
Certain
0.07
Activations Density 0.015%