INDEX
Negative Logits
HS
-0.08
HM
-0.07
,_
-0.07
Genre
-0.07
取り
-0.07
oco
-0.07
FS
-0.07
_{-0.07
πα
-0.07
Amerikaanse
-0.07
POSITIVE LOGITS
shade
0.09
тү
0.08
congregation
0.08
terrorism
0.08
Markus
0.08
Nev
0.08
onns
0.08
fent
0.08
lamp
0.08
395
0.07
Activations Density 0.004%