INDEX
Negative Logits
irling
-0.09
celle
-0.08
ethol
-0.08
ATT
-0.08
ansch
-0.08
AOL
-0.08
תג
-0.08
ifu
-0.08
rray
-0.07
immik
-0.07
POSITIVE LOGITS
helped
0.08
ranged
0.08
pies
0.08
バッグ
0.08
/simple
0.07
[++
0.07
carp
0.07
judiciary
0.07
/con
0.07
Tätigkeit
0.07
Activations Density 0.011%