INDEX
Negative Logits
taut
-0.08
dá
-0.08
AIM
-0.07
primordial
-0.07
bunch
-0.07
Chargers
-0.07
anh
-0.07
mot
-0.07
bactér
-0.07
हाल
-0.07
POSITIVE LOGITS
Hew
0.07
వి�
0.07
Kant
0.07
rape
0.07
cab
0.07
gul
0.07
gu
0.07
Deutsche
0.07
patched
0.07
sage
0.07
Activations Density 0.030%