INDEX
Negative Logits
-0.07
}, ↵
-0.06
forfeiture
-0.06
finden
-0.06
Dungeon
-0.06
Grill
-0.06
prites
-0.06
geçir
-0.06
Mang
-0.06
losses
-0.06
POSITIVE LOGITS
/********************************************************************************
0.07
Leave
0.07
Freedom
0.07
وت
0.06
victim
0.06
Male
0.06
cam
0.06
ROAD
0.06
обличчя
0.06
Freedom
0.06
Activations Density 0.002%