INDEX
Negative Logits
_pat
-0.07
uuid
-0.07
příst
-0.07
�
-0.06
Knox
-0.06
ω
-0.06
indem
-0.06
ار
-0.06
_PARAM
-0.06
استان
-0.06
POSITIVE LOGITS
exercise
0.07
ерб
0.07
jun
0.07
individual
0.06
Incorrect
0.06
versed
0.06
lesbians
0.06
overlooking
0.06
final
0.06
proper
0.06
Activations Density 0.013%