INDEX
Negative Logits
sz
-0.08
siz
-0.08
boom
-0.08
blica
-0.08
ें
-0.08
Jackie
-0.08
herzlich
-0.08
כאן
-0.08
שלום
-0.07
行政
-0.07
POSITIVE LOGITS
eighteenth
0.07
boolean
0.07
intimate
0.07
!!!
0.07
sete
0.07
attacks
0.07
shoot
0.07
بمج
0.07
যায়
0.07
(question
0.07
Activations Density 0.028%