INDEX
Negative Logits
battery
-0.09
bath
-0.08
battery
-0.08
Conn
-0.08
_conn
-0.08
oamen
-0.08
â
-0.07
conn
-0.07
-t
-0.07
-0.07
POSITIVE LOGITS
صحة
0.08
-helper
0.08
حوق
0.08
hoorde
0.08
مدير
0.08
lem
0.08
Airline
0.08
нулся
0.08
تجا
0.08
�
0.08
Activations Density 0.004%