INDEX
Negative Logits
SIC
-0.08
cki
-0.08
맛
-0.07
.Note
-0.07
če
-0.07
Starting
-0.07
SI
-0.07
ಳ
-0.07
Če
-0.07
нач
-0.07
POSITIVE LOGITS
Naw
0.08
Aust
0.08
abb
0.08
Watching
0.08
_bd
0.07
-meta
0.07
�
0.07
精神
0.07
0.07
Hall
0.07
Activations Density 0.002%