INDEX
Negative Logits
schaut
-0.09
சக
-0.08
pping
-0.08
hosi
-0.08
“My
-0.08
ежегод
-0.08
Пок
-0.08
mahs
-0.08
“I
-0.08
катары
-0.08
POSITIVE LOGITS
X
0.07
tight
0.07
osomes
0.07
tort
0.07
_
0.07
governed
0.07
preciso
0.07
宴
0.07
RA
0.07
ڪٽ
0.07
Activations Density 0.002%