INDEX
Negative Logits
kolem
-0.09
비
-0.07
où
-0.07
intox
-0.07
홍
-0.07
जहाँ
-0.07
.Timeout
-0.07
슈
-0.07
파트
-0.07
وسی
-0.07
POSITIVE LOGITS
eroo
0.08
方向
0.08
กลับ
0.08
omed
0.08
_direction
0.08
reman
0.08
방향
0.08
другой
0.08
-direction
0.07
direction
0.07
Activations Density 0.006%