INDEX
Negative Logits
(i
-0.08
(
-0.08
~
-0.07
↵↵↵↵↵↵↵↵
-0.07
(se
-0.07
bh
-0.07
se
-0.07
.are
-0.07
tsa
-0.07
sh
-0.07
POSITIVE LOGITS
ทาง
0.11
чад
0.10
քով
0.09
მარტო
0.09
ന്തപുര
0.09
ავალ
0.09
lesbisk
0.09
เมื่อคืน
0.09
остью
0.09
ตอน
0.09
Activations Density 0.016%