INDEX
Negative Logits
Hor
-0.07
tegen
-0.07
leb
-0.07
ndr
-0.07
meter
-0.07
Multiplier
-0.07
antiques
-0.07
క్ర
-0.07
préalable
-0.07
弄
-0.07
POSITIVE LOGITS
 
0.09
而言
0.09
പറഞ്ഞ
0.09
ഒ
0.08
几点
0.08
ഇവ
0.08
:↵↵
0.08
>
0.08
امیدوار
0.08
sgesamt
0.08
Activations Density 0.007%