INDEX
Negative Logits
ځکه
-0.09
individual
-0.08
因为
-0.08
generaciones
-0.08
tarv
-0.07
genero
-0.07
因
-0.07
culto
-0.07
boldly
-0.07
革
-0.07
POSITIVE LOGITS
صحة
0.08
^\
0.08
&&
0.08
defined
0.08
bestimm
0.07
><
0.07
rechter
0.07
Maße
0.07
ર્સ
0.07
against
0.07
Activations Density 0.004%