INDEX
Negative Logits
shaved
-0.08
ешь
-0.08
enjoying
-0.07
ייב
-0.07
हम
-0.07
kro
-0.07
dried
-0.07
-network
-0.07
utamente
-0.07
783
-0.07
POSITIVE LOGITS
futures
0.10
SAT
0.09
futuros
0.08
পৌ
0.08
raeg
0.08
સ્ત
0.08
વગેરે
0.08
SAT
0.08
सित
0.07
સાધ
0.07
Activations Density 0.027%