INDEX
Negative Logits
scept
-0.08
Nim
-0.07
까
-0.07
Transparent
-0.07
Fraud
-0.07
einfachen
-0.07
Schweiz
-0.07
zem
-0.07
transparent
-0.07
einfacher
-0.07
POSITIVE LOGITS
ઘટાડ
0.09
कमी
0.08
sunscreen
0.08
తగ్గ
0.08
acaktır
0.08
plats
0.08
-containing
0.08
buildup
0.08
these
0.07
arette
0.07
Activations Density 0.001%