INDEX
Negative Logits
مكافحة
-0.07
word
-0.07
filtered
-0.07
ukkit
-0.06
worth
-0.06
_SUS
-0.06
Lúc
-0.06
Best
-0.06
urret
-0.06
bring
-0.06
POSITIVE LOGITS
cached
0.07
砀
0.07
kişi
0.07
curved
0.07
egy
0.06
iği
0.06
anom
0.06
blooms
0.06
один
0.06
nested
0.06
Activations Density 0.002%