INDEX
Negative Logits
πάν
-0.08
kurt
-0.08
├
-0.07
协调
-0.07
تعمیر
-0.07
संग
-0.07
培训
-0.07
හ
-0.07
സംഘടിപ്പ
-0.07
ನೀಡಿದ್ದಾರೆ
-0.07
POSITIVE LOGITS
nothing
0.09
humain
0.08
humanos
0.08
humana
0.08
মানব
0.08
Human
0.08
bron
0.08
manusia
0.08
human
0.08
idhe
0.08
Activations Density 0.000%