INDEX
Negative Logits
explique
-0.56
-0.52
Espèce
-0.49
pensive
-0.49
atheist
-0.49
EClass
-0.48
Tiberius
-0.47
cshtml
-0.44
celib
-0.43
bw
-0.43
POSITIVE LOGITS
IsMutable
0.63
ویکیپدیا
0.62
#+#
0.58
⮕
0.54
Carriera
0.53
tramp
0.52
rrggbb
0.52
Seitz
0.52
possano
0.50
opérés
0.50
Activations Density 0.000%