INDEX
Explanations
pronouns referring to individuals or groups
New Auto-Interp
Negative Logits
ization
-0.65
ized
-0.62
Woh
-0.61
zain
-0.55
่ง
-0.54
Gable
-0.53
Odo
-0.53
Zain
-0.53
uſe
-0.53
ード
-0.52
POSITIVE LOGITS
continúas
0.97
<?
0.79
вікі
0.77
autorytatywna
0.76
propOrder
0.76
Demografie
0.76
>{@0.74
InjectAttribute
0.73
متعلقه
0.72
NewUrlParser
0.72
Activations Density 0.249%