INDEX
Explanations
negations and modal verbs expressing ability or permission
New Auto-Interp
Negative Logits
ⓧ
-0.50
TargetException
-0.49
providedIn
-0.44
-0.43
Искәрмәләр
-0.43
jooq
-0.42
SequentialGroup
-0.42
nahilalakip
-0.42
AxisAlignment
-0.41
__(/*!
-0.40
POSITIVE LOGITS
den
0.63
einen
0.53
seinen
0.52
ihren
0.47
los
0.46
ins
0.46
einen
0.45
seine
0.45
naar
0.42
את
0.41
Activations Density 0.102%