INDEX
Explanations
articles and determiners preceding nouns
New Auto-Interp
Negative Logits
nahilalakip
-0.68
}}}
-0.60
2
-0.60
1
-0.56
}))
-0.56
3
-0.55
4
-0.52
all
-0.51
7
-0.49
5
-0.48
POSITIVE LOGITS
فريبيس
0.84
ertale
0.82
Мексичка
0.77
localObject
0.77
GeoNames
0.76
ORAGE
0.76
andte
0.76
CppCodeGen
0.76
æus
0.76
</thead>
0.76
Activations Density 0.070%