INDEX
Explanations
proper names, particularly those of people and institutions
New Auto-Interp
Negative Logits
Efq
-1.01
كومونز
-0.93
SharedDtor
-0.92
awtextra
-0.89
وتسجيلات
-0.89
脚注の使い方
-0.88
存于互联网档案馆
-0.84
مشين
-0.83
للاسماء
-0.82
محفوظة
-0.81
POSITIVE LOGITS
lie
0.50
h
0.45
hm
0.40
char
0.39
lies
0.39
nag
0.36
long
0.36
eng
0.35
rika
0.35
and
0.34
Activations Density 0.144%