INDEX
Negative Logits
%S
-0.07
ør
-0.07
淑
-0.07
ASF
-0.07
Refriger
-0.07
thrift
-0.07
fracture
-0.06
bruk
-0.06
噪
-0.06
-reader
-0.06
POSITIVE LOGITS
остоя
0.08
_linear
0.07
enderit
0.07
جتماعية
0.07
ද
0.06
챤
0.06
eea
0.06
الحكومية
0.06
$('0.06
المجتمع
0.06
Activations Density 0.002%