INDEX
Explanations
country names
New Auto-Interp
Negative Logits
ಗಳನ್ನು
0.55
u
0.53
larni
0.50
이었
0.47
Childs
0.46
及ひ
0.46
JVM
0.45
কারীর
0.44
regime
0.44
↵
0.43
POSITIVE LOGITS
،
0.68
be
0.65
ك
0.65
an
0.63
,
0.61
ка
0.58
。
0.56
$.
0.56
(
0.54
。",
0.54
Activations Density 0.135%