INDEX
Explanations
former, latter, respectively, both
New Auto-Interp
Negative Logits
把它
0.43
ʹ
0.36
notation
0.35
താര
0.34
TL
0.34
0.33
、
0.33
application
0.33
वाडी
0.33
അതിന്റെ
0.33
POSITIVE LOGITS
前者
1.38
后者
1.02
latter
0.87
それぞれ
0.86
begge
0.82
respectivement
0.80
respectively
0.79
beide
0.79
keduanya
0.79
entrambi
0.77
Activations Density 0.962%