INDEX
Negative Logits
them
0.50
thus
0.46
heureux
0.45
ین
0.44
filmmakers
0.43
ើត
0.43
မှုကို
0.42
று
0.41
eradic
0.41
謄
0.41
POSITIVE LOGITS
और
0.63
आणि
0.61
и
0.56
এবং
0.56
và
0.56
και
0.55
અને
0.55
และ
0.55
และ
0.53
և
0.53
Activations Density 0.003%