INDEX
Negative Logits
ataan
0.70
atakse
0.58
vene
0.58
нено
0.58
uttaa
0.57
orp
0.55
ades
0.54
äten
0.54
طن
0.54
amiseks
0.52
POSITIVE LOGITS
мую
0.69
した
0.68
Château
0.61
出した
0.57
した
0.56
Canadiens
0.56
サ
0.55
führte
0.55
った
0.55
となった
0.53
Activations Density 0.000%