INDEX
Negative Logits
)
0.44
той
0.43
聚集
0.43
πή
0.42
Archipelago
0.42
дето
0.40
n
0.40
ש
0.40
любо
0.39
власти
0.39
POSITIVE LOGITS
Saul
0.48
เวลา
0.47
træ
0.46
สอน
0.46
belangrijke
0.46
pointer
0.45
measurable
0.45
deflation
0.44
hohe
0.44
高く
0.43
Activations Density 0.002%