INDEX
Negative Logits
atani
0.49
éhez
0.47
erende
0.46
ამდ
0.46
Lewandowski
0.45
ंदन
0.45
Florent
0.43
brun
0.43
Floren
0.42
conde
0.42
POSITIVE LOGITS
extremism
0.48
العملية
0.47
hiểm
0.46
高效
0.46
handleChange
0.45
เรา
0.44
我们会
0.44
নেওয়ার
0.42
genomes
0.42
আবিষ্কার
0.42
Activations Density 0.006%