INDEX
Negative Logits
-0.07
fold
-0.07
Originally
-0.07
precar
-0.07
Flyers
-0.07
manej
-0.07
expect
-0.07
distress
-0.07
शिकायत
-0.07
Note
-0.07
POSITIVE LOGITS
roar
0.12
规模
0.10
louder
0.09
实力
0.09
roaring
0.09
大的
0.09
ആരാധ
0.09
reigning
0.09
壮
0.08
烈
0.08
Activations Density 0.005%