INDEX
Negative Logits
Initialization
0.20
今後の
0.19
我们在
0.19
esperanza
0.19
fiducia
0.18
ഇപ്പോ
0.18
EXAMINATION
0.18
লিপিবদ্ধ
0.18
的這個
0.18
THIS
0.18
POSITIVE LOGITS
promotes
0.20
contradicts
0.20
defies
0.20
creates
0.19
threatens
0.19
violates
0.19
simulates
0.19
resembles
0.18
에는
0.18
prohibits
0.18
Activations Density 0.133%