INDEX
Negative Logits
KL
-0.09
RG
-0.09
KL
-0.08
Parteien
-0.08
razlog
-0.08
Rusia
-0.08
Russians
-0.08
cargas
-0.08
rms
-0.07
Adler
-0.07
POSITIVE LOGITS
سل
0.08
ని
0.08
ουμε
0.08
ల
0.08
esprit
0.08
验证
0.07
.validators
0.07
folk
0.07
вор
0.07
zinye
0.07
Activations Density 0.006%