INDEX
Negative Logits
ı
1.67
ou
1.52
ers
1.41
şam
1.38
ان
1.38
븅
1.34
ega
1.33
нути
1.31
Reims
1.31
kelamin
1.30
POSITIVE LOGITS
с
1.52
С
1.45
్
1.41
ありません
1.39
れ
1.35
ভৌম
1.35
斯坦
1.35
س
1.35
ಸಲ್ಲ
1.34
ни
1.31
Activations Density 0.008%
ı
ou
ers
şam
ان
븅
ega
нути
Reims
kelamin
с
С
్
ありません
れ
ভৌম
斯坦
س
ಸಲ್ಲ
ни