INDEX
Negative Logits
ួត
0.45
က
0.43
quirks
0.41
quirk
0.40
eaves
0.39
ோவின்
0.39
Firmware
0.38
Apostle
0.38
}->
0.38
ᑲ
0.38
POSITIVE LOGITS
줘
0.36
给
0.35
सा
0.35
Approach
0.35
ıştır
0.34
বিষ
0.34
стала
0.34
妇女
0.34
.\
0.34
ٹرز
0.34
Activations Density 0.000%