INDEX
Negative Logits
Beverungen
0.43
ChatMessage
0.43
রাজশ
0.42
geändert
0.41
perkara
0.41
صہیونیوں
0.41
toilette
0.41
ⵃ
0.41
খেজুর
0.40
ായത്
0.40
POSITIVE LOGITS
-
0.56
STOP
0.44
OMB
0.40
–
0.39
0.39
’
0.39
US
0.38
s
0.37
NASA
0.37
U
0.37
Activations Density 0.026%