INDEX
Negative Logits
dajj
0.25
খ্যান
0.24
vudd
0.24
fórm
0.23
agacch
0.23
tabpos
0.23
뀔
0.23
dakkh
0.22
Fcm
0.22
兩
0.22
POSITIVE LOGITS
'
0.24
Also
0.23
OpenAI
0.23
Also
0.23
ChatGPT
0.23
Chat
0.23
0.23
Don
0.23
0.22
Which
0.22
Activations Density 0.001%