INDEX
Negative Logits
Kh
0.40
thus
0.40
LEN
0.38
LEX
0.38
thus
0.38
RAS
0.38
vias
0.37
DAV
0.37
এইরূপে
0.37
this
0.36
POSITIVE LOGITS
why
0.52
awfully
0.52
mengapa
0.49
为什么
0.45
alright
0.45
kenapa
0.45
為什麼
0.45
стран
0.44
ironic
0.44
interesting
0.43
Activations Density 0.010%