INDEX
Negative Logits
alright
-0.09
saben
-0.08
Okay
-0.08
Okay
-0.08
Rift
-0.07
اصيل
-0.07
وأن
-0.07
redo
-0.07
المن
-0.07
rana
-0.07
POSITIVE LOGITS
노력
0.10
ingenuity
0.08
biais
0.08
sheer
0.08
ausp
0.08
Alexander
0.07
decree
0.07
tới
0.07
omhoog
0.07
quirrel
0.07
Activations Density 0.465%