INDEX
Negative Logits
dragons
-0.06
hurt
-0.06
狗
-0.06
dff
-0.06
ンデ
-0.06
hp
-0.06
0
-0.06
icio
-0.05
90
-0.05
oreach
-0.05
POSITIVE LOGITS
тор
0.07
Concrete
0.07
UNIVERSITY
0.07
defy
0.07
elevate
0.07
iế
0.06
China
0.06
червня
0.06
/book
0.06
ระด
0.06
Activations Density 0.096%