INDEX
Negative Logits
jokes
-0.10
®.
-0.08
juices
-0.08
_);↵
-0.08
sentences
-0.08
322
-0.08
edan
-0.07
Attribute
-0.07
erg
-0.07
Attribute
-0.07
POSITIVE LOGITS
เดิน
0.08
apt
0.07
เป็น
0.07
ทั่วไป
0.07
provenant
0.07
陽
0.07
(cols
0.07
ガ
0.07
(*)
0.07
nước
0.07
Activations Density 0.026%