INDEX
Negative Logits
Candle
-0.09
candles
-0.08
सिर
-0.08
català
-0.07
candle
-0.07
üz
-0.07
최근
-0.07
алког
-0.07
infring
-0.07
Bany
-0.07
POSITIVE LOGITS
comprehension
0.10
clause
0.08
式
0.08
paradis
0.08
remarquable
0.08
<Item
0.08
989
0.08
0.07
truy
0.07
laporan
0.07
Activations Density 0.002%