INDEX
Negative Logits
creams
-0.08
benar
-0.08
Fili
-0.08
comprenant
-0.08
Jennings
-0.07
wij
-0.07
soq
-0.07
Beschwerden
-0.07
истин
-0.07
unanimous
-0.07
POSITIVE LOGITS
hjäl
0.09
vật
0.08
物
0.08
GPT
0.08
Aim
0.07
文本
0.07
Paste
0.07
loh
0.07
물을
0.07
dam
0.07
Activations Density 0.218%