INDEX
Negative Logits
Rud
-0.07
Television
-0.06
testName
-0.06
Shakespeare
-0.06
Yok
-0.06
мов
-0.06
мод
-0.06
位置
-0.06
відпов
-0.06
ус
-0.06
POSITIVE LOGITS
cream
0.19
Cream
0.17
creams
0.13
Cream
0.13
cream
0.10
creamy
0.09
regime
0.08
крем
0.07
ीम
0.07
arine
0.07
Activations Density 0.003%