INDEX
Negative Logits
кога
-0.08
abi
-0.08
городской
-0.08
晒
-0.08
도시
-0.07
,length
-0.07
निर्म
-0.07
య
-0.07
రీ
-0.07
cities
-0.07
POSITIVE LOGITS
empath
0.10
empathy
0.09
░
0.09
Bewert
0.08
empat
0.08
compassion
0.08
sabotage
0.08
664
0.08
Gew
0.08
评
0.08
Activations Density 0.002%