INDEX
Negative Logits
hog
-0.85
Hog
-0.77
HOG
-0.74
fog
-0.69
Fog
-0.68
Fog
-0.67
Hog
-0.66
hogs
-0.60
FOG
-0.58
WillAppear
-0.57
POSITIVE LOGITS
propOrder
0.66
")));
0.63
)';
0.60
🏽
0.58
}';
0.58
arty
0.57
rungsseite
0.57
🏼
0.56
🏻♀️
0.56
}');
0.56
Activations Density 0.019%