INDEX
Negative Logits
依据
-0.09
Projekt
-0.08
.sensor
-0.08
Lü
-0.08
Chamber
-0.08
些什么
-0.08
stell
-0.07
Dol
-0.07
ijnen
-0.07
Sensor
-0.07
POSITIVE LOGITS
grease
0.08
요
0.07
racism
0.07
grey
0.07
fuck
0.07
veh
0.07
cose
0.07
fog
0.07
='/
0.07
..
0.07
Activations Density 0.001%