INDEX
Negative Logits
ர்ப்பு
0.39
شارة
0.37
шить
0.36
nonetheless
0.35
ğine
0.35
гов
0.35
ktorý
0.35
propagand
0.35
engers
0.34
يدات
0.34
POSITIVE LOGITS
赫
0.46
அறி
0.41
Ха
0.38
Ռ
0.38
exposé
0.37
ха
0.36
hepat
0.35
0.35
બનાવી
0.35
ވަ
0.35
Activations Density 0.001%