INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     calmly
    -0.08
    lägg
    -0.07
     reminders
    -0.07
     Cal
    -0.07
     Verfügung
    -0.07
    -0.07
     CAL
    -0.07
     खो
    -0.07
    เบ
    -0.07
     termin
    -0.07
    POSITIVE LOGITS
     tunnet
    0.09
    finger
    0.09
    اقة
    0.08
    rot
    0.08
    ماع
    0.08
    אות
    0.08
     guit
    0.08
    يوان
    0.08
    imata
    0.08
     Passenger
    0.08
    Act Density 0.002%

    No Known Activations