Ik heb ondertussen maar zelf via google een antwoord gezocht doch weliswaar niet gevonden.
Want wat blijkt die verticale lijn (of blijkbaar whisker in het Engels), wordt bepaald volgens een conventie waarvan Wikipedia stelt dat het correct zou zijn om die in de uitleg bij de boxplot te verduidelijken.
Wat blijkt, mijn conclusie uit jullie geschreven tekst is juist. Als jullie werkelijk de bovenste en onderste 25% van uw dataset aanduiden, dan moeten de outliers per definitie in die lijn zitten.
Het feit dat er outliers zichtbaar zijn, buiten die lijn, maakt duidelijk dat jullie niet volgens de, door jullie zelf in de tekst beschreven, conventie de figuren opstellen, maar een andere conventie gebruiken.
Alleen verduidelijken jullie niet volgens welke conventie jullie die verticale lijn dan wel bepalen.
Een nieuwe vraag dus, in deze cursus, voor dit vak, volgens welke conventie wordt die VERTICALE lijn opgesteld?
- worden outliers per definitie, altijd uitgesloten?
- gaat het om p10 en p90 ?
- of gaat het eerder om p5 en p95 ?
- of volgen jullie (computerprogramma's) nog een andere "standaard" en welke is dat dan?