Forum

Eșantionare: Reprez...
 
Notifications
Clear all

Eșantionare: Reprezentativitate - Cum facem?

3 Posts
2 Users
0 Reactions
2 Views
Posts: 5
Topic starter
(@cati.man)
Active Member
Joined: 1 an ago

Salut!

A mai pățit cineva să se simtă complet blocat în faza asta cu eșantionarea? Adică, teoretic înțeleg totul - eșantionare aleatorie simplă, stratificată, pe clustere, ce vrei tu. Am citit o grămadă despre reprezentativitate, despre cum trebuie să reflecte populația țintă, bla bla. Dar când mă gândesc la lucrarea mea… sincer, nu știu dacă ce am ales eu chiar e ok.

Tema mea e despre percepția studenților despre inteligența artificială în educație. Am zis să fac un chestionar online, dar mi-e teamă că o să ajung să am un eșantion super biased - adică, o să răspundă doar cei care sunt deja super interesați de AI, sau cei care au cursuri unde se folosește.

M-am gândit să încerc să distribui chestionarul prin grupuri de studenți de la facultăți diferite, nu doar de la Informatică sau Automatică, dar tot mi se pare că nu e suficient.

Coordonatorul meu a zis ceva despre ponderare, dar nu am înțeles exact cum aș putea să aplic asta în cazul meu. Mă lupt cu partea asta de câteva zile și încep să mă simt un pic depășit.

Ați avut probleme similare? Ce trucuri ați folosit ca să vă asigurați că eșantionul e cât mai reprezentativ? Orice sfat ar fi binevenit!


2 Replies
Posts: 232
(@adrian.pavel)
Estimable Member
Joined: 2 ani ago

Salut Cati,

Te înțeleg perfect! E o problemă clasică, mai ales când te apuci de prima lucrare serioasă cu eșantionare. Teoretic sună bine, dar treci la practică și realizezi că e mult mai complicat decât pare. Ai dreptate să fii îngrijorat de bias-ul ăsta, e exact ce se întâmplă cel mai des.

Distribuirea prin grupuri de la facultăți diferite e un pas bun, dar nu e suficient, ai intuit bine. Problema e că, chiar și așa, cei care aleg să răspundă vor fi totuși diferiți de media studenților. Cei foarte pasionați sau cei care au avut o experiență directă (bună sau rea) cu AI vor fi mult mai motivați să completeze chestionarul.

Legat de ponderare, coordenatorul tău are dreptate, dar e o chestie care necesită date suplimentare. Practic, dacă știi exact care e structura populației tale (adică, procentul de studenți de la fiecare facultate, an de studiu, etc.), poți să ajustezi rezultatele astfel încât să reflecte mai bine realitatea. Dar asta înseamnă să ai acces la date despre toți studenții, nu doar la cei care au răspuns.

Eu, când am avut o problemă similară, am încercat să abordez problema din două direcții:

  1. Diversificarea canalelor de distribuție: Pe lângă grupuri de studenți, am încercat să distribui chestionarul prin email-uri către listele de studenți (dacă ai acces), prin intermediul profesorilor (rugându-i să-l distribuie în timpul cursurilor, chiar și scurt), și chiar prin postări pe rețelele sociale (dar cu atenție, pentru că și acolo riști bias).
  2. Încercarea de a identifica și cuantifica bias-ul: Chiar dacă nu poți elimina bias-ul complet, poți încerca să-l măsori. De exemplu, poți include în chestionar întrebări despre familiaritatea cu AI, cursurile urmate, etc. Apoi, poți compara răspunsurile celor care au răspuns cu datele despre populația țintă (dacă le ai) și să vezi dacă există diferențe semnificative.

Nu te descuraja! E normal să te simți depășit, e o parte din proces. Important e să fii conștient de limitările eșantionului tău și să le menționezi în lucrare. Și nu ezita să mai discuți cu coordenatorul tău, poate te poate ajuta să înțelegi mai bine cum poți aplica ponderarea în cazul tău specific.

Spor la treabă!


Reply
Posts: 5
Topic starter
(@cati.man)
Active Member
Joined: 1 an ago

Salut Adrian,

Mersi mult pentru răspuns! Mă simt deja mai bine știind că nu sunt singura care se lovește de problema asta. Ai dreptate, sună simplu în teorie, dar în practică e un coșmar.

Ideea cu diversificarea canalelor de distribuție e super bună, n-am gândit să cer ajutorul profesorilor direct, mi se pare o variantă mult mai eficientă decât să mă bazez doar pe grupuri. O să încerc și cu email-urile, sper să aibă facultatea o listă accesibilă. Cu rețelele sociale sunt mai reticentă, ai dreptate, bias-ul ar fi și mai mare acolo.

Și faza cu cuantificarea bias-ului mi se pare foarte inteligentă. N-am pus întrebări despre familiaritatea cu AI până acum, dar cred că ar fi o idee excelentă să adaug câteva. Așa măcar pot să văd dacă eșantionul meu e format în majoritate din "experți" sau dacă am și o reprezentare a celor care nu știu nimic despre subiect.

Legat de ponderare, o să mai insist cu coordonatorul. Poate dacă-mi explică pe un exemplu concret, o să înțeleg mai bine. Mă gândesc că ar fi util să știu măcar procentul de studenți pe facultăți, chiar dacă nu am date despre toți studenții.

Mă bucur că mi-ai spus să menționez limitările în lucrare. Mă simțeam un pic vinovată


Reply
Share: