Salut!
A mai pățit cineva să se simtă complet copleșit de numărul de instrumente de analiză date care există? Tocmai încerc să finalizez metodologia pentru disertație și, sincer, nu știu dacă să merg pe SPSS, R, Python... sau poate chiar ceva mai simplu, gen Excel, deși coordonatorul meu nu pare foarte încântat de idee.
Am lucrat puțin cu SPSS în timpul licenței, dar mi se pare cam limitat pentru ce vreau să fac acum - analiza de conținut calitativ, combinată cu niște chestionare. R pare puternic, dar am impresia că ar trebui să învăț o limbă nouă ca să-l pot folosi eficient. Python sună bine, mai ales că am auzit că e util și în alte domenii, dar timpul e scurt și mă tem să nu mă apuc de prea multe.
Mă lupt cu partea asta de câteva zile și orice sugestie ar fi binevenită. Ați folosit ceva anume pentru proiecte similare? Ce avantaje și dezavantaje ați întâmpinat? Orice experiență ar fi utilă, chiar și dacă e doar un "ferit-te de X, e o pierdere de timp".
Mulțumesc!
Petrică Gheorghiu.
Salutare tuturor!
Mă bucur că nu sunt singurul care se simte puțin... înecat în opțiuni. Am mai stat puțin pe gânduri și cred că problema principală e că vreau să fac totul deodată, să acopăr toate unghiurile.
Cred că am să mă concentrez pe R, totuși. Am găsit câteva pachete care par să se potrivească destul de bine cu analiza de conținut calitativ (gen quanteda și tm) și, deși curba de învățare e abruptă, am găsit o grămadă de tutoriale online. Măcar am senzația că investesc într-o competență care o să-mi fie utilă și pe viitor, nu doar pentru disertație.
Excel, chiar dacă e rapid și ușor, mi se pare că o să mă blocheze repede, mai ales când vine vorba de vizualizări mai complexe sau de analiza unor volume mari de date. Și coordonatorul are dreptate, nu e tocmai "serios" pentru o lucrare de disertație.
SPSS rămâne o opțiune de rezervă, dacă R se dovedește prea complicat. Măcar am niște cunoștințe de bază.
Dacă cineva a lucrat cu quanteda sau tm și are niște sfaturi, aș aprecia enorm! Sau, dacă ați folosit altceva pentru analiza de conținut calitativ în R, spuneți-mi, vă rog.
Oricum, mulțumesc pentru răspunsuri și pentru înțelegere. E bine să știu că nu sunt singurul care se confruntă cu dilemele astea.
Petrică Gheorghiu.
Salut Petrică,
Te înțeleg perfect! Dilema asta cu instrumentele de analiză e clasică, mai ales când ești la început de drum cu cercetarea. E bine că ai ajuns la concluzia că R e o investiție bună pe termen lung, chiar dacă pare intimidant la început. Ai dreptate, curba de învățare e abruptă, dar resursele online sunt fantastice și te pot ajuta să depășești obstacolele.
Eu am lucrat destul de mult cu quanteda pentru analiza de conținut și pot să-ți spun că e foarte puternic. Un sfat pe care ți-l pot da, bazat pe experiența mea, e să te concentrezi pe înțelegerea conceptelor de bază ale procesării textului (tokenizare, stemming, stopwords etc.) înainte să te arunci direct în cod. Odată ce ai o bază solidă, quanteda devine mult mai intuitiv.
De asemenea, nu te speria de documentație! E destul de detaliată și are o mulțime de exemple. Și, dacă te blochezi, forumurile și Stack Overflow sunt pline de oameni dispuși să ajute.
În legătură cu vizualizările, ggplot2 e pachetul standard în R pentru grafice și e incredibil de flexibil. Poți crea vizualizări complexe și personalizate, mult peste ce poți face în Excel.
SPSS e bun pentru început, dar ai dreptate, e limitat. Și coordonatorul tău are un punct: pentru o disertație, R sau Python arată mult mai bine.
Nu te mai stresa prea mult cu "ce ar fi trebuit să fac" și concentrează-te pe R. Dacă te simți copleșit, începe cu un tutorial simplu și lucrează pas cu pas. Vei vedea că, în curând, vei fi mult mai confortabil cu el.
Mult succes cu disertația! Și nu ezita să întrebi dacă te pot ajuta cu ceva specific legat de quanteda sau R.
Adina Nicolae.