11 martie 2009

Statistica ... în ştiinţele sociale

Citesc un eseu academic care pledează implicit şi explicit pentru introducerea statisticii în curriculum obligatoriu. Nu, nu e vorba de România.

Am citit că 50% dintre studenţii britanici în ştiinţele sociale declară că nu se tem de statistică (din păcate nu reuşesc să regăsesc articolul pentru a oferi referinţa exactă!). Acest lucru este un uriaş pas înainte în comparaţie cu ce se petrecea în anii 1990.

Mai ştiu şi că marea majoritate a românilor cu studii superioare au dificultăţi de citire a unor tabele cu dublă intrare sau a unor grafice simple. Între ei sunt şi mulţi absolvenţi de doctorat.

Mă întreb cum or fi reuşit să rezolve problema în UK? Cum or fi schimbat atitudinile studenţilro faţă de statistică?

Oare să fi renunţat să mai predea toate acele formule nesfârşite la BA? Să le fi lăsat doar pentru cei care vor să dezvolte metodele statistice în sine şi să fi realizat că majoritatea audienţei este formată din utilizatori? Să se fi concentrat pe aplicaţiile practice?

(PS1. Atunci când conduci o maşină te gândeşti oare mereu la Carnot şi la Diesel? Atunci când deschizi un aparat de radio te gândeşti la PNP şi la NPN?)

(PS2. Am urmat săptămâna trecută un curs susţinut de un profesor neamţ, bine cotat prin publicaţiile sale. Nu e statistician, dar e implicat în dezvoltarea metodologiei cantitative. Are adesea aceleaşi probleme ca şi românii, ca şi mulţi alţi profesori de statistică socială: se "agaţă" adesea în aparatul matematic şi nu mai iese de acolo. Îi este uneori greu să găsească u limbaj de comunicare mai puţin sofisticat şi care să treacă dincolo de formule şi să ajungă la obiective şi la interpretare. Din fericire îl ajută tipul de audienţă, cu un nivel relativ avansat de stăpânire a domeniului. În plus, îl ajută experienţa de a publica. Faţă de românii pe care îi cunosc (ca şi faţă de mulţi alţii, indiferent de naţionalitate), nu este totuşi atât de obsedat de formule şi reuşeşte să discute şi despre utilizarea metodei, nu doar despre construcţia acesteia. Oricum, efortul este considerabil.)

8 comentarii:

--------- spunea...

Statistica, logica, oratorie... avem cateva lacune barosane in curriculum.

Anonim spunea...

N-ar fi mai simplu pentru voi, sociologii, sa va luati niste matematicieni(statisticieni) in echipa? Matematica(statistica) nu e decat un instrument pentru voi, e adevarat, in ceva mai mica masura decat pentru ingineri sau fizicieni. Un arhitect nu poate sa faca mai bine singur o casa.Are nevoie de tot felul de meseriasi. Nu de alta, dar in ultimii ani ati luat-o rau pe aratura, cu sondajele. O directoare de la INSOMAR spunea ca diferentele intre exit-poll si rezultatele oficiale se "datoreaza"
faptului ca n-au sondat si in diaspora. Oare femeia asta o fi inteles ceva din statistica? Turambar ii spunea cuiva ca probabilitatea ca un individ sa fie ales intr-un esantion al unui sondaj este de 1/volumul esantionului. Carevasazica, daca esantionul are volumul 1, e sigur ca orice individ din Romania e ales in esantion.Sau, cum la 6 din 49 o singura combinatie da marele premiu, probabilitatea ca eu sa castig duminica este de 100%.Cu asemenea oameni in pozitii cheie, nu va vad bine.Oare nemtii cum de au "nimerit" rezultatele, la ultimele lor alegeri parlamentare, cu asa mare acuratete?

Bogdan spunea...

Exemplul german nu e unul tocmai bun, când vine vorba de predicţia electorală ...



Altfel, analogia cu construcţiile mi se pare interesantă, dar nu foarte nimerită:


Arhitectul analizează problema, proiectează, apoi constructorul construieşte, utilizând materiale de la producătorii de ciment (de exemplu).


În ştiinţele sociale procesul este diferit:
1-2. cercetătorul analizează mai întâi problema, îşi construieşte la nivel teoretic modelul explicativ, emite ipotezele ce urmează a fi testate, proiectează instrumentele.

3. Apare apoi culegătorul de date, și aplică instrumentele (fie că e vorba de colectare de date macro, sau micro, calitative sau cantitative - i.e. "de sondaj").

4. Datele merg înapoi la social scientist - cel ce a proiectat instrumentul#, şi acesta validează ipotezele (sau le invalidează), eventual construieşte analize suplimentare, interpretează cele observate prin prima explicaţiei teoretice elaborate la punctul 1 etc. Practic cel ce construieşte casa este cel ce a proiectat-o, nu cel ce îi oferă o parte din instrumentele (statistice sau nu) de analiză a datelor.

[# adesea e vorba de analize secundare, însă pentru a nu complica şi mai mult prezentarea, spu doar că procesul este relativ similar, exceptând pasul 3]

Cu alte cuvinte, aparatul statistic joacă aici rolul ciocanului, al dălţii, al excavatorului, al macaralei etc.: poate fi indispensabil, însă trebuie să ştii cum să îl utilizezi şi în mai mică măsură cum să îl construieşti.

Esenţiale sunt modelul teoretic şi cunoaşterea generală asupra metodelor prin care poţi testa ipotezele. Evident, mânuirea acestor metode face parte din meserie.

(din această perspectivă, demersul de cercetare din sociologie seamănă mai degrabă cu cel din fizică, sau cu conducerea unui automobil, decât cu construirea unei case)



/din păcate, adesea, datele pe care le vedem vehiculate în presă şi opiniile despre ele reprezintă rodul exclusiv sau cvasiexclusiv al punctului 3 de mai sus. Trecem în prezent printr-un proces de învăţare la nivel de societate care va schimba din fericire lucrurile. Din câte observ, acelaşi lucru se întâmplă peste tot în ţările cu care ne comparăm de obicei./

Marian Vasile spunea...

Din cele auzite, chiar de la oameni care au trecut prin firma respectiva, am inteles ca acolo e o mare concentratie de matematicieni/statisticieni pe m2. Deci poate nu asta e problema? Poate ca tocmai ca statisticienii/matematicienii nu inteleg cum e cu sociologia si problemele de a lucra cu oamenii nu doar cu cifre.

Pe de alta parte, din cele discutate cu oameni care lucreaza in cercetare (inclusiv de marketing) am remarcat o constanta nemultumire a separarii "cercetarii" de "statistica" (adica exista departamente diferite). Oare de ce?

Si in fine, fara sa fac referire la INSOMAR sau la cercetarea citata, studiile politice sunt "sensibile", cu atat mai mult cu cat nu exista o asociatie sau, ma rog, o voce care sa fie critica cu ceea ce se publica.

Si ca sa nu raspund doar la ceea ce a scris Adi: ce ne facem cand nu exista calculatoare pe care sa lucrezi aplicat? Cand seminariile de statistica sunt tinute mai mult pe genunchi? Si aici cred ca e o viziune reductionista: de ce asociem statistica doar cu cursul/seminarul de statistica? Sociologia, se spune, e o stiinta aplicata. Deci si multe dintre cursurile facute la facultatea de sociologie necesita analize statistice. De exemplu eu maine am seminar pe stratificare sociala intr-o sala de seminar cu banci asezate ca la scoala primara si fara nici un calculator inauntru. Are multe prize in schimb :) . I-am rugat sa vina cu laptopurile din dotare ca sa ne uitam pe niste date... Cred ca de fapt asa vor invata studentii statistica si nu le va mai fi frica de materia asta: facand la celelalte seminarii aplicatii pe domenii mici. Altfel statistica e un fel de analiza matematica facuta in clasa 11-12 despre care nici azi nu am inteles de ce am facut-o la liceu economic. Un obiect pur didactic.

Bogdan spunea...

Hai să zicem că ai dreptate cu aplicaţiile din fiecare sociologie de ramură. Îţi dai seama ce ar implica asta pentru cei are predau? Îţi aminteşti c-te comentarii din care să reiasă că au înţeles metoda ai primit de la astfel de oameni? Cum ar fi să vorbească despre aplicaţiii cantitative? (evident, nu rstrâng metoda de investigare la cantitativ...)

Altfel, mă întreb ce om zice peste 10 ani de ce scriem aici. Oare cum era în UK acum 10 ani?

În fine, mă întreb cum s-o calcula aria aia de sub curba normală? Asta nu înseamnă însă că nu găsesc nivelul analizei matematice de clasa a XI-a şi de clasa a XII-a ca fiind excesiv de ridicat.

Bogdan spunea...

A, să nu uit:

Prizele sunt pentru telefoanele mobile. Să nu sufere studenţii şi cadrele didactice dacă se descarcă în timp ce vorbesc în timpul cursului.

Aici, în Koln, pe perete la PC Lab, scrie că nu e voie cu telefoane mobile. Şi nici acolo, nici la curs nu se aude niciunul sunând. Îmi vine să râd amintindu-mi de reacţia studenţilor români atunci când le spun la curs că una dintre reguli este să îşi închidă telefonul...

vlllad spunea...

Mie sincer statistica sociala pe care am invatat-o in facultate mi s-a parut prea "umanizata" (avand o abordare de stiinte umane). Nu inseamna ca o consider un fleac. Sunt chestii pe care nu am reusit sa le pricep dpdv logic. Dar as fi vrut mai multe formule, nu mai putine, ca sa inteleg mai bine cum e cu distributia normala, de exemplu. Incercam sa fac o legatura intre matematica din IX-XII (liceu de reala) si nu reuseam sa gasesc veriga lipsa. E adevarat ca nici eu nu m-am preocupat foarte mult sa caut singur informatii.

Oricum, mi se pare ciudat ca, desi materia din liceu este mai dificil de inteles decat statistica sociala din facultate apare aceasta frica de statistica. Cred ca e mai degraba o fobie, o teama irationala, credinta ca "trebuie sa fie greu", un blocaj psihic. Nu vorbesc aici de analiza factoriala, sau mai stiu eu ce. Insa nu vad cum ai putea sa te sperii de un crosstab, chiar daca ai facut liceul de umana.

Cred ca aria de sub curba normala poate fi exprimata ca o integrala a functiei care defineste aceasta curba (dar nu am idee care este functia aceasta). Informatia asta ar fi fost utila celor familiari cu conceptul de integrala pentru a intelege mai bine de ce. Privite din perspectiva non-matematica, multe elemente din statistica inferentiala par imposibil de inteles. ex. De ce principal components e mai buna pentru analiza exploratorie? (mentionez ca nu stiu raspunsul la aceasta intrebare pentru ca nu cunosc algoritmul din spatele metodei.

Bogdan spunea...

Crosstab? Hm. Mai nou a inceput sa mi se para irelevant. Am o experienta de 7 ani de predat la un master, unde le faceam un soi de statistica unor studenti care 1) aveau o expunere prealabila redusa la statistica; 2) nu aveau perspective de a produce analize, dar urmau probabil sa fie expusi la analiza.

Am sesizat ca analiza de regresie, mai complexa decat tabelele de contingenta, este mai simplu de inteles, daca discuti despre obiectivele ei, despre ce e important de urmarit la ea, si apoi despre bazele matematice (peste care oricum treceam in fuga).

Datele categorice sunt mai greu de urmarit, iar simpla crosstabulare detine adesea prea putina incarcatura de interpretare substantiala.

Atunci ce rost are rost sa discuti despre distributia lui hi patrat, despre diferenta dintre valori asteptate si valori observate, despre un intreg jargon nou, oarecum nonßintuitiv, ca sa ilustrezi o simpla asociere?

Pentru neinitiatul in statistica sociala aceasta da senzatia de inutilitate: vorbarie multa si complicata (prin jargon, nu neaparat prin complexitate), pentru a obtine un rezultat mai putin folositor... Asta dupa ce primele cursuri se concentrasera iarasi pe lucruri absconse, non-aplicative, ca sa preiau termenii lui Marian, precum distributii si forma lor, probabilitati etc. Lucruri non-tangibile.

Curba normala si aria de sub ea sunt extrem de utile, asa cum sunt utile si toate formulele de la OLS, algebra matriceala din spatele analizei factoriale etc. Numai ca nu la inceput.

La inceput este esential scopul de urmarit si caile simple de ajuns acolo. Exact asa cum la condusul unui automobil este important sa stii cum sa invarti volanul si sa apesi pe pedale, nu cum se face ca poicatura aia de benzina genereaza energie...

BTW, din cate stiu eu PCA e buna doar la analiza exploratorie. Asta pentru ca ea cauta sa descompuna spatiul reducand pe cat posibil numarul dimensiunilor. Iar analiza exploratorie... nu este la fel de utila ca cea confirmatorie. Si asta nu are absolut deloc de a face cu algoritmul din spatele PCA...

Convorbire telefonică cu ... un hoț??

Sună telefonul, de pe un număr necunoscut, vizibil (adică nu este ascuns), iar o voce de bărbat mă angajează în următoarea convorbire: -  ...