newsmix

Zana Statistica ne minte frumos?

In Uncategorized on Octombrie 9, 2008 at 11:23 am

____De sute de ani, anumite voci incearca sa rada pe seama acestei Zane a Numerelor. De ce m-as mira? Inca mai vad frecvent persoane, altfel aparent serioase, care se lauda cu propriile betesuguri.

____„Vai, eram varza in liceu la mate!”, zice eroina/eroul razand. Este o replica pe care as traduce-o prin: „Sunt constient ca am un defect de ordin intelectual si sunt mandru de el. Vreti sa-mi vedeti si platfusul?”.

____(Nu ?) voi cadea in cliseul de a pomeni replica cu cele trei forme de minciuna: ordinara, gogonata si Statistica. (Cel mult ?) voi dezminti parerea generala ca ii apartine lui Mark Twain; este a lui Benjamin Disraeli, prim-ministru al Marii Britanii … cu mult timp in urma. Cand inca se mai practica autocritica, probabil.

____De sus, de la „centru”, oamenii se vad mici.

____Probleme concrete au doar cand sunt la toaleta sau cand sunt rapiti in Sudan. In orice alta situatie sunt supusi terori abstracte a statisticii. Aproape tot ce mancam, imbracam, ascultam, consumam in vreun fel, este un „ce” statistic. Id est, sunt produse dupa retete stabilite pe baza unor studii, facute pe esantioane, s.a.m.d.

***

____Serviciul NewsMix se foloseste de statistica in doua feluri. Pe de o parte utilizeaza metoda pentru a-si fixa proprii parametri de functionare (zona ascunsa), pe de alta pentru a oferi date de sinteza, cu caracater integrator/macro/bla-bla (zona vizibila).

____Cu greu imi stapanesc dorinta hitchcockiana de a vorbi iar despre maruntaiele aplicatiei. Deci, bagheta Zanei este „amestecata” in calculul distantei dintre documente, influentand astfel toate produsele derivate, cum ar fi rezultatele Cautarii Simple sau functia de Articole Similare. Tot ea si-a lasat amprenta asupra scorurilor de vizibilitate, care permit realizarea de Topuri de tot felul printre personaje.

____Diagrama evolutiva de tip Trend, de exemplu, este un produs statistic de-a dreptul desantat; pe langa faptul ca sintetizeaza un scor de vizibilitate agregat, este trecuta si printr-o procedura de mediere locala (pe segmente de timp de lungime setabila). Esti adus in fata unui grafic care nu mai evidentiaza ansamblul complicat de date initiale, cu toate detaliile stufoase legate de numarul si structura surselor media implicate, de articolele concrete in cauza, de fluctuatiile naturale ciclice ale vizibilitatii oricarui subiect. Te uiti la un grafic curatat de „zgomote”, care spune, simplu, povestea evolutiei unui subiect.

***

____Nu ignorati utilitatea si forta concluziilor obtinute pe temei statistic. Singura alternativa cunoscuta este geniul, floare mult mai rara.

de Catalin Cucu-Dumitrescu

Anunțuri

Lasă un răspuns

Completează mai jos detaliile tale sau dă clic pe un icon pentru a te autentifica:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

Fotografie Google+

Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

Conectare la %s

%d blogeri au apreciat asta: