Taxonomia si Clasificarea Informatiei in produsele online

22-managementul-calitatiiaudio-icon video-icon.png pdf-icon checklist-icon

Taxis vine din limba greaca si inseamna ordine, aranjare. Taxonomia se refera la clasificarea lucrurilor, conceptelor, principiilor intr-o organizare logica.

Prin 2010 lucram din cand in cand la un proiect « de sertar » care a prins contur si a intrat in analiza. Numele de cod al proiectului era Businesoo si isi propunea sa schimbe celebra axioma “6 degrees of separation” in “one degree of separation” in lumea business-ului european. Pentru asta trebuia sa darame cea mai importanta bariera a Uniunii Europene, un spatiu economic complex dar care se desfasoara cultural in 24 de limbi oficiale si peste 60 de limbi regionale. Sigur engleza, franceza si germana acopera o mare parte din comunicare, insa cei care vorbesc toate cele trei limbi nu sunt foarte multi. Aici intervenea Businesoo, care permitea fiecarui utilizator sa isi desfasoare activitatea de site in limba sa materna, urmand ca interactiunea sa ia forma pentru ceilalti in limbile lor materne. Si de aici intrebarea stratupului : Cum sa clasifici mii de produse si servicii intr-o forma care sa fie optima pentru baza de date si pentru operarea in multiple limbi ? 5 ani mai tarziu intrebarea este inca pe masa cu un raspuns aproximativ …

Intrebarea care si-o pune real proprietarul unui website este : Chiar am nevoie de clasificarea informatiei ? Clientul nostru, stapanul nostru. Utilizatorul nostru, stapanul nostru. Studiile au aratat ca din 10 oameni pusi sa caute o informatie online rezulta 10 moduri diferite de gandire a cautarii si ajungere la informatie. E normal, creierele noastre functioneaza diferit. Insa in toate cazurile cautarea s-a orientat dupa REPERE. Iar Clasificarile sunt un mare reper pentru minte, sunt Ghiduri care ne permit sa nu inmagazinam enorm de multa informatie. Acesta este motivul principal pentru care trebuie sa ne clasificam informatia din site, indiferent de marimea lui.

Ce metode de clasificare a informatiei putem folosi ?

Cel mai simplu sistem de clasificare este Categoria. Albe, Negre, Rosii si fiecare dupa culoare in categoria sa. Exprimarea vizuala a unui sistem simplu se poate face in Harta Websitului (Sitemap), o reprezentare schematica a unei informatii simple. Complicarea acestui sistem este Multi-Categoria, sau adaugarea unui al doilea, al treilea nivel de adancime. Albe , Albe-Pure si Albe-Impure. Exprimarea vizuala a unui sistem multi-categorie se face prin intermediul Breadcrumb , adica a unui insiruiri logice de sus in jos a categoriilor. Un exemplu de Breadcrumb : “Albe > Albe Impure > Albe Impure Partial”.

Daca Categoriile nu sunt bine delimitate deja ne apar primele semne de intrebare. Un articol poate fi clasificat SI – SI si modul in care rezulta analizele trebuie sa tina cont de aceasta. Daca vinzi articole sportive in magazinul tau online o crosa de golf semnata de Tiger Woods s-ar putea sa fie clasificata atat la Produse>Golf>Crose cat si la Produse>Produse Rare>Autografe, iar statisticile de vanzare trebuie sa tina cont ca produsul se afla in ambele clasificari.

Pentru a facilita clasificarea multipla folosim conceptul de TAG sau, ca sa fim in trend cu miscarea social-media, de #hashtag. Practic aceasta inseamna o etichetare suplimentara fata de orice clasificare, a oricarui produs, articol sau item din cadrul sitului,caruia putem sa ii legam una sau mai multe etichete care ne permit clasificari suplimentare paralele. Crosa de golf poate primi etichete #tigerwoods, #autograf, #2016, #turneu, #pau. In masura in care statisticile sunt flexibile, clasificarea este mai bine facuta. Iar pentru utilizator, reprezinta adaugarea unor elemente logice in plus pentru regasirea informatiei.

Ataturi de etichetare o alta facilitare se poate obtine si prin localizare, a carei exprimare vizuala se face prin mapping, livrarea unor harti de proximitate, populate doar cu informatia dorita (harta pensiunilor disponibile dintr-o regiune specifica). Geolocalizarea conteaza mult pentru utilizator cand cautarea sa vizeaza locatia si este clasificarea primara pentru serviciile de turism si pentru aplicatiile care fac interactiune intre utiizatori.

Ultimul tip de clasificare “simpla” se gaseste in NOR, adica nu se pre-clasifica nimic intial, insa din utilizare, informatia grupeaza interesele si le coaguleaza. Informatia o ofera utilizatorii si datele introduse in sistem. Numarul de clasificari este infinit si rezultatul este o structura DINAMICA de N categorii cu N subcategorii cu N taguri si N locatii. Practic orice element al structurii poate reclasificat, regrupat, in acelasi timp in alta structura paralela, singura lege care mentine sistemul fiind UTILIZAREA. Structurile rezista atata timp cat sunt folosite.

Un exemplu: sa zicem ca vind carti, am circa 300.000 titluri la vanzare si intre ele sunt si carti pentru copii, care din utilizare le pot clasifica ca si carti de colorat, povesti, benzi desenate si carti educative. Putem face clasificarea in acest mod, dar in doi ani de la lansare constatam ca utilizatorii nu mai sunt interesati de aceasta structura, cautand mai degraba carti de 2 ani, 3 ani, 4 ani. Decidem daca schimbam sau montam o a doua structura dinamica (depinde de resursele aflate la dispozitie, pentru ca munca de clasificare a produselor inglobeaza foarte mult timp de munca efectiv – o reclasificare a 500 de titluri presupune cunostinte bune si un volum de 10 ore de munca).

 

Meta Datele

Definitia Metadatelor ar fi “un set de date care descriu mai bine si contin informatii despre datele initiale”. Adica un fel de explicatie suplimentara pentru o mai buna intelegere. In Internet metadatele sunt foarte importante. Initial au fost prezentate ca elemente de baza pentru motoarele de cautare, dar importanta sau mai bine zis, rolul lor s-a schimbat in timp. Ele presupun sa marcam informatia de baza cu : scopul creatiei informatiei, scopul datelor, timpul si data creatiei, autorul si drepturile asupra datelor, locul si reteaua de creatie, standarde utilizate, marimea fisierelor. Pentru fotografii ar putea fi extinse la marimea pozei, culori, rezolutie, etc.

Ratiunea existentei Metadatelor este Standardizarea. Eu fac o clasificare, tu alta clasificare, motorul de cautare trebuie cumva sa clasifice mai repede munca a un miliard de creatori. Daca fiecare din ei foloseste anumite standarde recomandate, este mult mai usor ca informatia sa fie clasificata. O crosa intr-un magazin online este un produs al carui scop este comercial, care este de vanzare in Europa, a fost pus in vanzare acum un an, este un produs original, si contine dscriere foto si video. Sa nu uitam ca Meta tagul <TITLE> este in continuare cel mai important element pentru motoarele de cautare.

 

Sisteme si algoritmi

Din punctul de vedere al motorului de cautare, se ordoneaza toate elementele pre-clasificate, insa deseori aceasta munca de clasificare nu o fac toti standardizat. Esti obligat sa folosesti algoritmi, mai ales cand volumele de date se contorizeaza in milioane de Terrabytes. Si aici ajungem aproape de un subiect care imi este foarte drag si care se numeste “Machine Learning”, care vizeaza gasirea de modalitati matemetice si probabilistice pentru a clasifica informatia. Daca sistemul ar putea invata singur si sa atinga Inteligenta Artificiala, atunci toate eforturile noastre de clasificare ar trebui sa scada la zero, sistemul stiind exact ce articole si informatii avem si la ce folosesc. Avem algoritmi de Machine Learning, algoritmi de Data Mining si algoritmi de Clasificare a datelor. In total numarul lor este de 200, de metode stiintifice diferite. Forta de a pune la munca impreuna multiple metode produce in timp performanta (se vede in brevetele depuse continuu de specialisti).

Ca urmare a perfectionarii motoarelor de cautare, atat interne cat si externe, exprimarea vizuala cea mai simpla a acestor algoritmi care noi o cunoastem este bara de cautare. Scriem si obtinem rezultatul dorit, in majoritatea cazurilor, EXACT ce am cautat.

Pentru Businessoo am incercat adaptarea a 5 clasificari internationale de produse si servicii, am incercat sa definim noi propriile clasificari, am incercat sa construim dupa modele existente, nimic nu a iesit. Intr-un eveniment al Strartup West desfasurat la St Malo (France), unul din proiectele prezentate era condus de 4 doctoranzi in materia incidentei digitale a limbilor de la IDL Atlantique din Nantes. Le-am prezentat proiectul si am cerut sfatul. Dupa 5 ani de cautari raspunsul primit a fost dur, insa a ridicat “valul” care il aveam peste ochi. Mi-au spus “nu trebuie sa faci nimic!”. Cuuum ??? “nu trebuie sa faci nimic acum … intai strangi datele si abia apoi incepi sa le clasifici – nu ti se va potrivi nici o alta clasificare care o incerci”. Si astfel proiectul a repornit.  
materialul face parte din e-book-ul EQ – eBusiness Quotient, click pe imaginea de mai jos pentru a-l obtine
Ponturi in e-commerce

Download eBook E-Commerce in Romania Ponturi in E-Commerce Download eBook Download eBook

Publicitate Parteneri

vrei ca reclama ta sa fie prezenta aici ? mail la claudiu at gamulescu punct ro
Underclick, Strategie si Marketing

Claudiu Gamulescu

Din 1998 in afacerile digitale. Dezvoltator si Consultant. Am inceput in 2004 studierea pietei românesti de e-commerce, si de atunci ma preocupa continuu. Ma puteti gasi si pe Facebook si Twitter. Reprezint serviciile Underclick.

You may also like...