TEMA2 : 1 noiembrie 2007 - 19 noiembrie 2007
Enunt:
Pe internet exista un mare numar de comunitati online. Prin comunitate pe internet intelegem o multime de oameni ce efectueaza o activitate impreuna (scriu mesaje pe un forum, joaca un joc multiplayer, etc.). Pe baza acestor activitati se formeaza retele sociale – grafuri de mari dimensiuni ale relatiilor online dintre membrii comunitatii. Pentru a extrage un astfel de graf dintr-o aplicatie online metoda uzuala este de a scrie un program care analizeaza paginile web ale site-ului comunitatii si extrage datele referitoare la colaborarile dintre persoane. Acest program trebuie sa-l faceti voi ca temaJ
- Paginile site-ului sunt generate dinamic => toate vor avea aceeasi structura.
- Cea mai mare parte a linkurilor din aceste pagini duc tot in pagini ale site-ului.
Din aceste proprietati rezulta ca este suficient sa se scrie un script/clasa/functie care sa analizeze o pagina HTML si sa se aplice aceasta functie pe toate linkurile din interiorul site-ului.
Datele extrase din site-ul web vor fi salvate intr-o baza de date ce va avea urmatoarea structura:
In tabelul colaborare se salveaza toate instantele de colaborari dintre 2 utilizatori, tipul colaborarii (pot fi mai multe tipuri in functie de tipul comunitatii – de exemplu pentru o comunitate unde se joaca un joc online pot fi urmatoarele tipuri de relatii – A joaca impotriva lui B, A joaca in echipa cu B, A ii da reply lui B pe forumul jocului, etc.), detalii colaborare – in functie de tipul comunitatii pot sa fie rezultatul jocului, mesajul schimbat, etc.
- Bloguri gazduite pe acelasi server (blogspot.com, wordpress.com, etc)
- Forumuri (forumuri bazate pe phpbb, vBulletin, etc)
- Jocuri online (hattrick.org, online.bridgebase.com/myhands, etc., sah sau pool de pe yahoo games)
· Scrierea/utilizarea unui mic crawler web
Niciun comentariu:
Trimiteți un comentariu