Projekti në tërësi është i ndarë në këto module:

1. Grumbullimi i informacionit dhe kërkimi

Përshkrim

Informacioni i grumbulluar në InfoArkiv është i mbledhur nga disa agjentë informacionit {Quareo Bot}. Agjentët janë të programuar të lundrojnë cdo ditë në secilën nga faqet web ku merret informacioni. Për cdo faqe të lundruar, agjenti ka një informacion specifik i cili e ndihmon në përzgjedhjen e informacionit të saktë për t’u tërhequr.

Informacioni i mbledhur përmban tekst, imazhe dhe video.

Për të lehtësuar gjetjen e informacionit në një bazë të gjerë të dhënash, në sistem janë përfshirë dhe 2 module kërkimi. Moduli i parë i kërkimit bën një kërkim të thjeshtë në arkivë, ndërsa kërkimi i dytë (kërkimi i përparuar), mundëson përcaktimin e disa kushteve që lehtësojnë përcaktimin e informacionit të dëshiruar.

Rrezultatet

Rrezultat i këtij procesi është pasurimi i faqes me informacion. Aktualisht informacioni ka kaluar 150 000 artikuj (të dhëna Dhjetor 2008) dhe cdo ditë shtohen më shumë se 400 artikuj të rinj dhe unikë

Sistemi ynë kontribuon me informacion në domainin www.search.al për servirjen me informacion.

Fjalëkyçe

Rrobotë, agjentë kërkimi, makinë kërkimi, mediat shqiptare, grumbullim, semantic web

2. Klasifikimi i informacionit

Përshkrim

Informacioni i mbledhur nga agjentët e kërkimit, shërbehet tek vizitorët në bazë:

kategorie informacioni
media nga ku buron informacioni
datë informacioni

Ky kategorizim klasik i lajmit nuk bën një lidhje të lajmit me lajme të njëjtë që i përkasin të njëjtës temë, që lidhen me të njëjtën dukuri apo individ.

Për të krijuar familje lajmesh që i përkasin të njëjtës temë (lidhen nga një individ apo dukuri), në projektin tonë do të programohen agjentë të tjerë autonom të cilët do te merren pikërisht me kategorizimin e lajmeve në familje.

Programimi i këtij seksioni do të bëhet në bazë të procesimit të gjuhës naturale (NLP – Natural Language Processing). Për cdo lajm do të bëhet një analize gjuhësore duke vecuar emrat dhe foljet . Ndajfoljet, lidhëzat e të tjera kategorizime gjuhësore do të përjashtohen si jombajtëse informacioni. (Në një situatë perfekte, edhe ndajfoljet dhe lidhëzat do të përmbanin informacion, por jo në një sistem inteligjence artificiale).

Rrezultatet

Bazuar mbi trajtat e lakimit të emrave dhe zgjedhimit të foljeve, sistemi do të ndërmarrë grumbullim të lajmeve duke ofruar Lajme të ngjashme.

Një para hap për zhvillimin e këtij sistemi është krijimi i një fjalori. Fjalori do të përmbajë zgjedhim/lakimin/trajtat e termave të fjalorit. Në bashkëpunim me komunitetin në internet, pritet që ky fjalor të zgjerohet në kuptim dhe përshkrim të termave të tij.

Fjalëkyçe

terma, kategorizim informacioni, fjalor, gjuhësi

3. Integrimi i një sistemi përdoruesish

Përshkrim

Një sistem përdoruesish do të integrohen në Infoarkiv. Ky sistem do të mundësojë krijimin e një komuniteti rreth informacionit të publikuar. Përdoruesit do të kontribuojnë me fakte, komente e vlerësime rreth lajmeve të publikuar. Ndërsa sistemi do të mundësojë disa lehtësi për përdoruesit si ruajtje e lajmeve interesante (bookmarks).

Rrezultatet

Sistemi i integrimit të përdoruesve do të ndihmojë vizitorët në përcaktimin e lajmeve interesante si dhe ruajtjen e lajmeve interesante.

Fjalëkyçe

profile, përdorues, komunitet, bookmarks.

4. Implementimi i një strukture inteligjente për servirjen e lajmeve

Përshkrim

Ky sistem do te mbështetet mbi modulin e përdoruesve të infoarkivës. Duke u bazuar mbi profilin/interesat e përdoruesve dhe vizitat që ata bëjnë mbi lajme të ndryshme, sistemi do të grumbullojë të dhëna statistikore. Këto të dhëna, të analizuara nga një sistem inteligjent informacioni do të përzgjedhin informacionin që do i sugjerohet cdo përdoruesi të projektit.

Rrezultatet

Sistemi do të servirë lajmet sipas profilit të përdoruesve në web dhe në desktop. Veprimet që përdoruesi do të ketë me sistemin, do të përcaktojnë lajmet që do te serviren në të ardhmen në vazhdimësi.

Fjalëkyçe

Inteligjence artificiale, user behaviour, përdorues, komunitet, bookmarks.

Qëllimi i Infoarkivës

Çfarë është Infoarkiva

Infoarkiva është një projekt i mirëfilltë informatik. Sistemi ka si qëllim grumbullimin e informacionit mediatik shqiptar, përpunimin e tij bazuar mbi teknika auto-inteligjente dhe më tej prezantimin tek të gjithë përdoruesit. Aktualisht i gjithë ky informacion mblidhet nëpërmjet internetit me anë të agjentëve tanë të informacionit {Quareo Bot}. Aktualisht projekti cilësohet akoma në fazat e para.(shënim: Dhjetor 2008).

Sistemi ynë do të ofrojë mundësi lundrimi dhe përzgjedhje informacioni në hapësirën e faqeve shqiptare të internetit. Në ndryshim nga kërkimet në makina kërkimi si Google, Yahoo-Inktomi, Live-MSN etj, sistemi ynë përmban një informacion të kufizuar shqiptar.

Ky projekt është jo fitimprurës. Faqja web nuk do të përmbajë reklama fitimprurëse! Kjo bëhet për të rrespektuar prodhuesit e vërtetë të lajmit.

Vazhdimësia e këtij projekti do të mundësohet nga ShqipëriaCom Shpk. Nëse jeni të interësuar të bashkëpunoni apo sponsorizoni këtë projekt atëherë ju lutem na kontaktoni. Shërbime dytësore që mund të implementohen në të ardhmen mund të jene një burim mbështetje financiare për ardhmërine e projektit.

Audienca

Ky projekt do u shërbeje të gjithë individëve të interësuar për lajmin, kryesisht gazetarëve, hulumtuesve politik dhe ekonomik, por dhe çdo përdoruesi tjetër në internet.

Adresimi

Infoarkiva mund të aksesohet aktualisht nga 3 domaine:
http://www.infoarkiv.com
http://lajme.shqiperia.com
http://www.news.al/

Armand Brahaj

Blog Archive

Friday, February 20, 2009

Projekti i Infoarkives në tërësi është i ndarë në këto module

1. Grumbullimi i informacionit dhe kërkimi

Përshkrim

Rrezultatet

Fjalëkyçe

2. Klasifikimi i informacionit

Përshkrim

Rrezultatet

Fjalëkyçe

3. Integrimi i një sistemi përdoruesish

Përshkrim

Rrezultatet

Fjalëkyçe

4. Implementimi i një strukture inteligjente për servirjen e lajmeve

Përshkrim

Rrezultatet

Fjalëkyçe

Infoarkiv.com

Qëllimi i Infoarkivës

Çfarë është Infoarkiva

Audienca

Adresimi

About Me