Etikettarkiv: bloggar

Bloggsök API

Se även Bloggsök API version 2.

En av de första webbtjänsterna jag byggde för egen räkning var Bloggz.se som är en bloggsökmotor som söker i svenska bloggar. I dagsläget så finns det runt 400 000 indexerade bloggar i dess databas. Oklart hur många av dessa som är aktiva men bloggar som ger felmeddelanden såsom 404 rensas fortlöpande bort. Även viss spam-filtrering sker. Nya bloggar upptäcks automatiskt med hjälp av ping.bloggnytt.se, en crawler samt BloggPing.

Antalet blogginlägg är i dagsläget 54 483 829 och innehåller inlägg från 2007 och framåt.

API:et nås på följande URL:

http://api.bloggz.se/api.json eller api.xml för XML-versionen. Det är fritt fram att använda API:et för icke kommersiellt bruk.

Möjliga parametrar är:

  • ?q=sökfrågan
  • Pagination med &p=1 upp till 100
  • Sortering efter datum eller relevans med hjälp av &sort=rel, standardsortering är datum. Nyast först

Skärmdump från JSON-data:


Om du använder API:et, så sätt gärna en User-Agent header med kontaktuppgifter såsom E-post.

Uppdatering: Håller på att uppdatera API:et så det kommer att fungera dåligt eller inte alls under 2-3 dgr.

Uppdatering 2: Nu fungerar det igen.

Bloggsök flyttad till molnet

Sakta men säkert så flyttar jag mina bloggprojekt till molnet och Amazon EC2 + RDS. Det rör sig först och främst om bloggsökmotorn Bloggz.se där jag även kommer att öppna upp för ett bloggsök-API med JSON + XML. Fritt för privatpersoner att använda och en mindre summa för kommersiella projekt.

Bloggz var mitt första projekt som skapades år 2007 och har sedan dess indexerat den svenska bloggosfären. Tjänster som använder sig av bloggdata är exempelvis BloggVärde, BloggNytt och BloggBilder.

Jag håller även på att komma ikapp antalet bloggar som är indexerade:

Visualisering av den svenska bloggosfären

Jag har länge haft ett projekt som bara legat och samlat damm så jag har nu tagit mig i kragen och fixat till det lite så att det åtminstone når upp till något som kan kallas för en alfaversion. Så för Er alla visualiserings och analysnördar där ute kolla in BloggAnalys.se

Ungefär så här kan det se ut för Utvbloggen.se gällande inlänkar:

blogganalys

En snabb FAQ:

Q: Är länkarna i realtid?

A: Nej inte ännu. Urvalet av länkar baseras på ca 3 miljoner svenska blogglänkar. Jag har 14 371 872 st länkar i dagsläget i en databas men pga lite problem med indexeringen av alla länkar så får 3 miljoner duga för stunden.

Q: Det ser inte ut att stämma, jag har ju fler inlänkar?!

A: Se svaret på föregående fråga

Q: Vad händer härnäst?

A: Om ett år eller så, så kanske jag släpper en ny alfaversion 0.2

Q: Varför inga trevligare färger?

A: Kommer i nästa version

Värdering av bloggar

Mitt senaste projekt gick live idag och redan så har jag fått en hel del hjälp från diverse folk på Jaiku att fixa buggar.

Projektet heter BloggVärde.se och försöker att göra en mycket grov uppskattning vad en blogg kan vara värd. Detta beräknas på ett antal faktorer såsom PageRank, antalet inlänkar osv.

Om bloggaren väljer att installera någon av de fina badges som jag tillhandahåller JavaScript-kod för, så ska värdet på bloggen automagiskt räknas upp en gång per dag (otestat).

Update: Som vanligt är jag lite för snabb för mitt eget bästa och glömde att testa att sajten fungerade med InternetExplorer, och så klart så identifierade jag ju ett antal buggar som gjorde att IE-folk inte fick sina bloggar värderade. Men det är fixat nu! >1500 bloggar värderade.